Giter Site home page Giter Site logo

master-data-ai's Introduction

Bienvenido al repositorio oficial del programa Master en Data Science + Agentes Inteligentes

Acá podrás encontrar recursos como Python notebooks y material adicional de consulta adicional

master-data-ai's People

Contributors

krax7 avatar cogitovsmachina avatar heckcas avatar malibb avatar alejandropimentel avatar gperaza avatar dagorik avatar juanin1114 avatar

Stargazers

 avatar Jonathan Castillo avatar Josu_Marinho avatar Gilberto Moreno avatar  avatar Omar Alonso avatar  avatar  avatar A. Fernando Mendoza-Chegui avatar compuFacilito avatar Paco Araujo avatar  avatar David Quintanilla avatar  avatar  avatar Sofía Gutiérrez avatar  avatar

Watchers

 avatar Alecs Garza avatar Juan Vazquez-Montejo avatar  avatar Tsuki avatar  avatar Armando Valdés avatar Ligorio Edwin  avatar Ruben Alvarez avatar Janine Gonzalez avatar  avatar  avatar Eider Diaz avatar  avatar  avatar  avatar A. Fernando Mendoza-Chegui avatar

master-data-ai's Issues

Sistema de evaluación para los alumnos

Objetivo:

Ideas mecanismos para evaluación continua de nuestro alumnos.

  • Generar encuestas de inicio de módulo como la elaborada por José Carlos y Kike. Alojarlas en este folder
  • Recopilar la información de esos forms y obtener nivel por alumno
  • Evaluación mediante Google Colab o Replit para evaluación individual
  • [Allan y Juan] Demo de centralización de la evaluación mediante Colab

Colabs de ejercicios básicos de redes neuronales para las sesiones finales de cada tópico dentro del módulo 3.

Como propuesta, presento dos colabs para las clases de la sesión de Cálculo para Machine Learning Pt2 y Probabilidad para Computer Scientist Pt 2.

Para el primer caso, se propone enseñar una red neuronal simple de regresión que resuelve un problema de regresión lineal para mostrar las funciones de algoritmos de optimización del descenso de gradiente y de perdida por mínimos cuadrados (donde se introduce a ella a través de la misma regresión).

Para el segundo caso, se propone enseñar una red neuronal convolucional de clasificación que resuelve un problema de lectura de números para mostrar la parte aplicativa de la función sigmoide (donde se introduce a ella a través de la función de logística) para el uso de capas ocultas.

LIGA: https://drive.google.com/drive/folders/1Du1ICbWq7jZeDFzw3c9qDAL074o7UHti?usp=sharing

Propuesta - Animaciones Manim: Kata Fundamentos

En relación a la dificultad de aprendizaje en las matemáticas, en general del alumnado, donde muchos de ellos provienen de distintas disciplinas Físico - Matemático ajenas a las Ciencias e Ingenierías como las disciplinas Sociales y Artísticas, se propone una serie de animaciones con la herramienta de Manim.

Para mejorar de forma genérica la experiencia de aprendizaje visual, Manim se enfoca al dinamismo del entorno proyectado a través de letras, fórmulas, gráficos, etc, haciendo uso de la herramienta ya conocidas como LaTeX, haciendo mas profesional las animaciones.

Dicho lo anterior, en la siguiente liga, se muestra una primera fase de lo aprendido de esta herramienta hasta la fecha, realizando únicamente animaciones con letras, y a su vez, una fracción de 3 vídeos para poder apreciar TODO lo que se puede lograr con esta herramienta para este módulo.

LIGA - Drive:
https://drive.google.com/drive/folders/1aT9VGaFaRJF5EYyfBYWql4BC8KKBwyOV?usp=sharing

Propuesta - Challenge Semana 2: Cálculo para Machine Learning

En relación al tópico de Regresión Lineal de los Métodos Numéricos, se muestra en clase, un Colab aplicativo a este tema denominado "Say hello to the 'Hello, World' of ML".

Para complementar lo aprendido al colab antes mencionado, se propone el siguiente colab como un challenge para que los alumnos y alumnas, apliquen lo aprendido en esta práctica.

LIGA - Challenge:
https://drive.google.com/file/d/1eJmIO2tlNasm8hMpw5xLlAEhie92uCBz/view?usp=sharing

LIGA - Challenge Solucionado:
https://drive.google.com/file/d/1WCiCWW6GduolqnoCUHGZmhIiKn6tbVKY/view?usp=sharing

Mejoras a la clase de Power BI

  • Añadir instrucciones de parte teórico práctica de la clase:

    • Cargar una base de datos de viajes
    • Los ale�nos dicen qué preguntas quieren responder
    • Mostrarles qué elementos tiene Power BI
    • Mostrarles cómo obtener una determinada gráfica
    • Pueden cargar sus propias bases de datos
  • Subir reporta de ejemplo generado con Power BI: Para la clase de Data Visualization con Power BI se realizaron algunas visualizaciones con los alumnos en clase. Subir este reporte como material de apoyo para el sensei que de esta clase en el futuro.

Revisión de contenido en cada carpeta

  • Revisar que cada notebook y challenge tenga su versión en notebook (.ipynb) y como archivo Python (.py)
  • Checar que las soluciones de cada challenge estén en Google Drive
  • Actualizar los links en las presentaciones para que lleven a Google Drive

Mejoras para la clase 1: Introducción a la visualización de datos

Objetivo:

  • Reducir la presentación focalizando las partes más importantes.

Progreso alcanzado (28/06/2023):

  • Se redujo una gran cantidad de diapositivas que solo hacían ruido, sin embargo, la presentación sigue siendo demasiado larga y me parece que no se ha alcanzado el objetivo a la fecha.

Arreglar los problemas de la clase 3

  • Hacer una versión más corta del ejemplo de Cats VS Dogs (incluir el código para probar imágenes y el de ver el performance del modelo)
  • Subir los ejercicios que hemos hecho a una rama del repo
  • Apuntar el link del ejemplo de la clase 3 al archivo de Python que creé

Roadmap del contenido de las clases

Etapas:

  • Contenido organizado en Google Drive
  • Lecturas en Campus con breve resumen del tema y links a presentaciones y colabs
  • Migrar contenido de presentaciones a lecturas
    • Generar con base en plantilla y/o formato de la lectura
    • Almacenar imágenes y GIFs en storage de GCP
  • Migrar colabs teóricos a replits dentro de Campus
  • Migrar colabs de challenge a katas dentro de Campus

Mejoras para la clase 2

  • DataCamp para hacer visualización
  • Divide y vencerás
  • Hacer refactor de la clase 2 a algo más orientado a contar una historia con datos

Mejorar material de clase

  • Agregar presentación/challenge a las sesiones que lo requieran.

  • Agregar contenido a las presentaciones.

Obtener data de encuestas de zoom

Encuestas comprensión del tema a través de Zoom, podría analizarse conjuntamente con la encuesta del primer día, para evaluar una evolución. Posibilidad de automatizar la recoleccion de estos datos.

Revisar la clase 4

Challenge modificado para utilizar directamente Augmentation.
Añadir uso de nuevas imagenes para describir convoluciones.

Manejar más dinámica teórica matemática dentro del contenido de la clase para los temas vistos dentro del módulo 3.

Como propuesta, presento unas pizarras para las clases de la sesión de Cálculo para Machine Learning y Probabilidad para Computer Scientist. Así como los apuntes correspondientes a esas clases.

Sin embargo, para aquellos que no tengan pizarra electrónica, pueden ocupar algún otro recurso. El punto es resaltar la parte teórica dinámica.

Así que el contenido de los Slides se volverá mas breve. Y también he editado su diseño.

LIGA: https://drive.google.com/drive/folders/1moZXJacP4XmXts4A6OQUgoQokjJV9nJq?usp=sharing

Propuesta - Cambio de contenido en las presentaciones de la Semana 1 de Kata Fundamentos.

En relación a la dificultad de aprendizaje en las matemáticas, en general del alumnado, se habían propuesto anteriormente, dos alternativas para la mejora de la didáctica, el cuál era, el uso de una pizarra electrónica y el uso de animaciones con la herramienta Manim, para solucionar lo antes mencionado.

En busca de homogeneizar el contenido, se propone las modificaciones de las presentaciones y cambio de orden, donde el contenido, es lo que había en las pizarras, pero con el uso de animaciones de la presentación, sintetizando lo escrito en pizarra y añadiendo pequeños vídeos realizados en Manim, se busca obtener un contenido limpio, formal y dinámico.

Clase 1: Introducción al Cálculo Monovariable para Engineers - Scientist.

LIGA: https://docs.google.com/presentation/d/1R7VNXZaEaqGKz4KLjMEaJZ7uS6bfjS1mrPopqbicGbI/edit?usp=sharing

Clase 2: Introducción al Álgebra Lineal para Deep Learning.

LIGA: https://docs.google.com/presentation/d/163c_ABsudX5-VkDrz2gJlLtGCxkI7DKgy1aNhU5eMCE/edit?usp=sharing

Clase 3: Introducción al Cálculo Multivariabe para Machine Learning.

LIGA: https://docs.google.com/presentation/d/1AC6hDbtvoQPsi9gRKdExsNqsYHEgA2gZI9LtwkgMoxo/edit?usp=sharing

Refactor clase 2: revisar la relación entre el notebook de TFDatasets y el challenge

Progreso alcanzado (01/02/2023):

  • Se añadieron diapositivas para explicar los fundamentos y partes de los clasificadores binarios y multiclase, tomando como base las redes neuronales.
  • Se resolvió el ejercicio de categoría 2 junto con los alumnos en clase.
  • Se les dejó el challenge de categoría 2 para desarrollar un clasificador multiclase para el dataset Fashion MNIST.
  • Se ocultó el notebook de TF Datasets dado que ya no es relvante.
  • Se actualizó el link del challenge en la presentación.

Añadir elementos de apoyo a las clases de Series de Tiempo

Cambios sugeridos:

  • Indicar de forma clara la diferencia entre batch y window. Especificando que dentro de un batch puede haber varias windows y no viceversa.
  • Añadir más imagénes o elementos de apoyo para el preprocesamiento de la serie de tiempo, haciendo más claro que hace cada función dentro de la función "windowed_dataset"

Cambiar la redacción de preguntas del proyecto del módulo 2

Hola sensei, tengo una duda respecto al proyecto, una de las tareas es mostrar: Deporte y país con mayor número de atletas no rankeados que entraron en la lista de atletas mejor pagados, no entiendo bien a qué se refiere con eso de "no rankeados"

El objetivo es ver cuáles atletas no tenían ranking en el año pasado, es decir, que en la columna de Previous Year Rank, o su ranking era mayor a 100 o no tenga valor para esa fila.

también en la siguiente si pudieras darme más detalles de que debo obtener, no entendí bien la redacción: País con mayor número de deportes con atletas en el dataset

Respecto a esta pregunta, la redacción más bien sería: obtener el número de atletas por deporte en cada país e indicar qué país tiene más atletas en todos los deportes. Por ejemplo si USA y México tienen ambos 50 atletas en fútbol, pero USA también tiene atletas en basketball y México no, te quedas con USA

Subir de nivel de ranking significa mejorar en el ranking

Comparar 2010 VS 2020 únicamente y no los años intermedios

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.