Giter Site home page Giter Site logo

raulzr / reinforcementhmm2017 Goto Github PK

View Code? Open in Web Editor NEW

This project forked from mauriciogtec/reinforcementhmm2017

0.0 2.0 0.0 4.53 MB

Página del curso de Reinforcement Learning y Hidden Markov-Chain Modelos 2017

License: MIT License

Jupyter Notebook 100.00%

reinforcementhmm2017's Introduction

Reinforcement Learning y Hidden Markov-Chain Modelos 2017

Instituto Tecnológico Autónomo de México

Primavera 2017

Temario del curso

Detalles en el temario pueden ir cambiando conforme avancemos, pero el propósito general puede en consultarse este link. Habrá cambios importantes en las primeras dos semanas de clase.

Definición de equipos

El trabajo en equipo será muy importante en este curso. Es importante que definan al comienzo del curso el equipo con el que van a trabajar. En caso de no contar con un equipo acérquense conmigo para que les asigne uno. Los grupos deben ser variados en el interior, traten de que un equipo tenga integrantes de disintos perfiles.

Para elegir su grupo, dense de alta en el siguiente link

Forma de evaluación

La evaluación tentativa será de la siguiente forma:

Criterio Porcentaje
Tareas individuales semanales 20%
Tareas grupales semanales 20%
Examen parcial 25%
Video grupal 35%
Total 100%

Presentaciones

Las presentaciones de la clase pueden consultarse en este link dentro del repositorio

Tareas individuales

Habrá tareas individuales todas las clases, los detalles de la forma de entrega se discutirán en clase. Usualmente no pasará de un reporte en una página o participación en la clase. Incluyo aquí una lista no detallada para que revisen si están al corriente

Lista de tareas individuales

  1. Traer un ejemplo de modelar un problema de aprendizaje usando RL como hicimos en el ejemplo de clase del Dominó. Identificar los elementos del problema de RL y la secuencia de aprendizaje (agente, pagos, ambiente, estados, probabilidades de transición de la naturaleza). Trear impreso o escrito a mano en una cuartilla. No usar ejemplos del libro.

Tareas grupales

Son el corazón del curso. Cada clase uno o dos grupos tendrá una tarea que involucrará programación y explicación de su material en la clase. Los detalles los dicutiré cada semana con cada grupo.

Lista de tareas grupales

  1. ¿Cuál es el papel de la teoría de Decisión Racional en el RL?

reinforcementhmm2017's People

Contributors

amaurs avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.