czammar / mno_finalproject Goto Github PK

View Code? Open in Web Editor NEW

0.0 4.0 4.0 4.26 MB

An implementation on GPU's of a Solver for Markowitz's Model

License: Other

Jupyter Notebook 97.16% Python 2.77% Dockerfile 0.06%

gpu-computing cupy python markowitz-portfolio finance docker optimization karush-kuhn-tucker lagrangian

mno_finalproject's Introduction

Implementación del modelo Markowitz

1. Descripción del problema

En el contexto de finanzas, un problema relevante es definir estrategias que permitan a los inversionistas diversificar sus inversiones con el objetivo de minimizar el riesgo de su capital. Típicamente, esto corresponde con que un inversionista tiene interés en un conjunto definido de activos, denominado portafolio, sobre el que debe tomar una decisión sobre cómo adquirir o vender acciones con la idea obtener un determinado rendimiento $r > 0$ . Sin embargo, es deseable que la elección considere reducir el riesgo inherente al mercado de inversiones, los que se traduce en obtener el portafolio de mínima varianza, que en otras palabras significa obtener el portafolio de menor riesgo para inversionistas aversos al riesgo, donde se espera obtener las ponderaciones o proporciones que el inversionista debe invertir en las acciones evaluadas en un vector de todo el conjunto de acciones.

En términos matemáticos y considerando la consabida teoría financiera, lo anterior equivale a una formulación denominada Modelo de Markowitz, propuesta por el economista Harry Markowitz, a través de la cual se trata de minimizar la norma inducida por la matriz de covarianza $\Sigma$ de los activos con referencia a los proporciones de cómo se deben elegir las acciones que integran un portafolio específico (pesos), sujeto a que se obtenga un rendimiento acorde a la expectativa del inversionista. A estas proporciones las denotaremos $w_i$ , que finalmente es un vector de tamaño $n \times 1$ , donde $n \times 1$ es el número de acciones a analizar.

Ello constituye un problema de optimización sujeto a restricciones (lineales) de igualdad, que se puede expresar en los términos siguientes:

$\min_{w} \frac{1}{2}w^T\Sigma w$

Sujeto a las restricciones lineales:

El rendimiento que vislumbra el inversionista: $w^T\mu=r$
Los pesos de los activos se encuentran distribuidos congruentemente sobre el portafolio; $w^T1_{n}=1$

Resolver este problema nos permite encontrar cómo se integra el portafolio que dado un rendimiento $r > 0$ esperado del inversionista, tenga varianza mínima varianza, el cual corresponde con el perfil de los inversionistas que son aversos al riesgo. Es decir, nos permite conocer los pesos de un portafolio que, de acuerdo a una frontera de posibilidades de alocación y un rendimiento esperado, se localiza en la frontera superior entre todos los portafolios de inversión según su varianza, tal como se aprecia en la curva de la imagen:

Es así que el propósito de este proyecto será desarrollar estrategias que permitan resolver el modelo de Markowitz empleando herramientas de optimización y cómputo distribuido, particularmente aprovechando la disponibilidad de tarjetas GPU, así como el framework CuPy de Python para este tipo de hardware. En adición, en este proyecto se busca echar mano de herramientas de computo en la nube y ambientes de virtualización, concretamente AWS y Docker.

A continuación se describe la estructura del presente repositorio, así como los algoritmos planteados para dar solución al modelo en cuestión.

2. Consideraciones metodológicas

2.1 Portafolio de activos, sus rendimientos y pesos

Tras analizar las fuentes de datos disponibles, se estimó pertinente considerar precios históricos de las 50 empresas, que destacan en sus correspondientes industrias, seleccionándose las que tienen mayor participación en el mercado (al momento de realizar este proyecto). En concreto, se consideraron las empresas:

Código Bursátil	Nombre de la empresa	Industria
XOM	Exxon Mobil Corporation	Energía
CVX	Chevron Corporation	Energía
RDSA.AS	Royal Dutch Shell	Energía
RELIANCE.NS	Reliance Industries Limited	Energía
COP	Conoco Phillips	Energía
AMT	American Tower Corporation	Inmobiliaria
CCI	Crown Castle International Corp	Inmobiliaria
PLD	Prologis, Inc	Inmobiliaria
DLR	Digital Realty Trust, Inc	Inmobiliaria
0688.HK	China Overseas Land & Investment Limited	Inmobiliaria
LIN	Linde plc	Materiales
BHP.AX	BHP Group	Materiales
RIO.L	Rio tinto Group	Materiales
AI.PA	L'Air Liquide S.A	Materiales
2010.SR	Saudi Basic Industries	Materiales
LMT	Lockhedd Martin Corporation	Materiales Industriales
HON	Honeywell International Inc	Materiales Industriales
UPS	United Parcel Service. Inc	Materiales Industriales
UNP	Union Pacific Corporation	Materiales Industriales
RTX	Raytheon Technologies Corporation	Materiales Industriales
AMZN	Amazon.com, Inc	Consumo Discrecional
BABA	Alibaba Group Holding Limited	Consumo Discrecional
HD	The Home Depot, Inc	Consumo Discrecional
MC.PA	LVMH Louis Vuitton, Société Europèenne	Consumo Discrecional
7203.T	Toyota Motor Corporation	Consumo Discrecional
WMT	Walmart Inc	Retail
PG	PThe Procter & Gamble Company	Retail
KO	The Coco-Cola Company	Retail
PEP	PesiCo Inc	Retail
NSRGY	Nestlé S.A	Retail
JNJ	ohnson & Johnson	Cuidado Personal
UNH	UnitedHealth Group Incorporated	Cuidado Personal
PFE	Pfizer Inc	Cuidado Personal
MRK	Merk & Co., Inc	Cuidado Personal
RHHBY	Roche Holding AG	Cuidado Personal
VTI	Vanguard Total Stock Market ETF	Financiera
VOO	Vanguard S&P 500 ETF	Financiera
BRK-A	Bekshire Hathaway Inc	Financiera
1398.HK	Industrial and Commercial Bank of China Limited	Financiera
JPM	JPMorgan Chase & Co	Financiera
MSTF	Microsoft Corporation	Tecnología
APPL	Apple Inc	Tecnología
V	Visa Inc	Tecnología
005930.KS	Samsung Electronics	Tecnología
MA	Mastercard Incorporated	Tecnología
GOOG.L	Alphabet Inc	Comunicación
FB	Facebook, Inc	Comunicación
0700.HK	Tencent Holdings Limited	Comunicación
VS	Verizon Communications Inc	Comunicación
T	AT&T Inc	Comunicación

Para considerar el comportamiento histórico de las acciones de dichas empresas, se consideró la información financiera de los últimos 5 años para hacer el análisis (esto es, desde el 1 de enero de 2015 al 30 de abril de 2020). Dicha información se obtuvo del API de Python que permite obtener datos desde Yahoo Finance, considerándose como valores de referencia de los activos a los precios diarios Closed Price (es decir, los precios al cierre de la bolsa).
En complemento, para el cálculo de los rendimientos esperados de cada una de las empresas, se estímó pertinente evaluarlo a través de los precios de cierre diarios a partir de la fórmula del rendimiento instantáneo en escala logarítimica:

$r=log\tfrac{P_t}{P_{t-1}}$

Ello para evitar problemas numéricos debidos a la escala de los rendimientos.

En lo tocante a cómo se debe determinar el vector de pesos asociado al portafolio de activos $W$ , se consideró relevante pensarlos como una proporción, lo que equivale a que la suma de la entradas sea igual a 1.
Por otro lado, el rendimiento esperado del portafolio se obtiene haciendo el producto punto del vector de rendimientos medios de los activos en el periodo en cuestión y los pesos del portafolio elegido, cumpliendo los portafolios factibles la restricción $r=w^t \mu$ . Nota: estos pesos pueden ser negativos porque asumimos que pueden existir ventas en corto (short sale), lo cual implica que los inversores podrían tener una ganancia si tienen algún contrato de préstamo de títulos accionarios, los cuales deben devolver a una fecha futura y podrían devolverlos a un precio menor.
Finalmente, la matriz de varianzas y covarianzas de los portafolios se calcula como las correspondientes matrices de varianzas y covarianzas de rendimientos de las acciones en el periodo de los últimos 5 años para hacer el análisis (1 de enero de 2015 al 30 de abril de 2020).

2.2 Solver basado en multiplicadores de Lagrange

En este caso, el problema de minimización se aborda calculando la solución analítica del problema de optimización recién descrito, empleando la expresión del Lagrangiano del problema de optimización considerando las respectivas restricciones, aprovechando que la matriz de covarianzas es simétrica y definida positiva.

Solución: Aplicar el método de multiplicadores de Lagrange al problema de optimización convexa (minimización) sujeto a restricciones lineales del Modelo de Markowitz:

Definimos el Lagrangiano del problema:

$L(w,\lambda_{1}, \lambda_{2}) = \frac{1}{2}w^T\Sigma w + \lambda_{1}(r-w^T\mu) + \lambda_{2}(1-w^T1_{n})$

En consecuencia, las condiciones de primer orden que debe satisfacer el punto factible del problema, quedan en función de lo siguiente:
Resolviendo para w en términos de $\lambda_{1}, \lambda_{2}$

$w_0 = \lambda_1 \Sigma^{-1} \mu + \lambda_2 \Sigma^{-1} 1_n$

Por otro lado, resolviendo para $\lambda_{1}, \lambda_{2}$ y sustituyendo para w se sigue:
- $r = w^T 1_{n} = \lambda_{1}(\mu^T\Sigma^{-1} \mu ) + \lambda_{2}(\mu^T\Sigma^{-1}1_{n})$
- $1 = w^T 1_{n} = \lambda_{1}(\mu^T\Sigma^{-1}1_{n}) + \lambda_{2}(1^T_{n}\Sigma^{-1}1_{n})$

Es sencillo ver que las ecuaciones previas pueden ser resueltas de manera analítica al resolver el sistema lineal:

En donde:

De lo anterior y tras un poco de álgebra, se puede probrar que la solución del sistema de Markowitz se puede encontrar como sigue:

Formamos al vector $w^{*}=w_{0}\cdot (\Sigma^{-1}\cdot \mu)+w_{1}\cdot (\Sigma^{-1}\cdot 1)$

Donde los vectores involucrados tienen las siguientes expresiones:
$w_{0}=\frac{1}{\Delta }(\hat{r}\cdot B-C)$
$w_{1}=\frac{1}{\Delta }(A-C\cdot \hat{r})$
Donde :

2.2.1 Diagrama de flujo del solver basado en multiplicadores de Lagrange

La implementación de este método se dividió en una serie de etapas:

Etapa I: se refiere a la obtención de los datos de portafolios a analizar, junto con su limpieza y transformación para posteriores análisis,
Etapa II: corresponde a la estimación de tres elementos base del modelo, a saber el retorno esperado de los activos, el valor medio esperado de los mismos junto con la matriz de covarianzas asociada.
Etapa III: relativa a la aproximación de la composición de los pesos que permite integrar el portafolio de inversión que posee mínima varianza, el cual es para aquellos inversionistas que son aversos al riesgo.

El proceso comentado, se resume a continuación:

2.3 Solver basado en el método de Newton con restricciones de igualdad

Es relevante destacar que en la teoría de optimización, es posible aproximar las soluciones de un problema de optimización sujeto a restricciones lineales, si se cumplen ciertos supuestos:

La función objetivo es convexa y dos veces continuamente diferenciable,
El número de restricciones es menor al número de variables y tales restricciones son independientes,

En tal caso, es posible probar que por condiciones necesarias y suficientes de Karush-Kuhn-Tucker (también conocidas como las condiciones KKT o Kuhn-Tucker), es posible observar que la solución del problema de minimización equivale a resolver un problema denominado "dual". Concretamente se sabe que, existe una equivalencia lógica entre las siguientes proposiciones:

Nota: típicamente las ecuaciones involucradas se denominan a través de la siguiente terminología:

Ecuaciones de factibilidad primal: $A x^* =b$
Ecuaciones de factibilidad dual: $\nabla f(x^)+ A^T \nu^=0$

Aprovechando lo anterior, se puede extender el método de Newton para resolver las ecuaciones de KKT, de manera que pueda aproximarse la solución del problema de optimización original; esto se basa en los siguientes hechos:

a) El punto inicial debe ser factible, es decir debe estar en el dominio de la función objetivo y satisfacer las restricciones lineales.
b) El paso de Newton se debe modificar para que satisfaga las conducentes restricciones.
c) Lo anterior se puede lograr aproximando la función objetivo, considerando su expansión derivada del teorema de Taylor hasta el término de segundo orden, $\hat{f}(x+ \nu^*)$ , de modo que puede considerarse un nuevo problema de optimización dado por $\min \hat{f}(x+ \nu^*)$ sujeto a $\A(x+ \nu^*)=b$ .
d) El paso de Newton en un punto $x$ , se define como la solución única al problema de minimización cuadrática previo con matriz KKT no singular; el cual se denota específicamente como $\Delta x_t$ y se encuentra en términos de las ecuaciones matriciales:

$\begin{bmatrix} \nabla^2 f(x) & A^T \ A & 0 \end{bmatrix}$ $= \begin{bmatrix} \Delta x_t \ W \end{bmatrix}$ $= \begin{bmatrix} -\nabla f(x) \ 0 \end{bmatrix}$

En este caso w es la variable óptima dual asociada.

Notas:

En este caso, las implementaciones típicamente echan mano de una cantidad conocida como decremento de Newton $\lambda(x)=(\Delta {x_n}_t^T \nabla^2 f(x) \Delta {x_n}_t)^{1/2}$ , la cual guarda información útil en las búsquedas de direcciones factibles, como las búsquedas de línea y que puede emplearse como criterio de paro en procesos iterativos, como en el que nos ocupa,

Con todos los elementos anteriores, nos encontramos en condiciones de describir el Algortimo del método de Newton para un problema de optimización con restricciones de igualdad:

Repetir hasta convergencia:
- 1. Calcular el paso y decremento de Newton, ${x_n}_t^T, \lambda(x)$
- 1. Revisar criterio de paro: terminar método si $\frac{ \lambda(x)}{2} \leq \epsilon$ ,
- 1. Búsqueda de línea: elegir el tamaño de paso por backtracking line search,
- 1. Actualizar: $x+t \Delta {x_n}_t$

2.3.1 Diagrama de flujo del solver basado en el método de Newton con restricciones de igualdad

La implementación de este método se dividió en una serie de etapas:

Etapa I: se refiere a la obtención de los datos de portafolios a analizar, junto con su limpieza y transformación para posteriores análisis,
Etapa II: corresponde a la estimación de tres elementos base del modelo, a saber el retorno esperado de los activos, el valor medio esperado de los mismo junto con la matriz de covarianzas asociada.
Etapa III: relativa a la aproximación de la solución del problema original de optimización con el algortimo recién descrito, lo que da la posibilidad de aproximar los pesos que permiten integrar el portafolio de inversión que posee mínima varianza, el cual es para aquellos inversionistas que son aversos al riesgo. En este caso, se obtiene primero una propuesta de punto factible del problema de Markowitz (esencialmente, obtenida resolviendo las ecuaciones normales asociadas a las restricciones lineales) la cual alimenta al solver del problema de optimización con restricciones que se basa en el método de Newton para aproximar una solución del problema de optimización, siguiendo las consideraciones expuestas en la sección previa.

El proceso comentado, se resumen a continuación:

3. Organización del equipo

Para el desarrollo del proyecto, los integrantes se dividieron principalmente en dos grupos; el Grupo de programación encargado de la implementación de los métodos y algoritmos; y el Grupo de revisión encargado de probar y reportar los métodos del primer grupo. Ambos grupos fueron coordinados por el Project Manager con ayuda de un Asistente.

La división anterior se puede resumir mediante la siguiente tabla:

Fase 1: Implementación empleando método de Lagrange

#	Rol	Persona
1	Grupo de programación	Bruno
2	Grupo de programación	Itzel
3	Grupo de programación	César
4	Grupo de revisión	León
5	Grupo de revisión/Asistente de PM	Danahi
6	Project Manager	Yalidt

Fase 2: Implementación usando método de Newton

#	Rol	Persona
1	Grupo de programación	Bruno
2	Grupo de programación	Itzel
3	Grupo de programación	César
4	Grupo de revisión/ Ayudante de programación	León
5	Grupo de revisión/ Contexto Teórico	Yalidt
6	Project Manager	Danahi

4. Flujo de trabajo en Github

Para facilitar el desarrollo de forma colaborativa entre los equipos de programación y revisión, se siguió un Github flow, que consistió, en líneas generales, en la creación de ramas para resolver un issue específico, para solicitar la revisión del PM a través de un Pull request, y su posterior aprobación para unir los cambios hacia la rama master.

Fuente: Notas del curso Programación para Ciencia de Datos de la Maestría en Ciencia de Datos del ITAM (2019). Véase https://github.com/ITAM-DS/programming-for-data-science-2019/blob/master/handbook.pdf

Cabe destacar que una vez solucionado el issue correspondiente, se borró la rama asociada para facilitar el entendimiento y administración del proyecto.

5. Requerimientos de infraestructura

A efecto de que los equipos de programación y revisión tuvieran un entorno común de trabajo para el desarrollo del proyecto, se empleó Google Colab. Una vez desarrollados los códigos, se ejecutaron los mismos en una instancia de AWS. Para ello se eligió la máquina Deep Learning AMI (Ubuntu 18.04) Version 28.1, pues tiene una tarjeta gráfica NVIDIA. Las características de la instancia fueron:

Familia GPU
Tipo p2.xlarge
4 vCPUs

Para poder utilizar CuPy en la instancia de AWS, se construyó una imagen de Docker con el Dockerfile correspondiente. En esta imagen se instala CuPy, los paquetes necesarios para la ejecución de la implementación del modelo de Markowitz, así como otros requerimientos de software (jupyter, awscli, entre otros). Finalmente se levanta un contenedor a partir de esta imagen, e ingresando a jupyterlab se obtiene el entorno para poder ejecutar los códigos desarrollados.

Los pasos a seguir para levantar la instancia de AWS, construir la imagen de Docker y levantar el contenedor, además de los detalles de configuración se encuentran en la carpeta de infrastructure.

6. Organización del proyecto

La organización del proyecto se realizó a través una serie de carpetas, entre las cuales destacan:

notebooks

Esta carpeta se subdivide en dos, Programación donde se realizan las implementaciones en python para los solvers de multiplicador de Lagrange y método de Newton, se encuentran notebooks por separado que forman parte de los diagramas de flujo 2.2.1 y 2.3.1 así como una carpeta solver donde se encuentran los archivos .py que implementan los solvers. Por otra parate la carpeta Revisión contiene notebooks separados de la revisión de código de la carpeta anterior.

infrastructure

Carpeta que contiene el Dockerfile y donde se explican los pasos a seguir para levantar una instancia en AWS con las características necesarias, en donde se pueden ejecutar los códigos desarrollados para la implementación del modelo Markowitz en paralelo.

results

Carpeta donde se desarrolla el reporte ejecutivo de resultados.

En complemento, se presenta una versión esquemática de la organización de repositorio del proyecto:

    .
    ├── LICENSE
    ├── README.md
    ├── burning_bus
    ├── conf
    │   ├── base
    │   └── local
    ├── docs
    ├── images
    ├── infrastructure        <- Carpeta de infraestructura AWS y Docker
    │   ├── Dockerfile
    │   ├── Readme.md
    │   └── Solver_AWS.ipynb
    ├── notebooks
    │   ├── Programacion      <- Carpeta de reportes de programacion
    │   └── Revision          <- Carpeta de reportes de revision
    ├── references
    │   ├── Minutas
    │   └── algorithms_for_ceco.py
    ├── requirements-dev.txt
    ├── requirements.txt
    ├── results                <- Carpeta de reporte ejecutivo de resultados
    │   └── ReporteResultados.ipynb
    ├── setup.py
    ├── sql
    └── src
        ├── __init__.py
        ├── etl
        ├── pipeline
        └── utils

    18 directories, 17 files

Referencias

Bodie, Z., Kane, A., & Marcus, A. J. (2011). Investments. New York: McGraw-Hill/Irwin. https://www.niceideas.ch/airxcell_doc/doc/userGuide/portfolio_optimTheory.html
Topics in mathematics with applications in finance, MIT 18.S096, Lecture 14 Portfolio Theory, Fall 2013, Dr. Kempthorne, https://ocw.mit.edu/courses/mathematics/18-s096-topics-in-mathematics-with-applications-in-finance-fall-2013/lecture-notes/MIT18_S096F13_lecnote14.pdf
Notas del curso de Métodos Numéricos y Optimización, ITAM, Moreno Palacios Erick, 2020 https://drive.google.com/file/d/12L7rOCgW7NEKl_xJbIGZz05XXVrOaPBz/view

mno_finalproject's People

Contributors

Watchers

Forkers

izmfc yalidt millan13 rafaelnber

mno_finalproject's Issues

3.d Formación de vectores auxiliares

Formación de vectores auxiliares apartado 3d del diagrama de flujo que esta en el readme

Actualización de reporte

Adaptar el reporte a la fase dos del proyecto
Incluyendo el tema de restricciones basado en la siguiente nota:
https://drive.google.com/file/d/12L7rOCgW7NEKl_xJbIGZz05XXVrOaPBz/view

1.a Extracción de los datos desde Yahoo Finance

Crear una función que extraiga los precios de las acciones de 50 empresas, para los últimos 5 años:
Industria Energy- SASE:2222, NYSE:XOM, NYSE:CVX,ENXTAM:RDSA, NSEI:RELIANCE
Industria Real Estate -NYSE:AMT, NYSE:CCI, NYSE:PLD, NasdaqGS:QEIX, NYSE:DLR
Industria Materiales- NYSE:LIN, ASX:BHP, LSE:RIO, ENXTPA:AI, SASE:2010
Industrials Company- NSYE:LMT, NYSE:UNIP, NYSE:HON, NYSE:RTX, NYSE:UPS
Industria Discretionary consumer -NasdaqGS:AMZN,NYSE:BABA, NYSE:HD,ENXTPA:MC, TSE:7203
Industria Staples- NYSE:WMT, SWX:NESN, NYSE:PG, NYSE:KO, NasdaqGS:PEP
Industria Health Care- NYSE:JNJ, SWX:ROG, NYSE:UNH,NYSE:PFE, SYSE:MRK
Industria Financials- ARCA:VTI, ARCA:VOO, NYSE:BRK.A, NYSE:JPM, SEHK:1398
Industria Information Technology :NasdaqGS:MSTF, NasdaqGS:APPL, NYSE:V, KOSE:A005930, NYSE:MA
Industria Communication - NasdaqGS:GOOG.L, NasdaqGS:FB, SEHK:700,NYSE:VZ, NYSE:T

Unión de programación etapa 1 a etapa 3

Deben realizar un sólo notebook juntando las funciones que ya trabajaron por separado, para empezar a probar si funciona el algoritmo completo.

Revision Etapa 1 - Extracción de los datos, limpieza y transformación

Se debe revisar el notebook "1ab_extraer_datos_stock.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:

Hacer un notebook en la carpeta de revisón con un nombre apropiado a lo que estas revisando
Revisar documentación de las funciones, en caso de que no este bien documentado levantas el issue
Explicar algo de teoría económica de lo que se esta realizando, esto nos va a servir para el reporte final.
Revisar que la limpieza y transformación sea razonable.

Diagrama de flujo del algoritmo

Realizar un diagrama de flujo del algoritmo para comenzar la programación

2b. Corrección en conversión de tasa anual

Bruno, estuve revisando y financieramente la conversión debe ser asi : tasa_diaria*264
nadamas eso :)

Funciones auxiliares para solver con método de Newton

Creación de funciones auxiliares:

line_search_by_backtracking
line_search_for_residual_by_backtracking
compute_error
norm_residual
Basarse en los siguientes scripts:
https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/e6773d6e62f12e34a084a30d47760b66ed5bbc64/temas/IV.optimizacion_convexa_y_machine_learning/algoritmos/Python/line_search.py#L3
https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/e6773d6e62f12e34a084a30d47760b66ed5bbc64/temas/IV.optimizacion_convexa_y_machine_learning/algoritmos/Python/utils.py#L28

Seccion 3d cambios en documentación

Sugerencia:

argm entrada faltante:

r (cupy array, escalar): escalar que denota el retorno esperado por el inversionista

argm salida:

w_0 (cupy array, escalar): escalar dada por $w_0 = \frac{1}{\Delta} (B \Sigma^{-1} \hat{\mu}- C\Sigma^{-1} 1) $
w_1 (cupy array, escalar): escalar dado por $w_1 = \frac{1}{\Delta} (C \Sigma^{-1} \hat{\mu}- A\Sigma^{-1} 1)$

Diagrama de Flujo

Creación de diagrama de Flujo para iniciar la Fase 2 del proyecto, basado en:

https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/IV.optimizacion_convexa_y_machine_learning/algoritmos/Python/algorithms_for_ceco.py

Formación de script

Con base al notebook 4_Solver.ipynb crear un script llamado solver.py relacionado.

Revisión 3.c Etapa III

Se debe revisar el notebook "3c_formacion_delta.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:

Resultados revisión Etapa 1

Hola, Itzel

Ya esta la revisión de tu código en la carpeta de Revisión/revision_extraer_datos_test.ipynb
Los comentarios del equipo de revisión en general son los siguientes:
1)Las funciones no están documentadas y sugieren que se ponga un ejemplo de lo que realiza tu algoritmo en la documentación.
2)Los parámetros de entrada en el rango de fechas(inicio y final) de extracción comentan que debería ser un parámetro general para que se puede extraer cualquier rango de fechas.

Puedes encontrar la información detallada en el notebook.

3.e Solución del sistema markowitz

Realizar la solución del sistema contemplando las siguientes restricciones:
1)Suma de Wi's =1
2)Los pesos Wi's no sean negativos

Revisión solver Newton

Revisar el notebook: 5_Solver_sistema_iterativo.ipynb
Escribir resultados de revisión en la carpeta Revisión con el título: 2Revision_SolverNewton

DL: Miércoles

Realizar funciones de rendimiento esperado y matriz var-cov

Se deben realizar las funciones para calcular los rendimientos esperados y la matriz de varianzas y covarianzas.

Revisión Punto factible

Revisar el siguiente notebook Feasible_Markowitz.ipynb que se encuentra en programación

Hacer el notebook de revisión en la carpeta de Revision con el nombre 2Revision_PuntoFact

Notar que en efecto la suma de los pesos sea igual a 1 y cumpla con las restricciones.

Revisar la 2.a de la etapa II

Se debe revisar el notebook "2a_FuncionRetornoEsperado.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:

1)Hacer un notebook en la carpeta de revisión con un nombre apropiado a lo que estas revisando.
2)Revisar documentación de las funciones, en caso de que no este bien documentado levantas el issue.
3)Revisar que el calculo de la tasa tenga la conversión correcta r_diario*264, ahi explicas que se multiplica por 264 porque son los días en los que la bolsa cotiza.
4)Probar con numeros aleatorios en varias corridas que se este calculando correctamente.
5)Explicar algo de teoría económica de lo que se esta realizando, esto nos va a servir para el reporte final.

2c. Retorno esperado r

Es calcular el retorno esperado de los rendimientos

1.b Limpieza y 1c.Transformación

Una vez extraídos los datos se necesita revisar si hay datos faltantes, que estén en la misma frecuencia de tiempo ( mismo numero de columnas para todas las acciones), en caso de que haya datos faltantes podemos imputar con la moda del precio para esa acción.

Índices

Realizar índices del readme y revisar su organización

DL:Miércoles

Gráficas pt1

Realizar las siguiente gráficas con el solver implementado en la Fase 1, es decir la carpeta solver dentro de la carpeta de programación:

Series de tiempo de rendimientos de dos sectores (observar ReporteResultados_v3.ipynb Sección 2.2)
Con una acción en específico observar como cambia el rendimiento (observar ReporteResultados_v3.ipynb Sección 3.4)

Interpretar cada gráfica
Código en:
En el notebook ya existente en results: ReporteResultados_v2.2.ipynb
Imagenes de gráficas e interpretación en: ReporteResultados_v3.ipynb

Formación de valores A,B,C

Programar los valores de A, B y C de la parte 3b del diagrama de flujo del readme

Revisión Funciones Simbólicas

Revisión del siguiente notebook: symbolic_gradient_Hessian.ipynb que se encuentra en la carpeta de programación.
El tema es el siguiente: Funciones gradiente y Hessiana simbólicas
Basados en el siguiente link:
https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/c1e0eea80579250b23d11921caa5b3ec8d3ab43b/temas/IV.optimizacion_convexa_y_machine_learning/algoritmos/Python/numerical_differentiation.py#L5

Crear el notebook 2Revision_Symbolic_GH en la carpeta de Revisión
En dado caso que haya que corregir algo crear el issue correspondiente

Primera versión de Reporte

Comenzar el reporte en un notebook con un nombre adecuado en la carpeta results con información teórica y avances hasta el momento

3a. Formación de vectores con matriz de covarianzas

Realizar el apartado 3a del diagrama de flujo del readme.

Revisión 3.d Etapa III

Se debe revisar el notebook "3a_formacion_matrices.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:

1)Hacer un notebook en la carpeta de revisión con un nombre apropiado a lo que estas revisando.
2)Revisar documentación de las funciones, en caso de que no este bien documentado levantas el issue.
3)Revisar que la formación de vectores auxiliares sea correcta con ayuda de los otros parámetros definidos en funciones.
4)Si es posible agregar algun comentario de la teoria matemática desarrollada, esto nos puede servir para el reporte final

Revisar la 2.b y 2.c de la etapa II

Se debe revisar el notebook "2b_c_Valor_medio_y_covarianzas.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:

1)Hacer un notebook en la carpeta de revisión con un nombre apropiado a lo que estas revisando.
2)Revisar documentación de las funciones, en caso de que no este bien documentado levantas el issue.
3)Revisar que se calcule correctamente la matriz de varianzas y covarianzas de los rendimientos obtenidos, puedes probar con números aleatorios en varias corridas que se este calculando correctamente. --->Aqui la función se llama "calcular_varianza"
4)Revisar que se calcule correctamente el rendimiento de las acciones, igual puedes probar con números aleatorios. ----> Aqui la función se llama "calcular_rendimiento" y se apoya de una función auxiliar.
5)Explicar algo de teoría económica de lo que se esta realizando, esto nos va a servir para el reporte final.

2.a Valor medio esperado de activos

Crear una función que realice la multiplicación del vector de pesos^t por mu(promedio anual de los rendimientos)

Hallazgos funciones simbólicas

Hola, Itzel
Sugiero las siguiente mejoras en tu código "symbolic_gradient_Hessian.ipynb"

Falta documentación de ambas funciones.
Considero que sería bueno que ambas funciones reciban como parámetro : Sigma, r, mu e incluso la dimension de los vectores de unos para que estos estén definidos dentro de la función.
:)

Revision Solver Marcowitz

Debes revisar ya el conjunto de las funciones que anteriormente revisaron para validar que arroje resultados correctos. El notebook esta en la carpeta de programación/4_Solver.ipynb.

Gráficas pt2

Realizar las siguiente gráficas con el solver implementado en la Fase 1, es decir la carpeta solver dentro de la carpeta de programación:

Rendimiento vs desviación estándar
Para diferentes rendimientos (r) mostrar como varian los pesos con gráficas de barras

Interpretar cada gráfica
En el notebook ya existente en results: ReporteResultados_v3.ipynb

Corregir gráficas de rendimientos

Se graficó Precio vs tiempo, debe ser Rendimientos vs tiempo en la figuras 1 y 2

Creacion Docker file algoritmo solver

Crear el archivo docker file para probarlo en la instancia de AWS

Comparación Lagrange y Newton

Comparar los resultados obtenidos de los solver de Lagrange y Newton en la carpeta de results, notebook ReporteResultados_v3.ipynb sección 3.1

Añadir tabla que compare la norma de la diferencia y el valor absoluto entre ambos
Terminar explicaciones de esta sección

DL miércoles

3.c Formación de matriz Delta

Formación de matriz Delta 3c del diagrama de flujo que esta en el readme.

Cerrar etapa de programación

Verificar el funcionamiento del Sistema iterativo con funciones auxiliares así como su desempeño en la nube.

funciones simbólicas/stack

Funciones simbólicas y Stack para plantear sistema agrandado
Basarse en el siguiente código para comenzar la implementación a cupy del solver de markowitz adaptado a restricciones.
https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/IV.optimizacion_convexa_y_machine_learning/algoritmos/Python/algorithms_for_ceco.py

Update Readme

Actualización de readme

Revision Funcion 3b

Revisar la funcion de formación_abc puedes probar con varias corridas que funcione correctamente.

Conclusiones

Revisar conclusiones adecuadas para el archivo results/ReporteResultados_v3.ipynb

Revisión Etapa III 3b-3e

Se debe revisar el notebook "3e_solucion_markowitz.ipynb" que se encuentra en la carpeta de programación.
Deben realizar lo siguiente:

1)Hacer un notebook en la carpeta de revisión con un nombre apropiado a lo que estas revisando.
2)Revisar documentación de las funciones, en caso de que no este bien documentado levantas el issue.
3)En este notebook esta toda la parte 3 del algoritmo excepto por al apartado "3.a", deben revisar todas las funciones que estan definidas ahí y verificar que el resultado de la optimización sea lo más exacto posible. El problema se soluciono con multiplicadores de lagrange, pueden agregar alguna descripción de lo que observan al respecto.

Punto Factible

Proponer un punto factible para el problema de Markowitz.

Punto que cumpla con las restricciones del problema a minimizar del cual se pueda partir para encontrar solución a este.

Descripción de infraestructura

Describir la infraestructura que fue utilizada para el problema
Reportarla en

Readme.md
-results/ReporteResultados_v3.ipynb

DL: Miércoles

Sistema iterativo

Sistema iterativo para resolver sistema agrandado de Newton
Basarse en el siguiente código:
https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/IV.optimizacion_convexa_y_machine_learning/algoritmos/Python/algorithms_for_ceco.py

Para implementar restricciones con el método de Newton a el solver de markowitz

Infraestructura AWS

Infraestructura en AWS para la configuración de la GPU que será utilizada para CUPY.

Método Markowitz

Selección de la metodología a implementar para el desarrollo del proyecto.

Escribirla en el README

Deberá contener:

[ ] Descripción del tema
[ ] Metodología a realizar

Revisar 3.a de la etapa III de programación

Se debe revisar el notebook "3a_formacion_matrices.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:

Revisar 3.b de la Seccion III

Revisar el notebook "3b_formacion_abc.ipynb" que se encuentra en la carpeta de programación.
Debes realizar lo siguiente:
1)Hacer un notebook en la carpeta de revisión con un nombre apropiado a lo que estas revisando.
2)Revisar documentación de las funciones, en caso de que no este bien documentado levantas el issue.
3)Revisar que la función obtenga buenos resultados, con números aleatorios.

Creación de reporte de resultados

Con base al notebook 4_Solver.ipynb crear un notebook con un nombre apropiado en la carpeta de results que contenga interpretación financiera y de pie al Reporte Final

Recommend Projects

React

A declarative, efficient, and flexible JavaScript library for building user interfaces.
Vue.js

🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
Typescript

TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
TensorFlow

An Open Source Machine Learning Framework for Everyone
Django

The Web framework for perfectionists with deadlines.
Laravel

A PHP framework for web artisans
D3

Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

javascript

JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
web

Some thing interesting about web. New door for the world.
server

A server is a program made to process requests and deliver data to clients.
Machine learning

Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Visualization

Some thing interesting about visualization, use data art
Game

Some thing interesting about game, make everyone happy.

Recommend Org

Facebook

We are working to build community through open source technology. NB: members must have two-factor auth.
Microsoft

Open source projects and samples from Microsoft.
Google

Google ❤️ Open Source for everyone.
Alibaba

Alibaba Open Source for everyone
D3

Data-Driven Documents codes.
Tencent

China tencent open source team.