Giter Site home page Giter Site logo

tarea3's Introduction

Tarea3

1. A partir de los datos, encontrar la mejor curva de ajuste (modelo probabilístico) para las funciones de densidad marginales de X y Y.

Para encontrar la función de densidad marginal de y se aplicó las siguientes propiedades:

Al ser variables discretas, las ecuaciones anteriores se traducen como sumatorias de la probabilidad conjunta para cada y cada . De esta manera, al sumar las probabilidades para una determinada se encuentra el valor de la pdf en ese punto. Esto se hizo para cada y . A nivel de programación, para realizar las sumatorias se utilizó la función numpy.sum() con la matríz de probabilidades obtenida del archivo xy.csv. Teniendo la pdf marginal de las vriables se procedió a encontrar el modelo que mejor se ajustara; por la forma de las pdf se determinó que una distribución normal se ajusta bastante bien en ambos casos, por lo que se encontraron los parámetros de los modelos usando el método curve_fit() del paquete numpy. A continuación se presenta un cuadro que incluye el valor de los parámetros del modelo para cada variable:

Varible
X 9,905 2,299
Y 15,08 6,027

Una vez obtenidos los parámetros se puede construir los modelos:

2. Asumir independencia de X y Y. Analíticamente, ¿cuál es entonces la expresión de la función de densidad conjunta que modela los datos?

Al asumir independencia de y , la función de densidad conjunta se puede obtener al multiplicar las funciones de densidad marginales de cada varible.

3. Hallar los valores de correlación, covarianza y coeficiente de correlación (Pearson) para los datos y explicar su significado.

Correlación

Para clcular la correlación entre y se utilizó la ecuación (\ref{ecu:correlacion}), para una variable discreta corresponde a la sumatoria de la multiplicación de cada por cada por la respectiva probabilidad conjunta.

A nivel de programación, se recorrió, por medio de bucles for, la matriz de probailidades del archivo xyp.csv y se realizó la operación mencionada. El resultado obtenido es , que indica el grado en el cual las variables estan linealmente asociadas. Para probar la independencia de las variables se hece la multiplicación de los valores medios, o parámetros :

Se observa que el valor obtenido con ambos métodos se aproximan bastante entre sí por lo que la suposición de indepedencia fué correcta.

Covarianza

La covarianza se calcula de forma similar a la correalción, en este caso a los valores de las variables hay que restarle al respectiva media, como lo describe (\ref{ecu:covarianza}). Es importante mencionar que el valor de la media para una distribución normal es igual al parámetro , que ya había sido calculado previamente.

El resultado de la covarianza es , del cual lo más impotante es el signo. Al ser signo positivo indica que la correlación es directa, es decir que a grandes valores de corresponde valores grandes de , y viceversa. Una vez más se confirma la independencia de las variables puesto que el valor de la covarianza es cercano a cero.

Coeficiente de correlación

Con el valor de la covarianza, se puede usar (\ref{ecu:coef}) para obtener el coeficiente de correlación. En este caso se necesita el valor de desviación estandar de las variables aleatorias, estos valores para una distribución normal corresponden al parámetro y ya había sido calculado anteriormente.

El resultado obtenido es , este valor cercano a cero indica que la correlación entre y no es tan fuerte.

4. Graficar las funciones de densidad marginales (2D), la función de densidad conjunta (3D).

Para graficar las pdf conjunta y marginales de y , se utilizó la librería matplotlib. Se graficó la pdf original y el modelo superpuesto para ver la semejansa.

Función de densidad marginal de Y

Función de densidada de probabilidd conjunta de X y Y.

tarea3's People

Contributors

jhonny1696 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.