Giter Site home page Giter Site logo

wwc-python-reto-3's Introduction

Linea Python y DS

Reto: CSV's y filtrado de datos

Descripción:

Ahora que conocemos las estructuras de datos mas comunes para realizar manejo de datos en python (Dataframes) vamos a realizar una tarea que es muy común en el area de DS, la cual es la lectura de archivos CSV.

Los archivos CSV son archivos de texto plano que buscan representar tablas de datos en las cuales son valores están separados por comas. (CSV: Comma-separated values) Aquí un pequeño ejemplo:

adult, belongs_to_collection, budget, id, imdb_id, original_language,original_title
False, Toy Story Collection, 30000000, 862, tt0114709, en, Toy Story
False, James Bond Collection, 58000000, 710, tt0113189, en, GoldenEye
...

Objetivo:

Completar la función analizar_peliculas para que lea el archivo CSV llamado movies_metadata.csv que se encuentra en la carpeta. Este archivo lo tenemos que cargar en un Dataframe usando python, nos podemos ayudar de la librería pandas para ello (Consulta como leer un archivo CSV usando pandas en caso de que sea necesario).

El archivo original de movies_metadata.csv contiene las siguientes columnas:

  • adult
  • belongs_to_collection
  • budget
  • genres
  • homepage
  • id
  • imdb_id
  • original_language
  • original_title
  • overview
  • popularity
  • poster_path
  • production_companies
  • production_countries
  • release_date
  • revenue
  • runtime
  • spoken_languages
  • status
  • tagline
  • title
  • video
  • vote_average
  • vote_count

El objetivo es extraer un nuevo Dataframe con las siguientes características:

  1. El nuevo Dataframe solo debe contener estas columnas:
    • title
    • release_date
    • budget
    • revenue
    • runtime
  2. Las películas que cumplan todas las siguientes condiciones:
    • Hayan generado un retorno (revenue) de mas de 2000000 USD
    • Su presupuesto (budget) haya sido inferior a 1000000 USD

Puedes investigar como filtrar Dataframes en python para solucionar el segundo item.

Input:

Un archivo CSV con un dataset de películas

Output:

Un nuevo Dataframe solo con los datos que cumplen las características mencionadas

Preparación entorno:

Antes de comenzar con el reto es importante que instalemos las librerías que vamos a usar. Para esto haremos uso del siguiente comando:

$ pip install -r requirements.txt

Comprobar resultados:

Para comprobar los resultados puedes ejecutar el script main.py usando:

$ python main.py

Y deberías de ver los siguiente:

Excelente, has aprendido a leer CSV's con python y como filtrarlos!

wwc-python-reto-3's People

Contributors

alexismunera98 avatar katerinevach avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.