Giter Site home page Giter Site logo

ecommerce--data-analysis's Introduction

Ecommerce--Data-Analysis

Utilizo Hadoop- Spark- HDFS -Pyspark para analizar dataset sobre transacciones de un emprendimiento

Conjunto de datos de transacciones que contiene todas las transacciones que ocurrieron entre el 01/12/2010 y el 09/12/2011 para una venta minorista en línea no basada en una tienda física y registrada en el Reino Unido. La empresa principalmente vende regalos únicos para todas las ocasiones. Muchos clientes de la empresa son mayoristas

1

datos_a.createOrReplaceTempView("tabla_datos") *crear vista 2

Podemos utilizar la función "col" para referirnos a una columna en un dataframe de una manera más eficiente y legible.

Estamos utilizando la función "col" para seleccionar las columnas del dataframe "datos_a" y convertir las columnas "Quantity" y "CustomerID" a tipo integer. Al utilizar la función "col", podemos referirnos a las columnas del dataframe de una manera clara y concisa. También se pueden utilizar otras funciones de Pyspark como "lit", "concat", "substring", "sum", entre otras, junto con la función "col" para realizar operaciones más complejas en las columnas del dataframe. 3

para hacer consultas con datos numéricos, se suele recomendar cambiarles el tipo de dato en caso de que esten en “string”

Total de facturas únicas: 25900

4

La cantidad total de productos vendidos: 5.176.450.0

5

Cantidad de productos vendidos por país:

6

Obtener el promedio de precios unitarios de los productos: 4.611113626082972

7

la cantidad de facturas por día: 541.909

8

Número total de transacciones en el dataset:

9

Número de clientes únicos:

10

Productos más vendidos:

11

Transacciones realizadas en un país en particular: Francia

12

Análisis de ventas por mes: 9747747.93

13

Obtener la lista de los 10 clientes que más gastaron: ID

14

ecommerce--data-analysis's People

Contributors

jeanette22 avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.