Giter Site home page Giter Site logo

x4leqxinn / hadoop Goto Github PK

View Code? Open in Web Editor NEW

This project forked from juliopez/hadoop

0.0 0.0 0.0 25 KB

Infraestructura para Big Data : Hadoop + NiFi +Spark + Hive usando Docker

Home Page: http://juliopezblog.wordpress.com

License: GNU General Public License v2.0

Shell 100.00%

hadoop's Introduction

Hadoop / Docker-Compose by @Juliopez

Infraestructura Big Data usando docker-compose.


En este contendeor podras encontrar HDFS, Hive, Spark, Hue, Zeppelin, Kafka, Zookeeper y NiFi
Para la implementacion de este contenedor solo basta con descargar (clonar) este repositorio y, proceder a descomprimir en tu maquina local.
Luego, desde la linea de comando, ubicate sobre el directorio Hadoop y ejecuta docker-compose up
Con esto completamos la instalación de Hadoop – HDFS -Spark -Hive- NiFi.

Podemos comprobar la correcta ejecución de la siguiente forma.


En un browser ingresar a http://localhost: numero de puerto
Donde numero de puerto puede ser:
** 50070 (visualiza Hadoop y sus namenode)
** 8080 (Spark Master)
** 8081 (Spark Worker)
** 8888 (Hue. Se solicitará la creación de una cuenta. Ingrese admin como usuario y admin como password)
** 9999 (NiFi)
** 3030 (kafka)
** 18630 (StreamSets. Utilice admin / admin)
** 19090 (zeppelin)

Para el uso de Hive


Ejecute en la consola sudo docker exec -it hive-server bash
Luego ingrese al directorio donde esta alojado Hive, para esto deberá ejecutar el comando cd /opt/hive/bin
Una vez dentro de dicho directorio, ejecute Hive con el siguiente comando ./hive

Para el uso de mysql


Ejecute en la consola sudo docker exec -it database bash
Luego el comando mysql -h localhost -u root -p
Posterior a esto se solicitara la contraseña, la cual es : secret

Para el uso de Spark (Scala)


Ejecute en la consola sudo docker exec -it spark-master bash
Luego ingrese al directorio donde esta alojado Spark, para esto deberá ejecutar el comando cd /spark/bin
Una vez dentro de dicho directorio, ejecute Hive el siguiente comando ./spark-shell

Para el uso de pyspark (Python)


Ejecute en la consola sudo docker exec -it spark-master bash
Luego ingrese al directorio donde esta alojado Spark, para esto deberá ejecutar el comando cd /spark/bin
Una vez dentro de dicho directorio, ejecute el siguiente comando ./pyspark

Para el uso de Kafka


Ejecute en la consola sudo docker exec -it kafka bash
Luego ingrese al directorio donde esta el productos y consumidor de Kafka, para esto deberá ejecutar el comando cd /usr/local/bin
Para crear un TOPIC: ./kafka-topics --create --zookeeper 172.27.1.15:2181 --replication-factor 1 --partitions 1 --topic EJEMPLO
Para verificar la creacion: ./kafka-topics --list --zookeeper 172.27.1.15:2181
Para crear un PRODUCTOR: ./kafka-console-producer --broker-list localhost:9092 --topic EJEMPLO
Para crear un CONSUMIDOR: ./kafka-console-consumer --bootstrap-server localhost:9092 --from-beginning --topic EJEMPLO


SI tienes problemas con HUE, mira la solucion propuesta aqui: https://youtu.be/Ck4sRPa0o24

Si necesitas trabajar con sqoop, aqui una propuesta: https://youtu.be/hLJFzOAbY8Q

Mas info en Blog de Julio Lopez-Nunez.

hadoop's People

Contributors

juliopez avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.