Giter Site home page Giter Site logo

hadoop's Introduction

Tutorial

Este projeto apresenta um recomendador de conteúdo, criado a partir do Apache Hadoop e Apache Mahout. Criamos esta arquitetura a partir de uma plataforma Linux (Ubuntu 12.0.4) 64 bits e Docker 1.5.0. Os procedimentos a seguir descrevem passo a passo a configuração do ambiente e a execução do recomendador de conteúdo.

Após descarregar o projeto, entre no diretório e execute o seguinte comando para executar a build do Docker:

docker build -t instance-name .

Certifique-se de que a build foi executada corretamente e de que todos os downloads foram executados. Agora você pode criar uma instância Docker dessa máquina. Veja:

docker run -d -P --name instance-name instance-name

Execute o comando a seguir para descobrir a porta ssh que a instância foi disponibilizada:

docker port instance-name

Agora você pode se conectar a instância usando ssh. A senha é: 'screencast'.

ssh root@localhost -p ssh-port

Uma vez conectado a instãncia, crie uma formate a partição do Hadoop para que possamos trabalhar com arquivos. Veja:

hadoop namenode -format

Inicie o Hadoop.

start-all.sh

Entre no diretório ml-100k.

cd ml-100k

Registre o arquivo u.data no Hadoop File System.

hadoop fs -put u.data u.data

Execute o Job de recomendação de conteúdo do Mahout e aguarde o processamento.

hadoop jar /opt/mahout-distribution-0.9/mahout-core-0.9-job.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_COOCCURRENCE --input u.data --output output

Recupere a lista de recumendação do Hadoop File System e salve em um arquivo chamado output.txt

hadoop fs -getmerge output output.txt

O arquivo output.txt contém o identificador do usuário, seguido de uma lista de conteúdos (id e nota) a serem recomendados. Escrevemos uma rotina Python que apresenta os resultados de forma mais legível. Veja a seguir como executar essa rotina:

python show_recommendations.py user-id u.data u.item output.txt

Substitua o atributo user-id pelo identificador do usuário que deseja fazer a recomendação, por exemplo: 10.

hadoop's People

Watchers

James Cloos avatar João Vitor Gengo Vendrame avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.