Previsão do ranking das melhores cidades para se viver.
A predição do ranking das melhores cidades para se viver com base em dados conhecidos é um problema alcançável, pois é constatável que melhores cidades para se viver possuem em sua localidade pessoas com boa qualidade de vida, com bons salários e com poder de compra, e em contraste cidades menos favorecidas possuem altas taxas de crime, pobreza e poluição. Assim, cada fator citado, entre outros influenciam em como uma cidade pode ser avaliada.
Nesta competição já há uma variável, ‘Movehub Rating’, que é a combinação de todas as pontuações para uma classificação geral para uma cidade. Dessa forma, para realizar a predição será necessário considerar todos os fatores existentes dentro do conjunto de dados, pois eles contribuem para a obtenção do resultado do ranking. O Scikit-Learn, uma biblioteca de Machine Learning, será utilizada para implementação de um algoritmo de regressão multivariada para a modelagem dos dados. Esse algoritmo irá criar o modelo que será capaz de prever os valores dos rankings das cidades.
Link da competição no site da Kaggle: https://www.kaggle.com/blitzr/movehub-city-rankings]
Observação: Machine Learning foi utilizada para a análise de dados e automatização do desenvolvimento da modelagem de dados. O algoritmo utilizado, possibilitou a obtenção de um resultado de 90,2% de precisão, o que demostra a eficácia do modelo na generalização de dados ainda não vistos.
Instruções para rodar o código: É necessário que você tenha instalada a IDE Anaconda com a versão python 3.6 version. Caso já tenha a anaconda instalada e o python está em uma versão mais nova, é só criar uma varíavel de ambiente de acordo com o manual fornecido pelo site do Anaconda.
Para baixar a IDE Anaconda acesse: https://www.continuum.io/downloads.
Passos: Acesse o jupyter notebook. Baixe os três datasets disponíveis neste repositório. Abra o arquivo Movehub_Rating_greatscore.ipynb. Execute-o e observe os resultados obtidos.
Se tiver dúvidas ou precisar de ajuda para entender ou executar o código pode entrar em contato comigo sem problemas.