Vamos analisar uma base de dados e fazer uso de 7 Algoritmos de Machine Learning para tentar prever o preço dos imoveis em 4 cidades do país.
Analisar os dados é um passo essencial para entender o que está acontecendo e como deve-se proceder em cada caso. Dessa forma, o presente artigo busca explorar um dataset sobre alugueis e, a partir deste, elaborar algumas constatações e teorias, alem de gerar algoritmos de ML para prever futuros valores.
Neste exemplo, busquei analisar os dados e sua relações, tentando elaborar hipoteses e achando padroes que busquem definir o comportamento dos dados. Alem disso, é importante tratar bem os dados para fornece-los ao modelo a fim de gerar previsões com alto grau de confiabilidade.
Modelos usados:
- Decision Tree Regression;
- Random Forest Regression;
- Linear Regression;
- SVM Regression;
- K Nearest Neighbour Regression;
- Lasso Regression;
- Ridge Regression;
Foi possível observar nesse exercício como os dados estão distribuídos e como se relacionam, alem de poder inferir algumas hipóteses que podem explicar os seus modelos. Convém lembrar que o uso de pipelines pode otimizar e acelerar bastante o nosso trabalho, pois pode economizar bastante código e torna mais fácil o entendimento deste e sua manutenção. Pode-se também utilizar pipelines para testar diferentes parâmetros para os modelos, melhorando assim a sua eficacia. No mais, fica registrado o quão importante a analise de dados pode ser para identificar padrões, evitar prejuízos e maximizar os ganhos. Muito obrigado pela leitura.