Projeto para disciplina de Big Data 6 semestre Insper.
O projeto consiste em fazer uma análise com a web brasileira inteira e observar a relação entre as diversas marcas que mais aparecem a partir da utilização de métodos de Big Data com o PySpark.
Computador (Dell,Positivo,Apple,Asus,Acer) Carro (Fiat,Ford,Mercedez,Audi,Toyota) Alimentícia (Sadia, Perdigão, Seara, Friboi, President) Calcados (Nike,Rebook,Puma,Asics,Adidas) Cervejas(Heineken, Skol, Brama, Sol, Itaipava) Joalherias (Pandora, Vivara, H.Stern, Dryzun, Legner) Eletronicos(Samsung, LG, Panasonic, Philips, Sony) Super-Mercados(Walmart, Pão de açúcar, Extra, Carrefour, Mambo) Universidades(Insper, USP, UNICAMP, Puc-sp, Puc-rj) Motos (HarleyDavison, Suzuki, Yamaha, Ducati , Kawasaki)