PROJETO II
Atividade em R
Estatística para Computação 2019.2 - et586cc
- Informações gerais: O segundo projeto de Estatística para Computação 2019.2 será realizado na plataforma R Studio, a qual foi abordada em sala de aula. O projeto vale 70% da 3ª nota da cadeira, sendo os outros 30% preenchidos pelo projeto I de seminários sobre a aplicação da estatística na computação.
O projeto consiste em elaborar um script que responda todas as questões pedidas a seguir referentes a planilha de “Detalhes de Álbuns”. A planilha deve ser baixada como arquivo .csv para ser carregada no R. A nota do projeto será proporcional a quantidade de questões solucionadas corretamente.
É importante:
- É necessário imprimir a resposta encontrada a cada questão resolvida. Se a questão pede a média de uma certa amostra, após realizar a função, você deve imprimir o resultado dessa função.
- Pode utilizar as funções prontas do R (média, desvio padrão etc).
- Não é permitido copiar totalmente ou parcialmente a resolução de outras equipes. Caso ocorra, ambas serão penalizadas.
-
As questões: A seguir as questões que devem ser resolvidas:
-
Descarregue o arquivo .csv da planilha e imprima o dataframe obtido exatamente do jeito que ele se encontra.
-
Encontre a média, o desvio padrão e a moda das vendas do total de álbuns (se não existir algum desses, basta retornar dizendo que não existe).
-
Faça uma função que retorna os nomes dos artistas que lançaram álbuns nos dois anos (ou seja, o mesmo artista lançou um ou mais álbuns em 2018 e em 2019).
-
Faça uma função que retorne qual artista possui o menor desvio padrão nas vendas (considerando apenas os artistas com mais de um álbum).
-
Faça uma função que retorne o nome do álbum que mais vendeu e o que menos vendeu ao dar um ano de lançamento (retorne também o nome dos artistas correspondentes a cada álbum).
-
Faça uma função que retorne uma lista com os artistas que só apareceram uma vez na planilha, indicando também o ano que cada um aparece.
-
Faça um dataframe com as colunas EMPRESA, NÚMERO DE ARTISTAS que mostra quantos artistas cada empresa possui (lembrando que um mesmo artista pode aparecer mais de uma vez na planilha). Coloque em ordem crescente do número de artistas.
-
Elabore uma função que retorna os 3 artistas que mais aparecem na planilha, para em seguida fazer um dataframe desses artistas com as colunas ARTISTA, TOTAL DE VENDAS onde a última coluna deve ser a soma de todas as vendas do artista. Faça por ordem decrescente de vendas.
-
Elabore uma função que retorna o nome do álbum que mais vendeu de cada empresa. Por fim, faça um dataframe com as colunas EMPRESA, ARTISTA, ÁLBUM, VENDAS que mostra o álbum mais vendido de cada empresa, por ordem decrescente de vendas.
-
Faça uma função que ao receber o nome de uma empresa, cria um histograma onde mostra a frequência de álbuns lançados pela empresa de acordo com o ano. Não esqueça de dar um título e fazer ele de forma colorida, facilitando a visualização.