Análise dos efeitos da pandemia nos preços dos produtos mais comprados pelo Governo Federal no enfrentamento da crise.
Extração de dados realizada no Pentaho Data Integration (v9.0) através do processo pentaho-precos-covid.ktr.
Processo com tratamentos estatísticos, com o fim dar qualidade às análises, disponível em rapidminer-precos-covid.rmp.
O pivô abaixo traz estatísticas consolidadas por UNIDADE_CATMAT:
- Pivô da tabela por UNIDADE_CATMAT (imagem acima)
- Pivô da tabela por UNIDADE_CATMAT e COVID (imagem acima)
- Filtro
count(UNIDADE_CATMAT) > 100
- Filtro
standard_deviation(VALOR_UNITARIO) < 100
- Criação de coluna DIFERENCA:
([median(VALOR_UNITARIO)_Sim]-[median(VALOR_UNITARIO)_Não])/[median(VALOR_UNITARIO)_Não]*100
- Criação de coluna NORMALIZADO (com base em metodologia do TCU, p. 67):
VALOR_UNITARIO-[average(VALOR_UNITARIO)])/[standard_deviation(VALOR_UNITARIO)]
- Criação de coluna OUTLIER_NOVO:
if(NORMALIZADO>0.2,1,0)
- Filtro (opcional) para trazer apenas
COVID = 0
O arquivo resultante das transformações do RapidMiner são tranformados em planilhas do Google para incorporação em relatório do Data Studio.
A planilha está na pasta 'Análise de Preços' do Google Drive da conta [email protected].
Os dados são adicionados como fonte de dados do relatório: Análise de Variação de Preços COVID-19.