Giter Site home page Giter Site logo

equipe4-2024.1's Introduction

Data Fusion

Este projeto realiza uma análise abrangente dos dados de carros de 1970 a 2024. Utilizando um dataset do Kaggle, exploramos tendências, características e outras informações relevantes sobre os veículos ao longo dos anos. Esta análise pode ajudar em estudos de mercado, desenvolvimento de novos produtos e estratégias de marketing.

Desenvolvedores

  • Sarah Almeida Dalla Valle Prior #1
  • João Vinicius Araújo Rocha #2
  • Kassia Cristina de Sousa Lopes #3
  • Alesangela Bezerra da Fonseca #4

Funcionalidades

Esse template foi inicialmente baseado no template de ciência de dados do cookiecutter, mas ao longo do tempo várias modificações foram sendo realizadas. Atualmente o template tem as seguintes características:

  • Utilização do arquivo pyproject.toml como centralizador de dependências;
  • Configuração para criação de aplicação Streamlit;
  • Utilização de Jupyter Notebooks para análise de dados;
  • Documentação com o MkDocs (Material Design Theme).

Instruções

Requisitos

Para utilizar este template, você precisará de um ambiente com os seguintes softwares:

  • git
  • Python 3.8
  • Poetry 1.1.13 ou superior

É aconselhável o uso do pyenv para o gerenciamento de versões do Python.

Iniciando um novo projeto

Para iniciar um novo projeto a partir deste template:

  1. Clicar no botão "Use this template" (ou "Usar este modelo").
  2. Digitar um nome para seu repositório e uma descrição opcional.
  3. Escolher a visibilidade do projeto (Pública ou privada).
  4. Clicar em "Create repository from template" (Criar repositório a partir do modelo).

Contribuindo com um repositório já criado

Para clonar o repositório e começar a contribuir:

  1. Acima da lista de arquivos, clique no botão "Code" (em verde).
  2. Copie a URL do repositório.
  3. Utilize uma chave SSH para clonar:
    git clone https://github.com/atlantico-academy/equipe4-2024.1
  4. Navegue até o diretório do repositório clonado:
    cd equipe4-2024.1
  5. Instale as dependências do projeto:
    poetry install
  6. Ative o ambiente virtual criado pelo Poetry:
    poetry shell

Utilização

Após a instalação, você pode iniciar a aplicação Streamlit para visualizar a análise dos dados:

streamlit run app.py

Ou abrir e executar os Jupyter Notebooks para explorar as análises de dados:

jupyter notebook notebooks/

Organização de Diretórios

.
├── data/              # Diretório contendo todos os arquivos de dados
│   ├── external/      # Arquivos de dados de fontes externas
│   ├── interim/       # Arquivos de dados intermediários
│   ├── processed/     # Arquivos de dados processados
│   └── raw/           # Arquivos de dados originais, imutáveis
├── docs/              # Documentação gerada através da biblioteca MkDocs
├── models/            # Modelos treinados e serializados, predições ou resumos de modelos
├── notebooks/         # Diretório contendo todos os notebooks utilizados nos passos
├── references/        # Dicionários de dados, manuais e todo o material exploratório
├── src/               # Código fonte utilizado nesse projeto
│   ├── data/          # Classes e funções utilizadas para download e processamento de dados
│   ├── deployment/    # Classes e funções utilizadas para implantação do modelo
│   └── model/         # Classes e funções utilizadas para modelagem
├── app.py             # Arquivo com o código da aplicação do Streamlit
├── Procfile           # Arquivo de configuração do Heroku
├── pyproject.toml     # Arquivo de dependências para reprodução do projeto
├── poetry.lock        # Arquivo com sub-dependências do projeto principal
├── README.md          # Informações gerais do projeto
└── tasks.py           # Arquivo com funções para criação de tarefas utilizadas pelo invoke

equipe4-2024.1's People

Contributors

viniciusrocha85 avatar kassialopes avatar sarahllprior avatar alesangelabezerra avatar omadson avatar

Stargazers

Tayná Fiúza avatar

Watchers

 avatar

equipe4-2024.1's Issues

Apresentação dos Resultados

  • Apresentação de resultados: a equipe deve produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.

Coleta Inicial dos dados

  • Coleta inicial de dados: a equipe deve apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pasta data/raw/.

Proposta de Negocio:

  • Proposta do projeto: a equipe deve compreender completamente, de uma perspectiva de negócios, o que realmente deve ser feito no projeto, em seguida, modificar o arquivo README.md, contendo um resumo do projeto que será construído. Tente apresentar uma justificativa para o projeto. É desejável que também se insira um graphical abstract.

Analise Exploratória de Dados

  • Exploração de dados: a equipe deve criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto: Descrição dos dados, Perguntas de partida e hipóteses, Insights, de acordo com o conteúdo visto em aula;

Entrega 1

A equipe deve entregar e apresentar uma análise exploratória dos dados (exploratory data analysis, EDA). Nesse ponto, o projeto terá finalizado a fase de entendimento dos dados na metodologia CRISP-DM. Desse modo, os pontos a serem observados na execução são:

  • Proposta do projeto: a equipe deve compreender completamente, de uma perspectiva de negócios, o que realmente deve ser feito no projeto, em seguida, modificar o arquivo README.md, contendo um resumo do projeto que será construído. Tente apresentar uma justificativa para o projeto. É desejável que também se insira um graphical abstract.
  • Coleta inicial de dados: a equipe deve apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pasta data/raw/.
  • Criação do dicionário de dados: a equipe deve criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pasta data/external/;
  • Exploração de dados: a equipe deve criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto: Descrição dos dados, Perguntas de partida e hipóteses, Insights, de acordo com o conteúdo visto em aula;
  • Apresentação de resultados: a equipe deve produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.

Dicionario de Dados

  • Criação do dicionário de dados: a equipe deve criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pasta data/external/;

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.