Giter Site home page Giter Site logo

franzbischoff / covid19pt-data Goto Github PK

View Code? Open in Web Editor NEW

This project forked from dssg-pt/covid19pt-data

0.0 2.0 0.0 2.58 MB

😷️🇵🇹 Dados relativos à pandemia COVID-19 em Portugal

License: GNU General Public License v3.0

Jupyter Notebook 100.00%

covid19pt-data's Introduction

😷️🇵🇹 Dados relativos à pandemia COVID-19 em Portugal

📅️ Última actualização: 15 de Março de 2020, 12h

ℹ️ Fonte dos dados: Direcção Geral de Saúde - Ministério da Saúde Português, através do dashboard do COVID-19 (aqui e dos relatórios de situação publicados diariamente desde 03/03/2020.

🤔 Contexto

Embora a comunicação e partilha de dados por parte do Ministério de Saúde Português tenha melhorado consideravelmente ao longo da crise do COVID-19, ainda está longe de ideal (havendo a destacar o exemplo do repositório da Protecção Civil Italiana no GitHub).

A informação disponibilizada pela Direcção Geral de Saúde (DGS), para além de não ter o nível de granularidade da das autoridades italianas, também não é disponibilizada em formatos abertos e facilmente inspeccionáveis/manipuláveis. Ficam assim dificultadas tarefas de análise, modelação e visualização por parte da comunidade (quer mais informal, quer mais académica/industrial) disposta a colaborar no combate à pandemia com as ferramentas que conhece: as de análise de dados.

❗ O compromisso deste repositório é justamente esse: todos os dias enquanto esta pandemia durar, o ficheiro data.csv será actualizado com a informação mais recente disponibilizada pela Direcção Geral de Saúde. Esta informação será extraída do relatório de situação o mais rapidamente possível após a sua disponibilização (que costuma ser ~12h00 GMT+00:00).

A estrutura base deste ficheiro, desenhada para fácil manipulação em Excel/Python/R não mudará, podendo a comunidade analítica considerá-lo um alvo imutável (em termos de localização e estrutura) para, por exemplo, alimentar plataformas de visualização/modelação. De notar que, mediante a evolução do formato dos relatórios de situação, poderão ser adicionadas novas colunas, mantendo-se claro a retrocompatibilidade. Fontes adicionais de dados poderão também ser adicionadas.

Porque tudo começa com bons dados.

🧱 Estrutura

O repositório está organizado da seguinte forma:

  • data.csv: o Pastel de Nata.
  • archive/: arquivo de todos os relatórios de situação disponibilizados pela DGS, em formato .pdf. Os relatórios são disponibilizados diariamente, desde o dia 03-03-2020.
  • notebooks/: contém um notebook Python com um simples de como carregar e visualizar os dados.

📔 Dicionário dos dados

Uma explicação do conteúdo em data.csv.

📝 ARS: Administração Regional de Saúde

Nome da coluna Significado Possíveis valores
data Data de publicação dos dados (nem sempre os dados reflectem a realidade desse dia, podendo nalguns casos estar desfasados) Data no formato DD-MM-YYYY
confirmados Casos confirmados Inteiro >= 0
confirmados_arsnorte Casos confirmados na ARS Norte Inteiro >= 0
confirmados_arscentro Casos confirmados na ARS Centro Inteiro >= 0
confirmados_arslvt Casos confirmados na ARS Lisboa e Vale do Tejo Inteiro >= 0
confirmados_alentejo Casos confirmados na ARS Alentejo Inteiro >= 0
confirmados_arsalgarve Casos confirmados na ARS Algarve Inteiro >= 0
confirmados_acores Casos confirmados na Região Autónoma dos Açores Inteiro >= 0
confirmados_madeira Casos confirmados na Região Autónoma da Madeira Inteiro >= 0
confirmados_estrangeiro Casos confirmados no estrangeiro Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
confirmados_novos Total de novos casos confirmados comparativamente ao dia anterior Inteiro >= 0
recuperados Total de casos recuperados Inteiro >= 0
obitos Total de óbitos Inteiro >= 0
internados Total de pacientes COVID-19 internados Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
internados_uci Pacientes COVID-19 internados em Unidades de Cuidado Intensivos Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
lab Total de casos suspeitos a aguardar resultados laboratoriais Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
suspeitos Total de casos suspeitos (tendo a definição sido actualizada a 29/02/2020) Inteiro >= 0
vigilancia Total de casos sob vigilância pelas autoridades de saúde Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
infirmados Total de casos cuja suspeita de infecção não se confirmou Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
cadeias_transmissao Número de cadeias de transmissão do SARS-CoV-2 activas Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
transmissao_importada Número de casos confirmados com transmissão por via de infectados de outros países Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador
transmissao_comunitaria Número de casos confirmados com transmissão por via da respectiva comunidade local Inteiro >= 0 ou NaN para os dias em que a DGS não reportava este indicador

Relativamente à coluna data, esta corresponde à data em que a DGS disponibilizou esta informação, que nem sempre corresponde à data de recolha. A partir de 03-03-2020, é possível verificar nalguns relatórios de situação (disponíveis na pasta archive/) a data efectiva de recolha da informação apresentada.

Nos seus relatórios de situação, a DGS reporta alguma informação epidemiológica extra, como género e grupo etário dos infectados, que poderá vir a ser adicionada caso haja interesse para tal.

Uma outra métrica com potencial interesse científico, o número de casos com base na data de início de sintomas, é também reportada pela DGS. No entanto, é apenas disponibilizado um gráfico de eixos esparsos, o que pode introduzir erros de aproximação na transcrição e comprometer a factualidade dos dados. Por essa razão, esta informação é propositadamente excluída.

💡 Problemas, inconsistências e melhorias

Quaisquer sugestões de dados complementares (provenientes de fontes oficiais), inconsistências nos dados ou melhorias genéricas, à vontade ➡️ Issues ou Pull Requests.

🌍 Sobre a Data Science for Social Good Portugal

A Data Science for Social Good Portugal é uma comunidade aberta de cientistas de dados, amantes de dados e entusiastas de dados que querem atacar problemas que importam verdadeiramente. Acreditamos no poder dos dados para transformar a nossa sociedade para o melhor e para todos.

@dssgPT | fb.com/DSSGPortugal | Instagram @dssg_pt | LinkedIn

covid19pt-data's People

Contributors

dssgpt avatar ishouldbedany avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.