ondata / covid19italia Goto Github PK
View Code? Open in Web Editor NEWLicense: Creative Commons Attribution 4.0 International
License: Creative Commons Attribution 4.0 International
curl -kL "https://www.agenas.gov.it/covid19/web/index.php?r=site%2Ftab1" | vd -f html +:table_0::
curl -kL "https://www.agenas.gov.it/covid19/web/index.php?r=site%2Ftab2" | vd -f html +:table_0::
Regione 'Novara' in ?q=getdatacovid-19
Questa chiamata ritorna nella lista il seguente oggetto:
{
"provincia":"Alessandria",
"numero infetti":"32",
"regione":"Novara",
"data":"2020-03-06",
"codice provincia":"006"
}
Come riprodurlo
HTTP GET: https://openpuglia.org/api/?q=getdatacovid-19
Risultato atteso
"regione":"Piemonte",
Screenshots
n/a
Altre informazioni
n/a
Accidenti non ero a conoscenza di questa mancanza.
Consiglio l'utilizzo di tabula per velocizzare il processo di conversione (ammesso che non ne stiate già usando uno simile o migliore).
Grazie mille per il vostro preziosissimo lavoro.
Allegati:
TW: @PietroMonticone
Approfitto dell'enorme disponibilità del team. Ma non è che si riuscirebbe a scaricare giornalmente i dati di questo grafico? Sono informazioni rilevanti, ma messe così non sono proprio utili.
Il processo automatico di scarico dei dati ha girato alle 20:00 mentre Regione Lombardia ha rilasciato i dati alle 20:30. Quindi i dati scaricati con la reference date odierna sono identici a quelli di ieri.
PS sto utilizzando i dati che staricate giornalmente per una serie di analisi sui tamponi che potete travare sul mio account twitter: https://twitter.com/Stigni
Slightly off topic. Sto avendo difficoltà a reperire questi dati. Qualcuno sa darmi suggerimenti? Mi servono per mostrare il picco
Se la tua richiesta è relativa ad un problema descrivicela per favore.
Descrivi la soluzione che ti piacerebbe
Descrivi le alternative considerate
Come modellizzazione non vedo alternative, ma ovviamente per il nome della regione indeterminata esistono infinite possibilità
Altro materiale
DataStudio
Spreadsheet
Nello storico del WebSevice ISS-Epicentro alcuni file relativi alla Curva Epidemica dall'inzio risultano contenere gli stessi dati del giorno precedente.
Ad esempio il file CSV relativo all'aggiornamento di ieri 15 dicembre contiene in realtà gli stessi dati del file CSV realtivo al 14 dicembre.
Questo è dovuto alle tempistiche di aggiornamento della Dashboard ISS variabili nel tempo e non sempre allineate con le tempistiche dello scraper.
Tramite InternetArchive sono disponibili alcune fonti per il recupero dei dati corretti e ad esempio:
20 ottobre - CSV attuale - InternetArchive
31 ottobre - CSV attuale - InternetArchive
07 novembre - CSV attuale - InternetArchive
In allegato archvio zip con i tre file CSV recuperati da InternetArchive relativi alle date 2020-10-20, 2020-10-31 e 2020-11-07, e il file realtivo ai dati di ieri 15 dicembre.
backup_2020-10-20_2020-12-15.zip
Vedi avviso su twitter https://twitter.com/davidmasitaly/status/1285238956897050625
Era INCR_DATE_TAMP_RL_v2
ma non è più presente qui https://services1.arcgis.com/XannvQVnsM1hoZyv/ArcGIS/rest/services/
Da oggi verrà archiviato il layer INCR_DATE_TAMP_RL
Da oggi l'ISS pubblica i dati su inizio sintomi e data di prelievo tampone attraverso una dashboard e non più come PDF. Sarebbe possibile estrarli a ogni aggiornamento? Possono essere dati molto utili, in particolare se si vuole provare a calcolare R0/rt.
https://www.epicentro.iss.it/coronavirus/sars-cov-2-dashboard
Per caso esiste una fonte più "ufficiale" dei dati per comune? Idealmente non limitati alla regione Lombardia
Ho trovato solo questo https://github.com/ondata/covid19italia/tree/master/webservices/regioneLombardia , per caso sono raccolti anche altrove?
Che voi sappiate ci sono mappe della diffusione dell'epidemia nei vari comuni?
Grazie mille per il lavoro
Ciao a tutti,
l'endpoint https://openpuglia.org/api/ sembra aver smesso di funzionare, è possibile fare qualcosa per ripristinarlo?
Come riprodurlo
I passi per riprodurlo:
https://openpuglia.org/api/?q=getdatapccovid-19
Could not connect
Risultato atteso
Una response contenente un JSON con i dati nazionali.
Altre informazioni
Grazie mille
Da due giorni la somma dei dati giornalieri di INCR_DATE_PRV_TAMP_RL_v2 non corrisponde più con quella comunicata dalla regione. È possibile che una parte dell'archivio non venga scaricato correttamente?
ok risolto. Scusa il ritardo
Originally posted by @patrunomeister in #61 (comment)
Ciao, scusa ancora,
Ho provato poco fa l'API in questione ma i dati che mi restituisce sono solo quelli della Valle d'Aosta e sono tutti a zero tranne la data che è sballata
Thanks for your work to help the people in need! Your site has been added! I currently maintain the OpenSourceWuhan page, which collects all open source projects related to COVID-19, including maps, data, news, api, analysis, medical and supply information, etc. Please share to anyone who might need the information in the list, or will possibly contribute to some of those projects. You are also welcome to recommend more projects.
https://weileizeng.github.io/OpenSourceWuhan/world
Cheers!
Ciao, ho creato una pagina navigabile da chiunque tramite browser!
Si trova qui: https://alpha.iodide.io/notebooks/4249/
È un po' lentino nell'importare i pacchetti ma poi va abbastanza liscio.
Sarei contento se può essere di aiuto a qualcuno che non ha la competenza o la voglia di installare programmi di analisi sulla propria macchina.
Ciao @aborruso,
la data in cui sono stati registrati gli ultimi decessi presenti nel csv per comuni (webservices/regioneLombardia/processing/COMUNI_COVID19.csv,) è la stessa data della data di caricamento, cioè 4 aprile, o qualche giorno prima, cioè 31 marzo?.
Tutti i decessi avvenuti in Lombardia per covid (ufficiali ovviamente) sono presenti nel DB?
Grazie mille e bravissimi per il lavoro!
Sarebbe utile avere nel Readme una descrizione un po' più dettagliata di cosa rappresentano i dati estratti.
Intendo dire che non riesco a capire cosa rappresentino nel file finale (raw_Incidenza e raw_Numerocasi; quelli indipendenti dalla data) le varie colonne: ID, classe, ecc.
Gran lavoro comunque! Grazie!
Soltanto 3 giorni fa abbiamo sollecitato - insieme a tanti altri - la Protezione Civile e il Ministero per la pubblicazione in formato machine readable dei dati sul COVID-19.
Era questo tweet: https://twitter.com/ondatait/status/1235259401113661440
Da oggi la Protezione Civile ha il suo repo, con dati ben strutturati (devo ancora invero approfondire) https://github.com/pcm-dpc/COVID-19
Questa issue per comunicare che sto spegnendo l'aggiornamento automatico, perché non ha più senso trasformare PDF in CSV.
Il repo lo lascio attivo, perché vista l'attenzione avuta potrebbe essere un luogo dove continuare a fare/pensare "cose" sui quei dati ufficiali.
Un grosso grazie a tutti quelli che hanno dato un contributo!
https://openpuglia.org/api/?q=getdatacovid-19®=lombardia
Ritorna un header sbagliato:
Il Content-Type
dovrebbe essere application/json
Le tabelle con i dati non sono più HTML pure, ma hanno come fonte dei JSON non più accessibili in GET:
Passare a un browser headless
Nello storico risultano mancanti o vuoti alcuni file relativi alla Curva Epidemica dall'inzio.
Nello specifico risultano al momento mancanti i file relativi alle seguenti date:
2020-07-04
2020-07-16
2020-10-17
E risulta al momento vuoto il file relativo alla seguente data:
2020-12-04
Tramite InternetArchive sono disponibili alcuni fonti per il recupero e nello specifico:
Fonte 4 luglio: Non disponibile
In allegato archivio con i tre file recuperati da InternetArchive relativi alle date 2020-07-16, 2020-10-17 e 2020-12-04.
Segnalo che in questo file:
https://github.com/ondata/covid19italia/blob/master/publication/riepilogoArchivio_storico.csv
Emilia Romagna
è presente in due modalità: con e senza trattino.
Emilia Romagna
Emialia-Romagna
per verificare, cercate Emilia
Abbiamo attivato l'archiviazione quotidiana di alcuni URL su web archive.
Rendere pubblica la lista, in modo che possa essere eventualmente arricchita da chi partecipa al progetto
non sono più raggiungibili INCR_DATE_PRV_TAMP_RL_v2 e TA_COVID19_RL
Questo bookmarklet, lanciato mentre viene visualizzata la pagina https://www.dep.lazio.it/covid/covid_map.php , aggiunge in fondo alla pagina stessa un'area di testo contenente tutti i dati dell'ultima schermata, quella con l'evoluzione temporale:
javascript:tb = document.createElement("textarea");tb.setAttribute("cols",200);tb.setAttribute("rows",20);dataSequence.forEach(element => tb.innerHTML += JSON.stringify(element.data) + "\n" ) ;intestazione = ""; for (i=0; i< Highcharts.charts[1].series[0].data.length; i++ ) { intestazione += Highcharts.charts[1].series[0].data[i].properties.name + "," ; } tb.innerHTML = intestazione + tb.innerHTML;document.body.appendChild(tb);
Altre volte funziona questo:
javascript: javascript:tb = document.createElement("textarea");tb.setAttribute("cols",200);tb.setAttribute("rows",20);dataSequence.forEach(element => tb.innerHTML += JSON.stringify(element.data) + "\n" ) ;intestazione = ""; for (i=0; i< Highcharts.charts[1].series[0].data.length; i++ ) { intestazione += Highcharts.charts[1].series[0].data[i].comune + "," ; } tb.innerHTML = intestazione + tb.innerHTML;document.body.appendChild(tb);
In forma leggibile:
tb = document.createElement("textarea");
tb.setAttribute("cols",200);
tb.setAttribute("rows",20);
dataSequence.forEach(element => tb.innerHTML += JSON.stringify(element.data) + "\n" ) ;
intestazione = "";
for (i=0; i< Highcharts.charts[1].series[0].data.length; i++ ) {
intestazione += Highcharts.charts[1].series[0].data[i].properties.name + "," ;
//intestazione += Highcharts.charts[1].series[0].data[i].comune + "," ; // oppure
}
tb.innerHTML = intestazione + tb.innerHTML;
document.body.appendChild(tb);
Ho notato che il dato il presente nel json in oggetto è parziale e riporta soltanto 2000 record. E' possibile effettuare lo scarico completo?
Ho provato a dare un occhio al programma .sh per lanciarlo in autonomia ma mi sa che mi manca qualche pezzo.
Davide
Describe the bug
Il file risulta corrotto, out of memory e quindi non si riesce ad utilizzare. Idem per il cdv che è fermo a 4 giorni fa.
Ciao,
l'idea è ottima, ovviamente. Non è il caso di aggregare gli sforzi di chi lo sta facendo in maniera sparsa, così da fare meno fatica tutti assieme? Sono incappato nel lavoro di Carlo Torniai e in quello di Davide Magno?
Così si rafforza il messaggio!
Matteo
Describe the bug
Aggiutna campo Dashboard ISS (sezione INIZIO)
ISS dal 7 dicembre ha aggiunto un dataset di sintomatici oltre a quello già esistente, per le ragioni ipotizzate qui:
https://twitter.com/OpencovidM/status/1336086146431000581
Risultato atteso
A partire dal file
https://github.com/ondata/covid19italia/blob/master/webservices/iss_epicentro/processing/2020-12-07_curvaEpidemicaInizio.csv
è necessari aggiungere una nuova colonna dal momento che ora i dataset sono tre.
in questa riga qualcosa non va:
Ciao a tutti,
ho fatto un piccolo lo progetto con c# per monitorare i numeri dell'ultima ondata
e mi sono accorto che il totale decessi giornalieri e uguale al totale decessi
I passi per riprodurlo:
Risultato atteso
due valori diversi
Altre informazioni
Ad esempio il sistema su cui si verifica.
Caro @patrunomeister ,
visto che alcuni dei nomi provincia pubblicati da Prot. Civ. sono errati, potresti inserire nello schema di output anche il codice ISTAT?
Lo trovi qui https://github.com/ondata/covid19italia/blob/master/publication/provinceArchivioISTAT.csv
Grazie
Ho associato il dato al codice comunale di uno shapefile di comuni, in modo da poter mappare il dato. Ve lo allego.
I due excel sono
Lo shapefile contiene i comuni lombardi al 2018, con il dato di vivi e morti (l'excel 2). Essendo solo i comuni lombardi, sono esclusi i pochi dati esterni, che comunque sono presenti nell'excel.
Folks, an important information that unfortunately is missing in most data sets is the total number of COVID-19 tests performed. Without this it is not entirely clear whether changes in numbers are due to increase in illnesses or more widespread testing. If one could find this information it would be highly valuable in determining the actual dynamics of the disease.
Segnalo questa dashboard della Lombardia. Ci sono dei dati interessanti.
Describe the bug
Il 30/03/2020 la Protezione Civile ha modificato la struttura dei csv pubblicati sul proprio github, aggiungendo una colonna e rinominandone altre 2, changelog qui: https://github.com/pcm-dpc/COVID-19/blob/master/CHANGELOG.md#2020-03-30. A causa di questa modifica, i dati restituiti dalle API presentano delle anomalie. Ad esempio i valori di "Totale Attualmente Positivi" risultano maggiori dei rispettivi "Totale Casi".
Come riprodurlo
Issue 1
I passi per riprodurla:
Issue 2
I passi per riprodurla:
Risultato atteso
Issue 1 -> Mi aspetto che Totale Attualmente positivi sia <= Totale Casi
Issue 2 -> Mi aspetto che i valori "Dimessi Guariti" siano "non decrescenti"
Il web service ha un limite a 2000 record di output, ma quelli possibili sono di più.
Abilitare il download completo
Ho visto che sul sito di Immuni c'è ora una dashboard con alcuni dati.
Si potrebbero estrarre quotidianamente i dati? Sulle notifiche inviate e gli utenti positivi infatti non c'è lo storico, come per l'altro.
https://www.immuni.italia.it/dashboard.html
Grazie per tutto il lavoro che fate.
File xlsx “COVID-19 ISS open data” (aggiornamento giornaliero)
https://www.epicentro.iss.it/coronavirus/open-data/covid_19-iss.xlsx
dati nazionali e script per il calcolo dell'Rt nazionale (zip 6 kb) (aggiornamento settimanale)
https://www.epicentro.iss.it/coronavirus/open-data/calcolo_rt_italia.zip
Sarebbe fantastico se riusciste a recuperare lo storico dei vari update via file dall'inizio per avere un archivio completo. Bel lavoro , molto utile!
Buongiorno e grazie mille per il vostro lavoro! Non sono esperto di github e spero di stare seguendo la procedura corretta. Seguo lo schema proposto da github per la segnalazione dei bug.
Descrizione del bug
Quando apro la mappa relativa ai dati di Regione Lombardia (https://github.com/ondata/covid19italia/blob/master/webservices/regioneLombardia/rawdata/ta_covid19_comuni_time.geojson), il numero dei casi presenti nel comune è correttamente indicato dal numero nel punto blu. Se clicco sul punto blu mi si apre una tenda con diverse informazione relative al comune. Il numero dei positivi, però, non coincide con quello nel punto blu visualizzato nella visione generale della mappa.
Come riprodurlo
I passi per riprodurlo:
Risultato atteso
Credo che il numero dei positivi dovrebbe coincidere nell'intenzione dei creatori della mappa.
Anche se non sono completi di tutte le info, ho "scrapato" i dati regionali fin da quando erano pubblicati solo tramite l'RSS del DPC.
Li trovi qui, se vuoi integrarli nel tuo riepilogo e riempire il buco spazio dal 24 Febbrario al 1 Marzo
https://github.com/alessiodl/COVID19Feed2Json/blob/master/storico/regioni.csv
Ciao, stavo guardando il file: https://raw.githubusercontent.com/ondata/covid19italia/master/publication/provinceArchivio.csv
Mi sembra scorretto che il numero per NAPOLI del 3 Marzo (30) sia più alto del numero del 4 Marzo (17), ho capito male qualcosa io?
Grazie per i CSV!
Per mia consultazione personale, importo il CSV automaticamente in un Google Sheets ogni giorno (https://docs.google.com/spreadsheets/d/1OaZic5DVNp-tgg2GMnQlQXaCB7r_KSdu2WuZiD8B3kg/edit#gid=1287960954), e ho calcolato la differenza dei contagi per provincia.
Quindi, ci ho costruito sopra una piccola dashboard: https://datastudio.google.com/s/pkXn62iU3rQ
See the README for web-archive links for data before March 2nd
Vedi il mio README per i link web "web-archive" per i dati prima del 2 marzo
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.