Giter Site home page Giter Site logo

robert-koch-institut / sars-cov-2-sequenzdaten_aus_deutschland Goto Github PK

View Code? Open in Web Editor NEW
67.0 6.0 7.0 10.22 GB

Das Robert Koch-Institut stellt Systeme zur bundesweiten molekularen Surveillance des SARS-CoV-2-Virus bereit. Jedes Labor in Deutschland, das SARS-CoV-2 sequenziert, ist laut der Verordnung zur molekulargenetischen Surveillance des Coronavirus SARS-CoV-2 verpflichtet, dem Robert Koch-Institut die Sequenz- und zugehörige Metadaten zu übermitteln.

Home Page: https://robert-koch-institut.github.io/SARS-CoV-2-Sequenzdaten_aus_Deutschland/

License: Creative Commons Attribution 4.0 International

covid-19 sars-cov-2 virusstrukturen genom basensequenz deutschland viral-structures genome base-sequence germany

sars-cov-2-sequenzdaten_aus_deutschland's Introduction

Datensatzdokumentation

SARS-CoV-2-Sequenzdaten aus Deutschland

Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin


Zitieren

Robert Koch-Institut (2024): SARS-CoV-2-Sequenzdaten aus Deutschland, Berlin: Zenodo. DOI: 10.5281/zenodo.11148093

Informationen zum Datensatz und Entstehungskontext

Ein zentraler Bestandteil einer erfolgreichen Erregersurveillance ist das Verständnis der Verbreitung eines Erregers sowie seiner pathogenen Eigenschaften. Hierbei stellt das Wissen über das Erregergenom eine wichtige Informationsquelle dar. So erlaubt der Nachweis von Mutationen im Genom eines Erregers, Verwandtschaftsbeziehungen zu rekonstruieren, Übertragungswege aufzudecken und Resistenzen vorherzusagen. Die Integrierte Genomische Surveillance (IGS) von SARS-CoV-2 zielt darauf ab, die Verbreitung des Virus und insbesondere von besorgniserregenden Virusvarianten in der Bevölkerung zu überwachen sowie auftretende Veränderungen des Virus genau zu beobachten. Besondere Bedeutung kommt dabei der öffentlichen Bereitstellung der genomischen Daten zu, um Wissenschaftlern in Deutschland und weltweit die Möglichkeit zu eigenständigen Analysen zu eröffnen.

Im Rahmen der Coronavirus-Surveillanceverordnung wurden bis zum 31.05.2023 SARS-CoV-2 Sequenzdaten aus ganz Deutschland über den Deutschen Elektronischen Sequenzdaten-Hub (DESH) an das RKI übermittelt. Mit Ablauf der Verordnung werden künftig Proben durch das IMSSC2 Labornetzwerk bereitgestellt und am RKI sequenziert, analysiert und hier bereitgestellt. Trotz reduzierter Probenanzahl, wird durch die sorgfältige Auswahl der beteiligten Labore ein repräsentativer Einblick in die Viruspopluation gesichert (Djin Ye Oh et al. 2022). Zusätzlich werden Sequenzen vom NRZ Coronaviren an der Charité beigetragen um das IMSSC2 Netzwerk zu ergänzen.

Administrative und organisatorische Angaben

Der Datensatz "SARS-CoV-2-Sequenzdaten aus Deutschland" wird vom Robert Koch-Institut für Forschungsarbeiten im Zusammenhang mit der SARS-CoV-2-Surveillance im IGS Projekt bereitgestellt.

Die Datenerhebung am RKI erfolgt mit Ablauf der Coronavirus-Surveillanceverordnung über das IMSSC2 Labornetzwerk unter der Leitung von FG 17 | Influenzaviren und weitere Viren des Respirationstraktes und durch das Nationale Referenzzentrum für Coronaviren.

Im Rahmen des IGS Projektes werden die produzierten Daten von MF1 | Genome Competence Centre bioinformatisch analysiert. Fragen bezüglich des Projektes können am besten an [email protected] gerichtet werden.

Die Koordinierung und Meldedatenerfassung wird von FG 36 | Respiratorisch übertragbare Erkrankungen durchgeführt.

Die Veröffentlichung der Daten, die Datenkuration sowie das Qualitätsmanagement der (Meta-)Daten erfolgen durch das Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement des RKI. Fragen zum Datenmanagement können an das Open Data Team des Fachgebiets MF4 gerichtet werden ([email protected]).

Datenerhebung

Das IMSSC2 Labornetzwerk besteht aus >20 labormedizinische Einrichtungen in 13 Bundesländern, die wöchentlich zufällig ausgewähltes SARS-CoV-2-positives Probenmaterial ans RKI senden. Hier erfolgt eine Ganzgenomsequenzierung sowie weiterführende phylogenetische und genombiologische Analysen, die eine Identifizierung der häufigsten in Deutschland zirkulierenden SARS-CoV-2 Linien ermöglicht. Die Ergebnisse werden auf der Webseite des RKI und in Fachzeitschriften zeitnah publiziert und tragen zur Bewertung der aktuellen epidemiologischen Lage von COVID-19 bei. Erweitert werden die IMSSC2 Daten durch Sequenzen, die durch das Nationales Konsiliarlaboratorium für Coronaviren erhoben werden. Die Daten aus beiden Quellen werden über GitHub und andere öffentliche Datenbanken der Öffentlichkeit zur Verfügung gestellt. Ebenfalls im Datensatz enthalten sind SARS-CoV-2 Sequenzdaten aus ganz Deutschland die bis zum 31.05.2023 über den Deutschen Elektronischen Sequenzdaten-Hub (DESH) an das RKI übermittelt wurden.

Zuordnung von Viruslinien (basierend auf Pangolin)

Die Zuordnung bekannter Viruslinien zu den erhobenen Sequenzen erfolgt mittels Pangolin. Mit Erscheinen einer neuen Version oder aktualisierter Liniendefinitionen von Pangolin erfolgt eine Neuzuordnung der Linieninformation für die gesamte Sequenzkollektion den gesamten Sequenzdatensatz. Die Informationen über die Lineage und die genutzte Pangolin Version befindet sich für jede Sequenz in den Metadaten.

Die bereitgestellten Informationen zu den Viruslinien entsprechen dem aktuellen PANGOLIN Lineage Format. Nur die Spalte "Taxon" wurde zur einfacherer Nachnutzung in SEQUENCE.ID umbenannt. Zentral für die Verknüpfung der Entwicklungslinien mit den weiteren Daten ist die SEQUENCE.ID, die in allen drei Daten enthalten ist. PANGOLIN Lineage Format ist bei Widersprüchen authoritativ.

Qualitätsmanagement

Die Daten, die durch DESH erhoben wurden, durchliefen die Qualitätskontrolle (QC) der IGS am RKI nach veröffentlichten Kriterien (siehe: https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/DESH/Qualitaetskriterien.pdf?__blob=publicationFile). Zusätzlich wird für alle Sequenzen, inklusive IMSSC2 Proben, eine bioinformatische QC der Sequenz mit PRESIDENT: PaiRwisE Sequence IDENtiTy durchgeführt mit einen Identitäts-Grenzwert von 70% und einen N-Grenzwert von 20%. Die Metadaten-QC überprüft die Metadaten auf fehlerhafte Daten und Eingaben, die die weitere Verarbeitung beeinflussen würden. Bei nicht bestehen der QC für Metadaten oder Sequenzdaten werden diese Daten nicht öffentlich bereitgestellt, um die hohe Qualität des öffentlichen Datensatzes zu gewährleisten.

Aufbau und Inhalt des Datensatzes

Der Datensatz umfasst genomische Sequenzen von SARS-CoV-2-Isolaten aus ganz Deutschland und zugehörige Metadaten. Im Datensatz enthalten sind:

SARS-CoV-2-Sequenzdaten

Die SARS-CoV-2-Sequenzdaten werden tagesaktuell im Hauptverzeichnis unter "SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz" bereitgestellt.

SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz

Struktur der Sequenzdaten

Die bereitgestellte Datei enthält Sequenzeinträge, die nach dem FASTA-Format strukturiert sind. In diesem Format beginnt jeder Eintrag mit einer kurzen Beschreibung, auch Kopfzeile oder "Description line" genannt. Diese Zeile wird durch ein ">"-Zeichen am Zeilenanfang gekennzeichnet. Nach der Kopfzeile folgt die Sequenz selbst, die eine Abfolge von Nukleinsäuren im IUB/IUPAC Format darstellt

Jede Sequenz endet mit dem Beginn eines neuen Sequenzeintrages, gekennzeichnet durch eine neue Kopfzeile, oder, im Falle des letzten Sequenzeintrages, mit dem Ende der Datei.

In den bereitgestellten Sequenzdaten entspricht die Kopfzeile der SEQUENCE.ID, was eine einfache Verknüpfung mit den bereitgestellten Metadaten erlaubt.

  • Kopfzeile: >IMS_ID
  • Nukleinsäuresequenz: IUB/IUPAC Standard

Daraus ergibt sich beispielhaft folgende Struktur einer .fasta-Datei:

>IMS-101XX-CVDP-XX
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACCAACCAACTTTCGATCTCTT...
>IMS-101YY-CVDP-YY
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACCAACTCTCGGCTGCATGCT...

Komprimierung der Sequenzdaten

Die SARS-CoV-2-Sequenzdaten werden als xz-komprimierte .fasta Datei bereitgestellt. Daraus ergibt sich die Dateiendung .fasta.xz. Es werden Linux Zeilenumbrüche verwendet.

  • Zeichensatz: UTF-8
  • Komprimierung: .xz
  • Enthaltenes Dateiformat: .fasta
  • Zeilenumbrüche: Linux Zeilenumbrüche

Die Dateien können auf gängigen Betriebssystemen, beispielsweise mit den Programmen 7zip oder XZ Utils, entpackt werden. Die Komprimierung wird vorgenommen, da insbesondere die .fasta-Dateien mehrere Gigabyte (GB) groß sind.

Sequenzmetadaten

Die Sequenzmetadaten werden in der "SARS-CoV-2-Sequenzdaten_Deutschland.tsv.xz" bereitgestellt. Diese Daten enthalten ebenfalls die zugeordneten Viruslinien.

SARS-CoV-2-Sequenzdaten_Deutschland.tsv.xz

Variablen und Werte

In den als .tsv bereitgestellten Metadaten sind die in folgender Tabelle aufgeführte Variablen als Spalten enthalten. Zentral für die Verknüpfung der Metadaten mit den Genomsequenzen ist die SEQUENCE.ID, die in allen drei Daten enthalten ist.

Variable Typ Ausprägungen Beschreibung
SEQUENCE.ID String Ein eindeutiger Identifikator der Sequenzdaten und Metadaten zusammenführt. Dieser Identifikator wird als FASTA ID in den Sequenzdaten genutzt
SEQUENCE. DATE_OF_SAMPLING Date JJJJ-MM-TT Datum der Probeentnahme im ISO 8601 Format
SEQUENCE. SEQUENCING_METHOD String siehe ena Die verwendete Sequenzierungs-Plattform auf Basis der von ENA zugelassenen Ontologie
SEQUENCE. SEQUENCING_REASON String X,N,Y,A Grund für die Durchführung der Sequenzierung
X: Dem sequenzierenden Labor unbekannt
N: Zufällige Auswahl einer in der PCR positiven Probe zur Sequenzierung
Y: Die Art der Mutation bzw. Variante ist (dem sequenzierenden Labor) unbekannt
A: Es besteht aus der vorherigen Diagnostik Verdacht auf die Mutation/Variante
SEQUENCE. SAMPLE_TYPE String s001, s002, ..., s025, X s001 - s025: Art der Probe
X: Unbekannt (dem sequenzierenden Labor)
SEQUENCE. SEQUENCING_ LAB_SAMPLE_ID String Vom Labor genutzte FASTA ID in verschlüsselter Form
SEQUENCE. PUSHED_TO_DWH Timestamp JJJJ-MM-TT hh:mm:ss +TZ Eingang am RKI
SEQUENCE.VERSION String Version der Sequenz
DL.ID String Identifikationsnummer des primärdiagnostischen Labors (DL)
DL. POSTAL_CODE String Postleitzahl des primärdiagnostischen Labors (DL)
SL.ID String Identifikationsnummer des sequenzierenden Labors (SL)
SL. POSTAL_CODE String Postleitzahl des sequenzierenden Labors (SL)
PANGOLIN. LINEAGE_LATEST String Pangolin Lineage
PANGOLIN. PANGOLIN_VERSION _LATEST String Für die Lineage-Zuordnung verwendete Pangolin Version

Formatierung der Sequenzmetadaten

Die Sequenzmetadaten werden als xz-komprimierte, kommaseparierte .csv-Datei bereitgestellt. Daraus ergibt sich die Dateiendung .csv.xz. Der verwendete Zeichensatz der .csv-Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",". Datumsangaben sind im ISO-8601-Standard formatiert.

  • Zeichensatz: UTF-8
  • Datumsformat: ISO 8601
  • Komprimierung: .xz
  • Enthaltenes Dateiformat: .tsv
  • .csv-Trennzeichen: Tab "\t"

Die Dateien können auf gängigen Betriebssystemen, beispielsweise mit den Programmen 7zip oder XZ Utils, entpackt werden. Die Komprimierung wird vorgenommen, da insbesondere die .fasta-Dateien mehrere Gigabyte (GB) groß sind.

Metadaten

Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadaten-Ordner hinterlegt:

Metadaten/

Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.

Metadaten/zenodo.json

In der zenodo.json ist neben der Publikationsdatum ("publication_date") auch der Datenstand enthalten:

  "dates": [
    {
      "start": "2023-09-11T15:00:21+02:00",
      "end": "2023-09-11T15:00:21+02:00",
      "type": "Collected",
      "description": "Date when the Dataset was created"
    }
  ],

Hinweise zur Nachnutzung der Daten

Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:

Lizenz

Der Datensatz "SARS-CoV-2-Sequenzdaten aus Deutschland" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY .

Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.

sars-cov-2-sequenzdaten_aus_deutschland's People

Contributors

hanneswuensche avatar rkigithubbot avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar

sars-cov-2-sequenzdaten_aus_deutschland's Issues

Fehlende Sequenz-/Metadaten (csv/fasta) Uploads ab 2022-09-27

Hi,

zur Info:
Letztes erfolgreiches Update war am Montag, den 26.09., seitdem gab es nachts/abends keine SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz bzw .csv.xz Uploads mehr (auch keine zugehörige zenodo Metadata, analog #36 von letzter Woche.

Viele Grüße
David

Archivordner fehlt im Repository

Im README wird ein Archivordner genannt und dessen Aufbau beschrieben.

Im Archivordner sind die täglichen Datenstände unter den Dateinamen
"JJJJ-MM-TT_SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz" und
"JJJJ-MM-TT_SARS-CoV-2-Sequenzdaten_Deutschland.csv.xz" abgelegt.

Dieser Ordner ist im Repository aber nicht enthalten. Er sollte vorzugsweise auch zur Verfügung gestellt werden oder alternativ die Readme.md Datei angepasst werden.

Documentation: Mention "Entwicklungslinien" file in README

Thanks a lot for publishing all these data to Github, that's amazing! In particular, it's remarkable how quick your turnaround time is, saving a lot of time with respect to GISAID.

One thing that could be improved is mentioning the pango assignment file in the README.

It's very valuable but not very discoverable at the moment. I stumbled upon it only by chance, and others spent a lot of time running sequences through pangolin because they themselves didn't know about that file's existence either.

Keine bzw. unvollständige tägliche Updates

Hi, zur Info:
SARS-CoV-2-Sequenzdaten_Deutschland.csv.xz bzw *.fasta.xz sind seit Stand 2022-02-18 nicht mehr aktualisiert worden, während Entwicklungslinien weiter Updates erhalten hatte.

Zuordnung zwischen IMS_ID und GISAID Accession

Sequenzen bei GISAID werden über ihren "Virus name" (z.B. Germany/NW-RKI-I-592489/2022) und ihre Accession (z.B. EPI_ISL_10910370) identifiziert, während sie in diesem Datensatz eine IMS_ID wie z.B. IMS-10294-CVDP-48D4B4C1-58D3-4C97-A368-7EBB8E5D1989 haben.

Ich sehe derzeit keinen Weg, wie die verschiedenen IDs derselben Sequenz einander zugeordnet werden können, was die Kommunikation zwischen Wissenschafter_innen, die primär auf den RKI-Daten arbeiten, und denen, die auf den globalen GISAID-Daten arbeiten, erschwert.

Da es für mich nicht so aussieht, als würden die IDs nach einem einfachen (mathematischen) Prinzip auseinander abgeleitet werden, müsste vermutlich in der SARS-CoV-2-Sequenzdaten_Deutschland.csv(.xz) eine bzw. zwei weitere Spalte(n) eingeführt werden, in der die GISAID ID(s) nachgetragen werden, sobald die Sequenzen auch dort verfügbar sind?

Sequences from BY-LGL are all frame shifted due to `-` being `N` in S:69/70del

Reviewing latest submissions on GISAID I noticed that a batch of sequences from BY-LGL seems to have a bioinformatics error:

Almost all sequences are frame shifted in S1 after S:70 due to there being 5 deleted nucleotides and 1 N nucleotide.

The 1 N is the problem, it should be a deletion so that there is no frameshift. Thanks!

See screenshots:
image

image

Diverse BA.2 and BA.5 sequences with spurious T11524C and A11537G -- primer trimming?

I have noticed a pattern, almost exclusively in RKI sequences (but also in a few sequences from the Netherlands and France), of T11524C and A11537G occurring together in many different branches and sub-lineages of BA.2 and BA.5. It seems unlikely that those two mutations would co-occur dozens of times in sequences from many different lineages of BA.2 and BA.5. I collected some examples of what this looks like in a phylogenetic tree in a comment in cov-lineages/pango-designation#841. Then @JosetteSchoenma replied that this problem had been seen also in the Netherlands, but @JordyCoolen fixed it in JordyCoolen/easyseq_covid19@e241231 by adjusting a primer trimming region to start at 11520 instead of 11525.

I am hopeful that a similar fix would remove the spurious T11524C + A11537G calls in so many RKI sequences. I don't have a list of affected sequences, but could make one if that would help. A few examples:

BA.5.1:
Germany/NW-RKI-I-869542/2022 EPI_ISL_13382739
Germany/NI-RKI-I-869485/2022 EPI_ISL_13382683
Germany/NW-RKI-I-845428/2022 EPI_ISL_13239109

BA.5.2.1:
Germany/NW-RKI-I-835345/2022 EPI_ISL_13033644
Germany/NW-RKI-I-848455/2022 EPI_ISL_13241301
Germany/NW-RKI-I-799266/2022 EPI_ISL_12739153

BA.5.3.2:
Germany/SH-RKI-I-784836/2022 EPI_ISL_12674661
Germany/SH-RKI-I-823299/2022 EPI_ISL_13001607
Germany/NW-RKI-I-739643/2022 EPI_ISL_12346538

BA.2.36:
Germany/BW-RKI-I-835322/2022 EPI_ISL_13033622
Germany/SN-RKI-I-723436/2022 EPI_ISL_12192631
Germany/NW-RKI-I-690722/2022 EPI_ISL_11818175

BA.2:
Germany/BW-RKI-I-542774/2022 EPI_ISL_10032437
Germany/BW-RKI-I-542785/2022 EPI_ISL_10032456
Germany/NW-RKI-I-845418/2022 EPI_ISL_13239099

BA.2.9:
Germany/NW-RKI-I-614789/2022 EPI_ISL_11455600
Germany/NW-RKI-I-637027/2022 EPI_ISL_11480485
Germany/NW-RKI-I-644150/2022 EPI_ISL_11591637

A11537G belongs in BA.1 -- but T11524C seems to occur independently many times in the BA.1 branches of the UCSC/UShER tree as well. So this probably affects all Omicron sequences.

Thanks!

Fehlende Sequenzdaten (csv/fasta) Uploads ab 2022-09-19

Hi,

zur Info:
seit 2 Tagen gibt es nachts keine SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz / *.csv.xz Uploads mehr (auch kein zenodo Metadata, analog #34).

Viele Grüße
David

P.S.
Hat der Fix von #35 vielleicht damit was zu tun, oder nur zufällig zeitgleich?

Diverse BA.2 and BA.5 sequences with spurious T11524C and A11537G -- primer trimming?

I have noticed a pattern, almost exclusively in RKI sequences (but also in a few sequences from the Netherlands and France), of T11524C and A11537G occurring together in many different branches and sub-lineages of BA.2 and BA.5. It seems unlikely that those two mutations would co-occur dozens of times in sequences from many different lineages of BA.2 and BA.5. I collected some examples of what this looks like in a phylogenetic tree in a comment in cov-lineages/pango-designation#841. Then @JosetteSchoenma replied that this problem had been seen also in the Netherlands, but @JordyCoolen fixed it in JordyCoolen/easyseq_covid19@e241231 by adjusting a primer trimming region to start at 11520 instead of 11525.

I am hopeful that a similar fix would remove the spurious T11524C + A11537G calls in so many RKI sequences. I don't have a list of affected sequences, but could make one if that would help. A few examples:

BA.5.1:
Germany/NW-RKI-I-869542/2022 EPI_ISL_13382739
Germany/NI-RKI-I-869485/2022 EPI_ISL_13382683
Germany/NW-RKI-I-845428/2022 EPI_ISL_13239109

BA.5.2.1:
Germany/NW-RKI-I-835345/2022 EPI_ISL_13033644
Germany/NW-RKI-I-848455/2022 EPI_ISL_13241301
Germany/NW-RKI-I-799266/2022 EPI_ISL_12739153

BA.5.3.2:
Germany/SH-RKI-I-784836/2022 EPI_ISL_12674661
Germany/SH-RKI-I-823299/2022 EPI_ISL_13001607
Germany/NW-RKI-I-739643/2022 EPI_ISL_12346538

BA.2.36:
Germany/BW-RKI-I-835322/2022 EPI_ISL_13033622
Germany/SN-RKI-I-723436/2022 EPI_ISL_12192631
Germany/NW-RKI-I-690722/2022 EPI_ISL_11818175

BA.2:
Germany/BW-RKI-I-542774/2022 EPI_ISL_10032437
Germany/BW-RKI-I-542785/2022 EPI_ISL_10032456
Germany/NW-RKI-I-845418/2022 EPI_ISL_13239099

BA.2.9:
Germany/NW-RKI-I-614789/2022 EPI_ISL_11455600
Germany/NW-RKI-I-637027/2022 EPI_ISL_11480485
Germany/NW-RKI-I-644150/2022 EPI_ISL_11591637

A11537G belongs in BA.1 -- but T11524C seems to occur independently many times in the BA.1 branches of the UCSC/UShER tree as well. So this probably affects all Omicron sequences.

Thanks!

formatting error in date

In today's version of SARS-CoV-2-Sequenzdaten_Deutschland.csv.xz

in line 408310, date is incorrectly formatted as 2021-12sss-02.

Using nextclade for pango lineage classification

Hi all.

The pangolearn release cycles have been slow in the past months for unknown reasons. That's despite a number of fast growing lineages emerging, such as BQ.1, BQ.1.1, XBB or BA.2.3.20.

This is of course problematic as the data released here for Germany doesn't report these variants and suggests, at face value, that none of them were found -- even though BQ.1.1 may already have crossed the 1% mark.

image

I was therefore wondering whether it would be possible to also provide nextclade lineage assignments as a secondary line of annotation. The underlying reference annotation appears to be updated more regularly.

Thanks,

Moritz

missing tags

There are tags missing for some daily updates. This causes problems when iterating over the tags as suggested in #4 (comment)

Iterating over the commits is fuzzy, as not all commits are daily updates.

I suggest to add the missing tags.

Problem visible by:
See git tag --oneline.
head of today's output:

e5d1b93 (HEAD -> master, origin/master, origin/HEAD) Update 2022-02-27
478dfd9 (tag: 2022-02-26) Update 2022-02-26
6d4ac05 Update 2022-02-26
004b86d (tag: 2022-02-25) Update 2022-02-25
5018068 Update 2022-02-25
94dbeb7 (tag: 2022-02-24) Update 2022-02-24
33e9141 (tag: 2022-02-23) Update 2022-02-23
51df27c Update 2022-02-24
2349a9f (tag: 2022-02-22) Update 2022-02-22
384078e (tag: 2022-02-21) Update 2022-02-21
229f429 Update 2022-02-22
7a3eefe Update 2022-02-21
4e9fc0e Update 2022-02-20
75bf364 Update 2022-02-19
ce1a8a4 (tag: 2022-02-18) Update 2022-02-18
58631b6 Update 2022-02-18
b3d0a09 (tag: 2022-02-17) Update 2022-02-17
b8efe07 Update 2022-02-17
af9ac14 (tag: 2022-02-16) Update 2022-02-16
e39ca1d Update 2022-02-16
005f3fb (tag: 2022-02-15) Update 2022-02-15
5b7b6cc Update 2022-02-15
aae0c7d (tag: 2022-02-14) Update 2022-02-14
ba1a5e2 Update 2022-02-14
b5f9ceb (tag: 2022-02-13) Update 2022-02-13
458224a Update 2022-02-13
9dd62f8 (tag: 2022-02-12) Update 2022-02-12
1a8e56e Update 2022-02-12
4c85b7c (tag: 2022-02-11) Update 2022-02-11
b667db9 (tag: 2022-02-10) Update 2022-02-11
a46ae6d Update 2022-02-11
42ffa28 Update 2022-02-10
7c15c4d (tag: 2022-02-09) Update 2022-02-09
00d73dd (tag: 2022-02-08) Update 2022-02-08
8dc9e6d Update 2022-02-09
5dd7c01 (tag: 2022-02-07) Update 2022-02-07
607ec85 Update 2022-02-08
6bc1d8c (tag: 2022-02-06) Update 2022-02-06
776e345 Update 2022-02-07
c9de9ca Update 2022-02-06

Last update to ENA/Genbank seems to have been 6 weeks ago

I've noticed that the last update to ENA/Genbank seems to have been about 6 weeks ago. Before then, you seem to have uploaded regularly to ENA. Is this on purpose?

It's a big advantage to have German sequences available freely. That way, they can appear in open.cov-spectrum.org for example, which allows for a nice integration with Nextclade.

For sequences that are available through GISAID only, that's unfortuantely not possible.

Thanks for your work!

README contains unclear explanation for meaning of SEQUENCING_REASON field

Responding to this question GenSpectrum/LAPIS#328 (comment), I noticed that the explanation of the sequencing reason appears to not be entirely clear:

For example: X (dem sequenzierenden Labor) doesn't make sense by itself, it might be that an unbekannt is missing

Also: "Grund für die Sequenzierung" appears not to match well with "Ja/Nein", maybe it is meant to say something like: "Targeted sequencing?" then "Ja/Nein" would make more sense:

image

Submission date lost for many sequences: SEQUENCE.PUSHED_TO_DWH empty for 1.099m out of 1.228m rows

It appears that when moving from old to new metadata format you lost the sequence submission date for most sequences in SARS-CoV-2-Sequenzdaten_Deutschland.tsv.xz

Would it be possible to backfill those that have an empty string with the entry from either "RECEIVE_DATE" or "PROCESSING_DATE" of the previous metadata file?

This is the breakdown of the column at the moment:

$ xzcat ~/Downloads/SARS-CoV-2-Sequenzdaten_Deutschland.tsv.xz| tsv-summarize -H -g 'SEQUENCE.PUSHED_TO_DWH' --count       
SEQUENCE.PUSHED_TO_DWH  count
                                1099003
2022-10-24 09:37:39 +0200       1
2022-10-24 18:48:03 +0200       1491
2022-10-24 18:45:15 +0200       1
2022-10-26 18:55:12 +0200       1666
2022-10-26 18:52:19 +0200       1
2022-10-26 18:55:14 +0200       574
2022-10-26 18:55:13 +0200       71
< --- snip --- >
2023-07-03 18:14:07 +0200       1
2023-06-30 11:40:32 +0200       21
2023-06-30 11:37:43 +0200       1
2023-07-06 14:33:27 +0200       17
2023-07-06 14:30:20 +0200       1

Pipeline scheint wieder zu hängen

Hi,

zwar gab es heute ein zenodo-Update, aber das letzte FASTA/Sample-CSV-Update war am Mittwoch abend (2022-10-18) und das der Entwicklungslinien am Freitag morgen (2022-10-14).

Viele Grüße
David

P.S.
Gestern abend kam dann ein Update, das enthielt aber nur 499 neue Sequenzen vom Mittwoch:
Figure 2022-10-17 074536_B

Updates fehlen/Pipeline scheint zu hängen

Guten Morgen,

es scheint wieder ein Problem mit der Pipeline zu bestehen:

  • Gestern morgen wurde nur die ".zenodo.json" aktualisiert, aber die "SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz" nicht
  • Das Update der "SARS-CoV-2-Sequenzdaten_Deutschland.*.xz" nach 22 Uhr fiel auch aus
  • Heute morgen bisher auch kein Update

Viele Grüße
David

Einige Labore scheinen falsch zu randomisieren, entweder zu viel oder zu wenig Omikron in `REASON=N`

Bei einer hierarchischen Analyse der Omikronausbreitung ist mir aufgefallen, dass es (mit Sicherheit) 3 Labore gibt die einen unmöglich hohen Omikron-Anteil in den angeblich repräsentativen Surveillance-Proben (markiert mit Grund N) hochladen.

Es handelt sich um Labore mit den SENDING_PC:

  • 70193 (offenbar Labor Enders)
  • 22767 (unklar welches Labor, Google zeigt keins)
  • 24106 (offenbar Labor Krause)

Meine Vermutung ist, dass diese Labore Varianten-PCRs machen und dann aus Versehen den falschen Grund angeben.

Wenn man sich die Submissions der genannten Labore ansieht wurden da in letzter Zeit fast nur Omikrons übermittelt, und zwar in einem Maße das sehr inkonsistent ist mit dem Omikron-Anteil aller anderer deutschen Labore, siehe Plot unten.

Es gibt auch Labore, die möglicherweise zu wenige Omikrons ausweisen. Ein möglicher Mechanismus der dies begründen könnte:

  1. Labore führen eine Varianten-PCR durch
  2. Positive Proben werden als Verdachtsgrund sequenziert (mit A oder Y)
  3. Aus den restlichen Proben werden Proben für die repräsentative Surveillance gezogen, dann mit N gelabelt.

Es ist klar, dass so die Randomisierung/Repräsentativität verletzt wird.

Es ist schwierig zu beweisen, dass dieser Fehler von manchen Laboren begangen wird aber ich kann es mir durchaus vorstellen.

Labore bei denen der Verdacht besteht sind auch im Plot unten identifizierbar, es handelt sich um Labore mit hohem Outlierness-Score und niedrigem Omikron-Anteil. Also relativ weit oben im Plot und im rechten Plot auf der linken Seite.

Wie zum Beispiel die Labore mit PLZ:

  • 37077
  • 56068
  • 21079
  • 74072

Diese Labore haben viele Sequenzen übermittelt aber (fast) keine (zu wenige) Omikrons.

Es würde sich wahrscheinlich lohnen, mal bei den genannten Laboren nachzufragen, ob sie möglicherweise die Instruktionen missverstanden haben.

image

Fehlklassifizierungen von BA.4/5 Sequenzen durch Scorpio als "BA.2-like" führt zu vielen "Unassigned" oder "BA.2" Zuweisungen

Hi,

zur Info:
Viele BA.5 Sequenzen werden seit einer Weile von Scorpio nicht mehr erkannt und als Omicron (BA.2-like) eingestuft*) das in der SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz zu Unassigned oder BA.2 Klassifizierungen führt.

Siehe auch

Als Workaround (bis das Problem beseitigt ist) wird zu "--skip-scorpio" geraten.

*) Auch ersichtlich durch die vielen note Einträge ala "BA.5(2/2); scorpio replaced lineage inference BA.5"

Viele Grüße
David

Kontaktdaten der Labore zugänglich machen?

Es scheint mir, dass die Information, welches Labor eine Probe sequenziert hat, nur indirekt vorhanden ist, durch die DEMIS-Lab-ID als Teil der IMS-ID jeder Sequenz, und durch die Angabe der Postleitzahl.

Die Zuordnung von DEMIS-Lab-ID zur tatsächlichen Bezeichnung des Labors (z.B. Name, Adresse, Kontaktmöglichkeit) konnte ich weder in diesem Repository, noch sonst irgendwo online finden.

Ist diese Information absichtlich "geheim", oder dürfte sie prinzipiell öffentlich sein oder ist es bereits? Fall möglich, möchte ich darum bitten, die Zuordnung zu veröffentlichen oder mitzuteilen, wo sie bereits öffentlich ist.

Hintergrund meiner Frage

Wenn eine spezifische Sequenz beachtenswert erscheint (z.B. da sie vermutlich eine bisher unbekannte Rekombinante darstellt) kann es nötig sein, weitere Informationen dazu einzuholen. Das könnten z.B. die "Raw Reads" sein, um echte Rekombinanten von Konterminationen oder Doppelinfektionen zu unterscheiden. Soweit ich weiß, sind diese nicht auf GitHub bzw. im Sequenzdatenhub gesammelt, sondern liegen nur dem sequenzierenden Labor vor.

Bei Sequenzen, die auf GISAID veröffentlich werden, liegen die Kontaktdaten der Labore vor und werden von Wissenschafter_innen u.A. zu genau diesem Zweck genutzt.

Bei Sequenzen, die nur hier vorliegen, aber (noch) nicht auf GISAID, oder für Menschen ohne GISAID-Zugang, ist es somit unmöglich, das Labor zu kontaktieren.

implausible Omicron classification

I see a number of sequences from 2020 and early 2021 classified as Omicron. This does not look plausible to me. May this be related to #9 and the result of a variant PCR?

Data in question:

date_draw IMS_ID lineage scorpio_call sequencing_lab_pc  1 sending_lab_pc seq_type  
2021-03-17 IMS-10013-CVDP-BD31B70A-5B53-4588-B22A-E40EE489E32... BA.1.1   4779 73035 ILLUMINA
2021-03-10 IMS-10013-CVDP-7B4A9C47-3B1B-4F3A-85BC-94B4DA5FEB2... BA.1.1   4779 95448 ILLUMINA
2021-01-04 IMS-10013-CVDP-B219DF48-6F4F-4A17-B19D-98DC45AF974... BA.1.1 Omicron (BA.1-like) 4779 4779 ILLUMINA
2021-04-02 IMS-10013-CVDP-4D759CD1-2209-41DE-980C-E98F38D54BA... BA.1.1   4779 28357 ILLUMINA
2021-03-11 IMS-10013-CVDP-333514E8-FCA9-49A4-BCE2-6F58419756B... BA.1.1   4779 95448 ILLUMINA
2021-03-25 IMS-10013-CVDP-EB74C98E-815A-445E-AB76-8C659BE07B3... BA.1.1   4779 28357 ILLUMINA
2021-03-03 IMS-10013-CVDP-035CC7B7-2FCA-4831-8089-3937D681718... BA.1.1   4779 66386 ILLUMINA
2020-12-26 IMS-10013-CVDP-D91BBF83-C15E-4280-825F-26E4B301A2F... BA.1 Omicron (BA.1-like) 4779 28357 ILLUMINA
2021-04-16 IMS-10013-CVDP-4EFD6A2A-4346-433F-8D2C-A2AEC01E1E0... BA.1.1   4779 86154 ILLUMINA
2021-03-10 IMS-10013-CVDP-6D3F28AF-44EA-4BA8-B0D6-308DAD2E4CC... BA.1.1   4779 95448 ILLUMINA
2021-03-24 IMS-10013-CVDP-5E19AFA5-5AC8-4812-AD7D-C1B6F7ABD87... BA.1.1   4779 86154 ILLUMINA
2021-03-05 IMS-10013-CVDP-5FD87A5E-FAEA-43C1-B41E-D5F0BF2E0F8... BA.1.1   4779 81737 ILLUMINA
2020-12-22 IMS-10013-CVDP-652AEF69-8797-4473-9730-40C8422356E... BA.1 Omicron (BA.1-like) 4779 28357 ILLUMINA
2021-05-03 IMS-10013-CVDP-D1C0DC48-97F7-483D-9248-05CCD4DCB36... BA.1.1   4779 4779 ILLUMINA
2021-03-04 IMS-10013-CVDP-4528BCA3-144F-47DB-BF9E-CCB3D373C74... BA.1.1   4779 1665 ILLUMINA
2021-02-19 IMS-10013-CVDP-F6D01735-2811-4A43-9656-F8AF4506AD0... BA.1.1   4779 81737 ILLUMINA
2021-03-10 IMS-10013-CVDP-9BE8CEF8-0042-48FE-B796-3475C6AA707... BA.1.1   4779 95448 ILLUMINA
2021-06-08 IMS-10013-CVDP-536E691D-7DA2-4D70-BE14-0C512D8DBB0... BA.1.1   4779 4779 ILLUMINA
2021-03-17 IMS-10013-CVDP-8D6464EE-0C90-48B8-8976-13714B74F79... BA.1.1   4779 86154 ILLUMINA
2021-03-11 IMS-10013-CVDP-7EA8A3B8-F7CF-4422-B96A-91B02ECA4CE... BA.1.1   4779 4779 ILLUMINA
2021-03-23 IMS-10013-CVDP-DABBDE37-F49C-4F25-B604-7DF183E3661... BA.1.1   4779 4779 ILLUMINA
2021-03-10 IMS-10013-CVDP-4FA094F7-E334-41F7-87F5-38A42C2F478... BA.1.1   4779 1665 ILLUMINA
2021-09-02 IMS-10013-CVDP-3445725E-9F15-4E2D-A4E4-F23949A8FEB... BA.1.1   4779 4779 ILLUMINA
2021-04-03 IMS-10004-CVDP-33332ED0-2EB6-42F6-9FDD-166D0C19CAD... BA.1.1   21502 21502 ILLUMINA
2021-01-01 IMS-10061-CVDP-D28E7308-BDB2-47C6-ABD9-A26778807F4... BA.1.1 Probable Omicron (BA.1-like) 30159 30159 ILLUMINA

Sudden increase in artefactual mutations in sequences from Germany

I've noticed that around 30% of German sequences submitted to GISAID from Germany via RKI suddenly have spurious mutations:

  • G7160T
  • G1296T

And often also a few of the following:

  • T27138A
  • T27132A
  • A18585G
  • T6928A

Given that the pair of G7160T and G1296T appeared all of a sudden, only in Germany and across a large number of lineages/clades, it is almost certain that these are fake mutations.

Could you look into what gave rise to these? Maybe someone changed primers and the primers are incorrectly trimmed?

Here is a list of suspicious sequences:

hCoV-19/Germany/NW-RKI-I-1095803/2023|EPI_ISL_16812883|2023-01-16
hCoV-19/Germany/MV-RKI-I-1105548/2023|EPI_ISL_16940929|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105549/2023|EPI_ISL_16940930|2023-02-05
hCoV-19/Germany/MV-RKI-I-1105550/2023|EPI_ISL_16940931|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105552/2023|EPI_ISL_16940933|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105553/2023|EPI_ISL_16940934|2023-02-06
hCoV-19/Germany/SN-RKI-I-1105555/2023|EPI_ISL_16940935|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105556/2023|EPI_ISL_16940936|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105557/2023|EPI_ISL_16940937|2023-02-07
hCoV-19/Germany/SN-RKI-I-1105558/2023|EPI_ISL_16940938|2023-02-02
hCoV-19/Germany/SN-RKI-I-1105559/2023|EPI_ISL_16940939|2023-02-02
hCoV-19/Germany/MV-RKI-I-1105560/2023|EPI_ISL_16940940|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105561/2023|EPI_ISL_16940941|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105563/2023|EPI_ISL_16940943|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105565/2023|EPI_ISL_16940944|2023-02-06
hCoV-19/Germany/MV-RKI-I-1105566/2023|EPI_ISL_16940945|2023-02-02
hCoV-19/Germany/SN-RKI-I-1105568/2023|EPI_ISL_16940947|2023-02-02
hCoV-19/Germany/MV-RKI-I-1105569/2023|EPI_ISL_16940948|2023-02-01
hCoV-19/Germany/SN-RKI-I-1105571/2023|EPI_ISL_16940950|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105572/2023|EPI_ISL_16940951|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105574/2023|EPI_ISL_16940953|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105575/2023|EPI_ISL_16940954|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105576/2023|EPI_ISL_16940955|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105577/2023|EPI_ISL_16940956|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105578/2023|EPI_ISL_16940957|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105579/2023|EPI_ISL_16940958|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105580/2023|EPI_ISL_16940959|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105581/2023|EPI_ISL_16940960|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105582/2023|EPI_ISL_16940961|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105585/2023|EPI_ISL_16940964|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105586/2023|EPI_ISL_16940965|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105587/2023|EPI_ISL_16940966|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105588/2023|EPI_ISL_16940967|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105589/2023|EPI_ISL_16940968|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105590/2023|EPI_ISL_16940969|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105591/2023|EPI_ISL_16940970|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105592/2023|EPI_ISL_16940971|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105593/2023|EPI_ISL_16940972|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105595/2023|EPI_ISL_16940974|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105596/2023|EPI_ISL_16940975|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105597/2023|EPI_ISL_16940976|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105599/2023|EPI_ISL_16940978|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105600/2023|EPI_ISL_16940979|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105602/2023|EPI_ISL_16940981|2023-02-01
hCoV-19/Germany/MV-RKI-I-1105603/2023|EPI_ISL_16940982|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105604/2023|EPI_ISL_16940983|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105606/2023|EPI_ISL_16940985|2023-02-02
hCoV-19/Germany/MV-RKI-I-1105607/2023|EPI_ISL_16940986|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105608/2023|EPI_ISL_16940987|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105609/2023|EPI_ISL_16940988|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105610/2023|EPI_ISL_16940989|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105611/2023|EPI_ISL_16940990|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105612/2023|EPI_ISL_16940991|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105613/2023|EPI_ISL_16940992|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105614/2023|EPI_ISL_16940993|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105615/2023|EPI_ISL_16940994|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105618/2023|EPI_ISL_16940997|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105620/2023|EPI_ISL_16940999|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105621/2023|EPI_ISL_16941000|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105622/2023|EPI_ISL_16941001|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105623/2023|EPI_ISL_16941002|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105624/2023|EPI_ISL_16941003|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105625/2023|EPI_ISL_16941004|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105627/2023|EPI_ISL_16941006|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105630/2023|EPI_ISL_16941009|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105631/2023|EPI_ISL_16941010|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105676/2023|EPI_ISL_16941054|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105678/2023|EPI_ISL_16941056|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105681/2023|EPI_ISL_16941059|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105683/2023|EPI_ISL_16941061|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105684/2023|EPI_ISL_16941062|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105685/2023|EPI_ISL_16941063|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105686/2023|EPI_ISL_16941064|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105687/2023|EPI_ISL_16941065|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105688/2023|EPI_ISL_16941066|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105689/2023|EPI_ISL_16941067|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105690/2023|EPI_ISL_16941068|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105691/2023|EPI_ISL_16941069|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105692/2023|EPI_ISL_16941070|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105693/2023|EPI_ISL_16941071|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105694/2023|EPI_ISL_16941072|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105695/2023|EPI_ISL_16941073|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105697/2023|EPI_ISL_16941075|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105698/2023|EPI_ISL_16941076|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105699/2023|EPI_ISL_16941077|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105700/2023|EPI_ISL_16941078|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105701/2023|EPI_ISL_16941079|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105702/2023|EPI_ISL_16941080|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105703/2023|EPI_ISL_16941081|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105704/2023|EPI_ISL_16941082|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105705/2023|EPI_ISL_16941083|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105706/2023|EPI_ISL_16941084|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105707/2023|EPI_ISL_16941085|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105708/2023|EPI_ISL_16941086|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105709/2023|EPI_ISL_16941087|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105710/2023|EPI_ISL_16941088|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105711/2023|EPI_ISL_16941089|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105712/2023|EPI_ISL_16941090|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105713/2023|EPI_ISL_16941091|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105714/2023|EPI_ISL_16941092|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105715/2023|EPI_ISL_16941093|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105716/2023|EPI_ISL_16941094|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105717/2023|EPI_ISL_16941095|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105718/2023|EPI_ISL_16941096|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105719/2023|EPI_ISL_16941097|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105720/2023|EPI_ISL_16941098|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105723/2023|EPI_ISL_16941101|2023-02-02
hCoV-19/Germany/BY-RKI-I-1105724/2023|EPI_ISL_16941102|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105725/2023|EPI_ISL_16941103|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105726/2023|EPI_ISL_16941104|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105727/2023|EPI_ISL_16941105|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105728/2023|EPI_ISL_16941106|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105729/2023|EPI_ISL_16941107|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105730/2023|EPI_ISL_16941108|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105731/2023|EPI_ISL_16941109|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105732/2023|EPI_ISL_16941110|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105734/2023|EPI_ISL_16941112|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105736/2023|EPI_ISL_16941113|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105737/2023|EPI_ISL_16941114|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105738/2023|EPI_ISL_16941115|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105740/2023|EPI_ISL_16941117|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105741/2023|EPI_ISL_16941118|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105742/2023|EPI_ISL_16941119|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105743/2023|EPI_ISL_16941120|2023-02-02
hCoV-19/Germany/BY-RKI-I-1105744/2023|EPI_ISL_16941121|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105745/2023|EPI_ISL_16941122|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105746/2023|EPI_ISL_16941123|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105747/2023|EPI_ISL_16941124|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105748/2023|EPI_ISL_16941125|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105749/2023|EPI_ISL_16941126|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105750/2023|EPI_ISL_16941127|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105751/2023|EPI_ISL_16941128|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105752/2023|EPI_ISL_16941129|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105753/2023|EPI_ISL_16941130|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105754/2023|EPI_ISL_16941131|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105755/2023|EPI_ISL_16941132|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105756/2023|EPI_ISL_16941133|2023-02-02
hCoV-19/Germany/BY-RKI-I-1105758/2023|EPI_ISL_16941135|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105760/2023|EPI_ISL_16941137|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105763/2023|EPI_ISL_16941140|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105765/2023|EPI_ISL_16941142|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105766/2023|EPI_ISL_16941143|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105767/2023|EPI_ISL_16941144|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105768/2023|EPI_ISL_16941145|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105770/2023|EPI_ISL_16941147|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105773/2023|EPI_ISL_16941150|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105774/2023|EPI_ISL_16941151|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105775/2023|EPI_ISL_16941152|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105776/2023|EPI_ISL_16941153|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105777/2023|EPI_ISL_16941154|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105780/2023|EPI_ISL_16941156|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105781/2023|EPI_ISL_16941157|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105782/2023|EPI_ISL_16941158|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105783/2023|EPI_ISL_16941159|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105785/2023|EPI_ISL_16941161|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105786/2023|EPI_ISL_16941162|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105788/2023|EPI_ISL_16941164|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105789/2023|EPI_ISL_16941165|2023-02-02
hCoV-19/Germany/SN-RKI-I-1105790/2023|EPI_ISL_16941166|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105791/2023|EPI_ISL_16941167|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105792/2023|EPI_ISL_16941168|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105793/2023|EPI_ISL_16941169|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105794/2023|EPI_ISL_16941170|2023-02-06
hCoV-19/Germany/MV-RKI-I-1105795/2023|EPI_ISL_16941171|2023-02-02
hCoV-19/Germany/MV-RKI-I-1105798/2023|EPI_ISL_16941174|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105799/2023|EPI_ISL_16941175|2023-02-06
hCoV-19/Germany/MV-RKI-I-1105801/2023|EPI_ISL_16941177|2023-02-02
hCoV-19/Germany/SN-RKI-I-1105802/2023|EPI_ISL_16941178|2023-02-02
hCoV-19/Germany/BW-RKI-I-1105804/2023|EPI_ISL_16941180|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105805/2023|EPI_ISL_16941181|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105807/2023|EPI_ISL_16941183|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105808/2023|EPI_ISL_16941184|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105809/2023|EPI_ISL_16941185|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105812/2023|EPI_ISL_16941186|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105814/2023|EPI_ISL_16941188|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105817/2023|EPI_ISL_16941191|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105820/2023|EPI_ISL_16941194|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105821/2023|EPI_ISL_16941195|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105822/2023|EPI_ISL_16941196|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105823/2023|EPI_ISL_16941197|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105824/2023|EPI_ISL_16941198|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105825/2023|EPI_ISL_16941199|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105826/2023|EPI_ISL_16941200|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105829/2023|EPI_ISL_16941203|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105830/2023|EPI_ISL_16941204|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105831/2023|EPI_ISL_16941205|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105832/2023|EPI_ISL_16941206|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105833/2023|EPI_ISL_16941207|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105834/2023|EPI_ISL_16941208|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105835/2023|EPI_ISL_16941209|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105837/2023|EPI_ISL_16941211|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105838/2023|EPI_ISL_16941212|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105839/2023|EPI_ISL_16941213|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105840/2023|EPI_ISL_16941214|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105841/2023|EPI_ISL_16941215|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105843/2023|EPI_ISL_16941217|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105844/2023|EPI_ISL_16941218|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105845/2023|EPI_ISL_16941219|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105848/2023|EPI_ISL_16941222|2023-02-08
hCoV-19/Germany/SN-RKI-I-1105849/2023|EPI_ISL_16941223|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105851/2023|EPI_ISL_16941225|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105852/2023|EPI_ISL_16941226|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105853/2023|EPI_ISL_16941227|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105858/2023|EPI_ISL_16941231|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105859/2023|EPI_ISL_16941232|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105861/2023|EPI_ISL_16941234|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105862/2023|EPI_ISL_16941235|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105863/2023|EPI_ISL_16941236|2023-02-08
hCoV-19/Germany/SN-RKI-I-1105864/2023|EPI_ISL_16941237|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105865/2023|EPI_ISL_16941238|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105866/2023|EPI_ISL_16941239|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105867/2023|EPI_ISL_16941240|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105868/2023|EPI_ISL_16941241|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105869/2023|EPI_ISL_16941242|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105871/2023|EPI_ISL_16941244|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105872/2023|EPI_ISL_16941245|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105873/2023|EPI_ISL_16941246|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105874/2023|EPI_ISL_16941247|2023-02-08
hCoV-19/Germany/SN-RKI-I-1105875/2023|EPI_ISL_16941248|2023-02-07
hCoV-19/Germany/SN-RKI-I-1105876/2023|EPI_ISL_16941249|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105877/2023|EPI_ISL_16941250|2023-02-08
hCoV-19/Germany/SN-RKI-I-1105880/2023|EPI_ISL_16941253|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105882/2023|EPI_ISL_16941254|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105884/2023|EPI_ISL_16941256|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105885/2023|EPI_ISL_16941257|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105886/2023|EPI_ISL_16941258|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105887/2023|EPI_ISL_16941259|2023-02-08
hCoV-19/Germany/SN-RKI-I-1105889/2023|EPI_ISL_16941261|2023-02-07
hCoV-19/Germany/BY-RKI-I-1105890/2023|EPI_ISL_16941262|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105892/2023|EPI_ISL_16941263|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105893/2023|EPI_ISL_16941264|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105894/2023|EPI_ISL_16941265|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105895/2023|EPI_ISL_16941266|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105896/2023|EPI_ISL_16941267|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105897/2023|EPI_ISL_16941268|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105899/2023|EPI_ISL_16941270|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105900/2023|EPI_ISL_16941271|2023-02-06
hCoV-19/Germany/BY-RKI-I-1105902/2023|EPI_ISL_16941272|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105903/2023|EPI_ISL_16941273|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105904/2023|EPI_ISL_16941274|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105905/2023|EPI_ISL_16941275|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105906/2023|EPI_ISL_16941276|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105907/2023|EPI_ISL_16941277|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105908/2023|EPI_ISL_16941278|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105910/2023|EPI_ISL_16941280|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105911/2023|EPI_ISL_16941281|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105913/2023|EPI_ISL_16941282|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105916/2023|EPI_ISL_16941285|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105917/2023|EPI_ISL_16941286|2023-02-06
hCoV-19/Germany/BY-RKI-I-1105918/2023|EPI_ISL_16941287|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105920/2023|EPI_ISL_16941289|2023-02-03
hCoV-19/Germany/BW-RKI-I-1105921/2023|EPI_ISL_16941290|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105922/2023|EPI_ISL_16941291|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105923/2023|EPI_ISL_16941292|2023-02-06
hCoV-19/Germany/BY-RKI-I-1105925/2023|EPI_ISL_16941293|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105926/2023|EPI_ISL_16941294|2023-02-03
hCoV-19/Germany/BY-RKI-I-1105927/2023|EPI_ISL_16941295|2023-02-08
hCoV-19/Germany/BY-RKI-I-1105928/2023|EPI_ISL_16941296|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105929/2023|EPI_ISL_16941297|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105930/2023|EPI_ISL_16941298|2023-02-07
hCoV-19/Germany/BY-RKI-I-1105931/2023|EPI_ISL_16941299|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105932/2023|EPI_ISL_16941300|2023-02-06
hCoV-19/Germany/ST-RKI-I-1105933/2023|EPI_ISL_16941301|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105934/2023|EPI_ISL_16941302|2023-02-06
hCoV-19/Germany/BY-RKI-I-1105935/2023|EPI_ISL_16941303|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105936/2023|EPI_ISL_16941304|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105938/2023|EPI_ISL_16941306|2023-02-06
hCoV-19/Germany/ST-RKI-I-1105939/2023|EPI_ISL_16941307|2023-02-01
hCoV-19/Germany/BW-RKI-I-1105940/2023|EPI_ISL_16941308|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105941/2023|EPI_ISL_16941309|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105943/2023|EPI_ISL_16941313|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105945/2023|EPI_ISL_16941317|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105946/2023|EPI_ISL_16941319|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105947/2023|EPI_ISL_16941321|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105949/2023|EPI_ISL_16941326|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105951/2023|EPI_ISL_16941329|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105952/2023|EPI_ISL_16941331|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105953/2023|EPI_ISL_16941333|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105954/2023|EPI_ISL_16941335|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105955/2023|EPI_ISL_16941337|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105956/2023|EPI_ISL_16941338|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105957/2023|EPI_ISL_16941340|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105958/2023|EPI_ISL_16941341|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105959/2023|EPI_ISL_16941342|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105960/2023|EPI_ISL_16941343|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105961/2023|EPI_ISL_16941344|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105962/2023|EPI_ISL_16941345|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105963/2023|EPI_ISL_16941346|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105964/2023|EPI_ISL_16941347|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105965/2023|EPI_ISL_16941348|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105966/2023|EPI_ISL_16941349|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105967/2023|EPI_ISL_16941350|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105969/2023|EPI_ISL_16941352|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105970/2023|EPI_ISL_16941353|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105971/2023|EPI_ISL_16941354|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105972/2023|EPI_ISL_16941355|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105974/2023|EPI_ISL_16941357|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105975/2023|EPI_ISL_16941358|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105976/2023|EPI_ISL_16941359|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105977/2023|EPI_ISL_16941360|2023-02-09
hCoV-19/Germany/BY-RKI-I-1105979/2023|EPI_ISL_16941362|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105980/2023|EPI_ISL_16941363|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105982/2023|EPI_ISL_16941365|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105983/2023|EPI_ISL_16941366|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105984/2023|EPI_ISL_16941367|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105985/2023|EPI_ISL_16941368|2023-02-08
hCoV-19/Germany/BW-RKI-I-1105986/2023|EPI_ISL_16941369|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105987/2023|EPI_ISL_16941370|2023-02-06
hCoV-19/Germany/BW-RKI-I-1105990/2023|EPI_ISL_16941372|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105991/2023|EPI_ISL_16941373|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105992/2023|EPI_ISL_16941374|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105993/2023|EPI_ISL_16941375|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105994/2023|EPI_ISL_16941376|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105995/2023|EPI_ISL_16941377|2023-02-09
hCoV-19/Germany/BW-RKI-I-1105996/2023|EPI_ISL_16941378|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105997/2023|EPI_ISL_16941379|2023-02-07
hCoV-19/Germany/BW-RKI-I-1105999/2023|EPI_ISL_16941381|2023-02-09
hCoV-19/Germany/BW-RKI-I-1106000/2023|EPI_ISL_16941382|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106001/2023|EPI_ISL_16941383|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106002/2023|EPI_ISL_16941384|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106003/2023|EPI_ISL_16941385|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106004/2023|EPI_ISL_16941386|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106005/2023|EPI_ISL_16941387|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106006/2023|EPI_ISL_16941388|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106007/2023|EPI_ISL_16941389|2023-02-07
hCoV-19/Germany/BY-RKI-I-1106008/2023|EPI_ISL_16941390|2023-02-07
hCoV-19/Germany/BY-RKI-I-1106009/2023|EPI_ISL_16941391|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106011/2023|EPI_ISL_16941392|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106012/2023|EPI_ISL_16941393|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106014/2023|EPI_ISL_16941395|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106015/2023|EPI_ISL_16941396|2023-02-07
hCoV-19/Germany/BY-RKI-I-1106018/2023|EPI_ISL_16941398|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106024/2023|EPI_ISL_16941403|2023-02-07
hCoV-19/Germany/BY-RKI-I-1106025/2023|EPI_ISL_16941404|2023-02-07
hCoV-19/Germany/BY-RKI-I-1106026/2023|EPI_ISL_16941405|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106028/2023|EPI_ISL_16941407|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106029/2023|EPI_ISL_16941408|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106030/2023|EPI_ISL_16941409|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106031/2023|EPI_ISL_16941410|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106032/2023|EPI_ISL_16941411|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106033/2023|EPI_ISL_16941412|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106034/2023|EPI_ISL_16941413|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106035/2023|EPI_ISL_16941414|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106036/2023|EPI_ISL_16941415|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106038/2023|EPI_ISL_16941417|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106039/2023|EPI_ISL_16941418|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106040/2023|EPI_ISL_16941419|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106041/2023|EPI_ISL_16941420|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106042/2023|EPI_ISL_16941421|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106044/2023|EPI_ISL_16941422|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106045/2023|EPI_ISL_16941423|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106046/2023|EPI_ISL_16941424|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106047/2023|EPI_ISL_16941425|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106048/2023|EPI_ISL_16941426|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106049/2023|EPI_ISL_16941427|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106050/2023|EPI_ISL_16941428|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106052/2023|EPI_ISL_16941430|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106053/2023|EPI_ISL_16941431|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106054/2023|EPI_ISL_16941432|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106055/2023|EPI_ISL_16941433|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106056/2023|EPI_ISL_16941434|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106057/2023|EPI_ISL_16941435|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106058/2023|EPI_ISL_16941436|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106059/2023|EPI_ISL_16941437|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106060/2023|EPI_ISL_16941438|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106062/2023|EPI_ISL_16941439|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106063/2023|EPI_ISL_16941440|2023-02-07
hCoV-19/Germany/SN-RKI-I-1106064/2023|EPI_ISL_16941441|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106065/2023|EPI_ISL_16941442|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106066/2023|EPI_ISL_16941443|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106067/2023|EPI_ISL_16941444|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106068/2023|EPI_ISL_16941445|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106069/2023|EPI_ISL_16941446|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106070/2023|EPI_ISL_16941447|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106071/2023|EPI_ISL_16941448|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106072/2023|EPI_ISL_16941449|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106073/2023|EPI_ISL_16941450|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106074/2023|EPI_ISL_16941451|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106075/2023|EPI_ISL_16941452|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106076/2023|EPI_ISL_16941453|2023-01-10
hCoV-19/Germany/BW-RKI-I-1106077/2023|EPI_ISL_16941454|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106078/2023|EPI_ISL_16941455|2023-02-07
hCoV-19/Germany/BY-RKI-I-1106079/2023|EPI_ISL_16941456|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106080/2023|EPI_ISL_16941457|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106081/2023|EPI_ISL_16941458|2023-02-04
hCoV-19/Germany/SN-RKI-I-1106082/2023|EPI_ISL_16941459|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106083/2023|EPI_ISL_16941460|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106085/2023|EPI_ISL_16941461|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106086/2023|EPI_ISL_16941462|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106087/2023|EPI_ISL_16941463|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106088/2023|EPI_ISL_16941464|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106089/2023|EPI_ISL_16941465|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106090/2023|EPI_ISL_16941466|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106091/2023|EPI_ISL_16941467|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106092/2023|EPI_ISL_16941468|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106093/2023|EPI_ISL_16941469|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106095/2023|EPI_ISL_16941471|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106096/2023|EPI_ISL_16941472|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106097/2023|EPI_ISL_16941473|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106098/2023|EPI_ISL_16941474|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106101/2023|EPI_ISL_16941477|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106102/2023|EPI_ISL_16941478|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106103/2023|EPI_ISL_16941479|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106105/2023|EPI_ISL_16941480|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106106/2023|EPI_ISL_16941481|2023-02-06
hCoV-19/Germany/MV-RKI-I-1106107/2023|EPI_ISL_16941482|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106108/2023|EPI_ISL_16941483|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106109/2023|EPI_ISL_16941484|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106110/2023|EPI_ISL_16941485|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106113/2023|EPI_ISL_16941488|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106114/2023|EPI_ISL_16941489|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106115/2023|EPI_ISL_16941490|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106116/2023|EPI_ISL_16941491|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106117/2023|EPI_ISL_16941492|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106118/2023|EPI_ISL_16941493|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106119/2023|EPI_ISL_16941494|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106121/2023|EPI_ISL_16941496|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106124/2023|EPI_ISL_16941498|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106125/2023|EPI_ISL_16941499|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106126/2023|EPI_ISL_16941500|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106131/2023|EPI_ISL_16941503|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106132/2023|EPI_ISL_16941504|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106133/2023|EPI_ISL_16941505|2023-02-06
hCoV-19/Germany/MV-RKI-I-1106134/2023|EPI_ISL_16941506|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106135/2023|EPI_ISL_16941507|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106138/2023|EPI_ISL_16941509|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106140/2023|EPI_ISL_16941511|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106141/2023|EPI_ISL_16941512|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106142/2023|EPI_ISL_16941513|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106143/2023|EPI_ISL_16941514|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106144/2023|EPI_ISL_16941515|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106145/2023|EPI_ISL_16941516|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106146/2023|EPI_ISL_16941517|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106147/2023|EPI_ISL_16941518|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106149/2023|EPI_ISL_16941519|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106150/2023|EPI_ISL_16941520|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106151/2023|EPI_ISL_16941521|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106152/2023|EPI_ISL_16941522|2023-02-08
hCoV-19/Germany/ST-RKI-I-1106153/2023|EPI_ISL_16941523|2023-02-01
hCoV-19/Germany/BW-RKI-I-1106155/2023|EPI_ISL_16941524|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106156/2023|EPI_ISL_16941525|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106158/2023|EPI_ISL_16941527|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106159/2023|EPI_ISL_16941528|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106160/2023|EPI_ISL_16941529|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106162/2023|EPI_ISL_16941530|2023-02-07
hCoV-19/Germany/ST-RKI-I-1106163/2023|EPI_ISL_16941531|2023-02-01
hCoV-19/Germany/BW-RKI-I-1106164/2023|EPI_ISL_16941532|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106165/2023|EPI_ISL_16941533|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106166/2023|EPI_ISL_16941534|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106167/2023|EPI_ISL_16941535|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106168/2023|EPI_ISL_16941536|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106170/2023|EPI_ISL_16941538|2023-02-08
hCoV-19/Germany/BW-RKI-I-1106171/2023|EPI_ISL_16941539|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106172/2023|EPI_ISL_16941540|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106174/2023|EPI_ISL_16941541|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106175/2023|EPI_ISL_16941542|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106176/2023|EPI_ISL_16941543|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106177/2023|EPI_ISL_16941544|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106179/2023|EPI_ISL_16941545|2023-02-06
hCoV-19/Germany/BW-RKI-I-1106181/2023|EPI_ISL_16941547|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106183/2023|EPI_ISL_16941548|2023-02-02
hCoV-19/Germany/BW-RKI-I-1106184/2023|EPI_ISL_16941549|2023-02-06
hCoV-19/Germany/ST-RKI-I-1106185/2023|EPI_ISL_16941550|2023-02-01
hCoV-19/Germany/BW-RKI-I-1106186/2023|EPI_ISL_16941551|2023-02-07
hCoV-19/Germany/BW-RKI-I-1106187/2023|EPI_ISL_16941552|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106188/2023|EPI_ISL_16941553|2023-02-02
hCoV-19/Germany/BW-RKI-I-1106190/2023|EPI_ISL_16941555|2023-02-01
hCoV-19/Germany/BW-RKI-I-1106191/2023|EPI_ISL_16941556|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106192/2023|EPI_ISL_16941557|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106193/2023|EPI_ISL_16941558|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106194/2023|EPI_ISL_16941559|2023-02-02
hCoV-19/Germany/SN-RKI-I-1106195/2023|EPI_ISL_16941560|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106196/2023|EPI_ISL_16941561|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106197/2023|EPI_ISL_16941562|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106198/2023|EPI_ISL_16941563|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106199/2023|EPI_ISL_16941564|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106200/2023|EPI_ISL_16941565|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106201/2023|EPI_ISL_16941566|2023-02-02
hCoV-19/Germany/BW-RKI-I-1106202/2023|EPI_ISL_16941567|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106203/2023|EPI_ISL_16941568|2023-02-04
hCoV-19/Germany/BY-RKI-I-1106204/2023|EPI_ISL_16941569|2023-02-02
hCoV-19/Germany/BY-RKI-I-1106205/2023|EPI_ISL_16941570|2023-02-02
hCoV-19/Germany/BW-RKI-I-1106206/2023|EPI_ISL_16941571|2023-02-06
hCoV-19/Germany/BY-RKI-I-1106207/2023|EPI_ISL_16941572|2023-02-01
hCoV-19/Germany/BY-RKI-I-1106208/2023|EPI_ISL_16941573|2023-02-04
hCoV-19/Germany/BW-RKI-I-1106209/2023|EPI_ISL_16941574|2023-02-07

Fehlende Sequenzdaten (csv/fasta) Uploads ab 2022-08-31

Guten Morgen,

Zur Info, es scheint wieder Pipeline-Probleme im Nachtlauf (Sequenzen, ~21:30) zu geben.

Der letzte Commit mit "SARS-CoV-2-Sequenzdaten_Deutschland.csv.xz", "SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz" (plus zugehöriger ".zenodo.json") war am 30. August.

Viele Grüße,
David

Siehe auch
#29

tag 2021-01-05 seemingly invalid

This tag contains data at least for 2022-01-06, probably also for (all?) interim dates. I checked files

  • SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz
  • SARS-CoV-2-Sequenzdaten_Deutschland.csv.xz

In any case, it confuses scripts that walk the tags to obtain data based on reporting date (and, yes, I know it's a border case, but useful for some deep interest e.g. like sequence re-classifications and gathering some data points for nowcasting).

Derzeit keine Entwicklungslinien

Liebe Alle,

nach einer Umstellung in der internen Datenverarbeitung haben wir derzeit noch Probleme die Entwicklungslinien bereitzustellen.
Aufgrund des Wochenendes wird das Problem voraussichtlich erst zu Beginn der nächsten Woche gelöst werden.

Mit besten Grüßen
@HannesWuensche
für das Team RKI | Open Data

About 10k sequences miss pango calls in "Entwicklungslinien"

When joining metadata and pango calls (from Entwicklungslinien) I noticed that about 10k sequences seem to have no pango calls.

What's the reason for this? Did these sequences not pass pango's QC requirements?

Here's a list of the affected sequence ids:
missing_pango.csv

Here's head/tail:

IMS_ID,lineage,scorpio_call,IMS_ID,DATE_DRAW,SEQ_REASON,PROCESSING_DATE,SENDING_LAB_PC,SEQUENCING_LAB_PC
,,,IMS-10294-CVDP-00002,2021-01-14,X,2021-01-25,40225,40225
,,,IMS-10294-CVDP-00016,2020-08-18,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00022,2020-08-20,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00025,2020-08-28,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00027,2020-08-28,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00028,2020-08-28,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00030,2020-08-28,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00036,2020-08-26,X,2021-01-27,40210,40225
,,,IMS-10294-CVDP-00044,2020-09-01,X,2021-01-27,40210,40225
...
,,,IMS-10186-CVDP-CCD10BDC-1C8A-4599-B0A7-881ADBAB9C1D,2021-11-05,N,2021-11-25,40210,40210
,,,IMS-10186-CVDP-A5392812-199F-42EC-A93E-90556914EEC1,2021-11-08,N,2021-11-25,40210,40210
,,,IMS-10186-CVDP-5178419A-C7A0-4B3D-A944-0AB2ABDA82F3,2021-11-04,N,2021-11-25,40210,40210
,,,IMS-10186-CVDP-6F4F6FC4-7958-465C-A492-DC226473FDED,2021-11-05,N,2021-11-25,40210,40210
,,,IMS-10186-CVDP-A1B5C007-774C-4785-84E8-434639FFCB07,2021-11-04,N,2021-11-25,40210,40210
,,,IMS-10186-CVDP-97A13E2A-E6C9-483F-9778-01EACACA16CA,2021-11-04,N,2021-11-25,40210,40210
,,,IMS-10186-CVDP-A2D8E787-01C8-4AD1-B3BB-AF3354B76914,2021-11-04,N,2021-11-25,40210,40210
,,,IMS-10267-CVDP-ED09CC2B-A80B-4EA4-943A-738F1283601C,2021-11-14,N,2021-11-25,23564,44137
,,,IMS-10267-CVDP-A9AA4B6D-1521-490B-89F4-F6341008692A,2021-11-16,N,2021-11-25,23564,44137
,,,IMS-10267-CVDP-FEF692DE-86C2-4A5F-A28C-0FCAC1BD9F79,2021-11-17,N,2021-11-25,44137,44137

2023-10-09? 

Hi,

diese Woche scheint das Update (SARS-CoV-2-Sequenzdaten_Deutschland.fasta/tsv.xz) wieder ausgefallen zu sein.

Viele Grüße
David

Potential sequencing error: S:Q1054E showing up in just Germany on all sorts of lineages

Looking at recent German sequences, I noticed that S:Q1054E has suddenly popped up all over the tree - not just in one but in all sorts of lineages.

It has also never appeared outside of Germany. That's very indicative of a sequencing error / artefact.

Could you check with the lab? That'd be great

Unfortunately it appears that the actual lab doing the sequencing is not provided in the GISAID metadata - it seems that the originating lab is the lab that did the PCR not the lab that did the sequencing.

It may be more useful to have the lab that did the sequencing listed there - as in this case there are a handful of labs with this error - but I strongly suspect it's in fact only one lab that did the sequencing for all the submitters.

For the large amount of money German labs get for each sequence (is it still >200 EUR) one should expect good quality and no errors like this that should easily be identified if the sequencing lab ran their sequences through e.g. Nextclade.

This issue is similar to #27 #30

Here's a covSpectrum query:
https://cov-spectrum.org/explore/World/AllSamples/Past6M/variants?aaMutations=S%3AQ1054E&

These are EPI_ISLs:
EPI_ISL_14432551
EPI_ISL_14414119
EPI_ISL_14432663
EPI_ISL_14520784
EPI_ISL_14414320
EPI_ISL_14408625
EPI_ISL_14367877
EPI_ISL_14367902
EPI_ISL_14520547
EPI_ISL_14402843
EPI_ISL_14432225
EPI_ISL_14520809
EPI_ISL_14378924
EPI_ISL_13945683
EPI_ISL_14408267
EPI_ISL_14520827
EPI_ISL_14432063
EPI_ISL_13921602
EPI_ISL_14432642
EPI_ISL_14520545
EPI_ISL_14416139
EPI_ISL_14367888
EPI_ISL_14520746
EPI_ISL_14520772
EPI_ISL_13921663
EPI_ISL_14432249
EPI_ISL_14520757
EPI_ISL_14408704
EPI_ISL_13946392
EPI_ISL_13921585
EPI_ISL_14415977
EPI_ISL_14415045
EPI_ISL_14408443
EPI_ISL_13921433
EPI_ISL_14416174
EPI_ISL_14520697
EPI_ISL_14520665
EPI_ISL_14520885
EPI_ISL_14379121
EPI_ISL_14378915
EPI_ISL_14409100
EPI_ISL_14403138
EPI_ISL_13921644
EPI_ISL_14432584
EPI_ISL_14432580
EPI_ISL_14379009
EPI_ISL_14432590
EPI_ISL_14432684
EPI_ISL_13921591
EPI_ISL_14520666
EPI_ISL_14520922
EPI_ISL_14432325
EPI_ISL_13921819
EPI_ISL_14520852
EPI_ISL_14379110
EPI_ISL_14398549
EPI_ISL_14521363
EPI_ISL_14432662
EPI_ISL_14432546
EPI_ISL_14403055
EPI_ISL_14520995
EPI_ISL_14520695
EPI_ISL_14367770
EPI_ISL_14367986
EPI_ISL_14402716
EPI_ISL_14414415
EPI_ISL_14379012
EPI_ISL_14520517
EPI_ISL_14521016
EPI_ISL_14409031
EPI_ISL_14379015
EPI_ISL_14407921
EPI_ISL_14402891
EPI_ISL_14520905
EPI_ISL_14395507
EPI_ISL_14432162
EPI_ISL_14520751
EPI_ISL_14415985
EPI_ISL_14414742
EPI_ISL_14432634
EPI_ISL_14408455
EPI_ISL_14416181
EPI_ISL_14379207
EPI_ISL_14409109
EPI_ISL_14432688
EPI_ISL_14416249
EPI_ISL_13946281
EPI_ISL_14395504
EPI_ISL_14432613
EPI_ISL_14367878
EPI_ISL_14432257
EPI_ISL_14432310
EPI_ISL_14432534
EPI_ISL_14520561
EPI_ISL_13942426
EPI_ISL_14520918
EPI_ISL_14415940
EPI_ISL_14520834
EPI_ISL_13945685
EPI_ISL_14432630
EPI_ISL_14432184
EPI_ISL_14413973
EPI_ISL_14368232
EPI_ISL_14416216
EPI_ISL_13936037
EPI_ISL_13946427
EPI_ISL_14520926
EPI_ISL_14415733
EPI_ISL_14432576
EPI_ISL_14520720
EPI_ISL_14402345
EPI_ISL_14520768
EPI_ISL_14521133
EPI_ISL_14367803
EPI_ISL_14414821
EPI_ISL_14414254
EPI_ISL_13946390
EPI_ISL_14432658
EPI_ISL_14432552
EPI_ISL_14415944
EPI_ISL_14520851
EPI_ISL_13942371
EPI_ISL_14378986
EPI_ISL_14432635
EPI_ISL_14432449
EPI_ISL_14414390
EPI_ISL_13921310
EPI_ISL_14367662
EPI_ISL_13945843
EPI_ISL_14414940
EPI_ISL_14378983
EPI_ISL_14379135
EPI_ISL_14432531
EPI_ISL_14379142
EPI_ISL_14521169
EPI_ISL_14432618
EPI_ISL_14432665
EPI_ISL_14414321
EPI_ISL_14432255
EPI_ISL_14432562
EPI_ISL_14408562
EPI_ISL_13946435
EPI_ISL_14520753
EPI_ISL_14408615
EPI_ISL_14379021
EPI_ISL_13935996
EPI_ISL_13921631
EPI_ISL_14408824
EPI_ISL_14367983
EPI_ISL_14379019
EPI_ISL_14408468
EPI_ISL_13921641
EPI_ISL_14367753
EPI_ISL_14408658
EPI_ISL_14432294
EPI_ISL_14520807
EPI_ISL_14379162
EPI_ISL_14432636
EPI_ISL_14379076
EPI_ISL_14520657
EPI_ISL_14520850
EPI_ISL_14520715
EPI_ISL_14432647
EPI_ISL_14402383
EPI_ISL_14432573
EPI_ISL_14520701
EPI_ISL_14432489
EPI_ISL_14520536
EPI_ISL_14379061
EPI_ISL_14520719
EPI_ISL_14415402
EPI_ISL_13935999
EPI_ISL_14379118
EPI_ISL_14378987
EPI_ISL_14395460
EPI_ISL_14432461
EPI_ISL_13921686
EPI_ISL_14415861
EPI_ISL_14432664
EPI_ISL_14408469
EPI_ISL_14379069
EPI_ISL_13942286
EPI_ISL_14408701
EPI_ISL_14432351
EPI_ISL_13942085
EPI_ISL_14432416
EPI_ISL_14408921
EPI_ISL_14408440
EPI_ISL_14378944
EPI_ISL_14520766
EPI_ISL_13941967
EPI_ISL_14520869
EPI_ISL_14432569
EPI_ISL_14398631
EPI_ISL_14379068
EPI_ISL_14520659
EPI_ISL_14402886
EPI_ISL_14520788
EPI_ISL_14432446
EPI_ISL_14408661
EPI_ISL_14379130
EPI_ISL_14367875
EPI_ISL_14408138
EPI_ISL_14408174
EPI_ISL_14367735
EPI_ISL_14398360
EPI_ISL_13936051
EPI_ISL_13921518
EPI_ISL_14408300
EPI_ISL_14416113
EPI_ISL_14413999
EPI_ISL_14432570
EPI_ISL_14432440
EPI_ISL_14416211
EPI_ISL_14403051
EPI_ISL_14407946
EPI_ISL_14379050
EPI_ISL_14408302
EPI_ISL_14520676
EPI_ISL_14520765
EPI_ISL_13945660
EPI_ISL_14402214
EPI_ISL_14520762
EPI_ISL_14432648
EPI_ISL_13945867
EPI_ISL_13921776
EPI_ISL_14414238
EPI_ISL_14520813
EPI_ISL_14415936
EPI_ISL_14367957
EPI_ISL_14521595
EPI_ISL_14415947
EPI_ISL_14520868
EPI_ISL_14520823
EPI_ISL_14415034
EPI_ISL_14432652
EPI_ISL_14416069
EPI_ISL_14402852
EPI_ISL_14408384
EPI_ISL_14414606
EPI_ISL_14402953
EPI_ISL_14520781
EPI_ISL_14408914
EPI_ISL_14408402
EPI_ISL_14408359
EPI_ISL_14408213
EPI_ISL_14408631
EPI_ISL_13921612
EPI_ISL_14416185
EPI_ISL_14408295
EPI_ISL_14432568
EPI_ISL_14408628
EPI_ISL_14403002
EPI_ISL_13921464
EPI_ISL_14407937
EPI_ISL_14520906
EPI_ISL_14395980
EPI_ISL_14414945
EPI_ISL_14408618
EPI_ISL_14415660
EPI_ISL_14402616
EPI_ISL_13946508
EPI_ISL_14432418
EPI_ISL_14432285
EPI_ISL_14432176
EPI_ISL_14432448
EPI_ISL_14401772
EPI_ISL_14402845
EPI_ISL_14408268
EPI_ISL_14408348
EPI_ISL_14414400
EPI_ISL_13942405
EPI_ISL_14520692
EPI_ISL_14432082
EPI_ISL_14379056
EPI_ISL_14367742
EPI_ISL_14520806
EPI_ISL_14432213
EPI_ISL_14408133
EPI_ISL_14416175
EPI_ISL_14379036
EPI_ISL_14432393
EPI_ISL_14414732
EPI_ISL_14432686
EPI_ISL_13922240
EPI_ISL_14408362
EPI_ISL_14432343
EPI_ISL_14408650
EPI_ISL_14401755
EPI_ISL_14520528
EPI_ISL_14402998
EPI_ISL_14402297
EPI_ISL_14521095
EPI_ISL_14379077
EPI_ISL_14402222
EPI_ISL_14367757
EPI_ISL_14520522
EPI_ISL_14416228
EPI_ISL_13945808
EPI_ISL_14409039
EPI_ISL_13921637
EPI_ISL_14520544
EPI_ISL_14415088
EPI_ISL_13921646
EPI_ISL_14395040
EPI_ISL_14402688
EPI_ISL_14432091
EPI_ISL_13921554
EPI_ISL_14432471
EPI_ISL_13921825
EPI_ISL_14520748
EPI_ISL_14520726
EPI_ISL_14408835
EPI_ISL_14379140
EPI_ISL_14408698
EPI_ISL_13946474
EPI_ISL_14367646
EPI_ISL_14409154
EPI_ISL_14408575
EPI_ISL_14367754
EPI_ISL_14432593
EPI_ISL_14367681
EPI_ISL_14408676
EPI_ISL_14367873
EPI_ISL_14520760
EPI_ISL_13945886
EPI_ISL_14520898
EPI_ISL_14398192
EPI_ISL_14414215
EPI_ISL_14367713
EPI_ISL_14379072
EPI_ISL_14395860
EPI_ISL_13936179
EPI_ISL_14379101
EPI_ISL_13945715
EPI_ISL_14408696
EPI_ISL_14432317
EPI_ISL_14378958
EPI_ISL_14432693
EPI_ISL_14402968
EPI_ISL_14378891
EPI_ISL_14408655
EPI_ISL_14408369
EPI_ISL_14408866
EPI_ISL_13921565
EPI_ISL_14432510
EPI_ISL_13945842
EPI_ISL_14378996
EPI_ISL_14415642
EPI_ISL_14521253
EPI_ISL_14408274
EPI_ISL_14408132
EPI_ISL_14398234
EPI_ISL_14402940
EPI_ISL_14367764
EPI_ISL_14413981
EPI_ISL_14414334
EPI_ISL_14414843
EPI_ISL_14402878
EPI_ISL_14521102
EPI_ISL_14520824
EPI_ISL_14432521
EPI_ISL_14432425
EPI_ISL_14432453
EPI_ISL_14432695
EPI_ISL_14379043
EPI_ISL_14520538
EPI_ISL_14402725
EPI_ISL_14379073
EPI_ISL_13921584
EPI_ISL_14520840
EPI_ISL_14401992
EPI_ISL_14432560
EPI_ISL_14520754
EPI_ISL_14402613
EPI_ISL_14520796
EPI_ISL_14432683
EPI_ISL_14432666
EPI_ISL_13945723
EPI_ISL_13945664
EPI_ISL_14432604
EPI_ISL_14432256
EPI_ISL_14408897
EPI_ISL_13946332
EPI_ISL_14416027
EPI_ISL_14432639
EPI_ISL_14403079
EPI_ISL_14408684
EPI_ISL_14379198
EPI_ISL_14520888

Dokumentation der Variablen sending lab/sequencing lab in den Metadaten unklar

Hallo! Laut Dokumentation gibt es in den Metadaten die Variablen SENDING_LAB_PC (PLZ des sequenzierenden Labors) und PRIMEDIAGNOSTIC_LAB_PC (PLZ des diagnostischen Labors). In den Metadaten vorhanden sind allerdings SENDING_LAB_PC und SEQUENCING_LAB_PC. Bezieht sich SENDING_LAB_PC damit anders als in der Doku angegeben auf das diagnostische Labor?

Manchmal kein Update der SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz

Während zuverlässig jeden Tag ein commit mit den neuen Sequenzen vorliegt, fehlt an einigen Tagen das Update der Datei SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz:

  • 4., 11., 24. Dezember
  • 3., 5., 13., 14., 20. November
  • 18., 23., 29. Oktober
  • 11., 16., 18., 23., 24., 25., 27., 29. September

Mich würde interessieren, ob das quasi zufällige Ereignisse in einem vollautomatisierten Workflow sind, oder ob über die Feiertage vermehrt mit Ausfällen zu rechnen ist.

Hintergrund: ich hab kürzlich ein paar Skripte entwickelt, mit denen ich aus den Sequenzen in SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz ermittle, wie viele Omikron-Fälle bisher bekannt sind. Ich habe erst danach festgestellt, dass diese Information ja bereits viel zugänglicher in SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz liegt, und mein Skript eigentlich nutzlos ist. An Tagen, an denen das Update fehlt, ist es vielleicht doch noch ganz nützlich.


An der Stelle möchte ich euch danken, dass ihr dieses Repository hier anbietet, und dass ihr offenbar auch heute noch fleißig dabei seid, auf Issues zu reagieren!

Fehlende Sequenzdaten csv/fasta Uploads ab "Update 2022-07-25"

Guten Morgen,

kann es sein, dass es wieder Pipeline-Probleme gibt?
Der letzte Commit mit "SARS-CoV-2-Sequenzdaten_Deutschland.csv.xz" & "SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz" (plus zugehöriger ".zenodo.json") war am 24. Juli.

Viele Grüße,
David

Potentially misdated sequences from Berlin uploaded to GISAID by RKI today

In today's uploads from RKI, I noticed some Delta sequences with collection date just a week ago that have far too few mutations.

It appears that the collection date is incorrect - one would not find a Delta with 40 mutations today, unless it was in the freezer for a year, since every year around 30 mutations are acquired no matter what.

It appears that the originating lab for these Deltas is

Originating lab: | Robert Koch-Institut ZBS1 (Zentrum für biologische Gefahren und spezielle Pathogene hochpathogene Viren)

Could you check with the lab to see whether they got the year wrong? 2022 instead of 2021?

Here are some sample sequences to look into (some of them are BA.1 - but similarly underdiverged for the stated collection date).

If the precise collection date is not known, it's better to put it as 2021 instead of giving it a precise but wrong date.

hCoV-19/Germany/BE-RKI-I-984654/2022|EPI_ISL_15148193|2022-09-20
hCoV-19/Germany/BE-RKI-I-984662/2022|EPI_ISL_15148201|2022-09-20
hCoV-19/Germany/BE-RKI-I-984666/2022|EPI_ISL_15148205|2022-09-20
hCoV-19/Germany/BE-RKI-I-984662/2022|EPI_ISL_15148201|2022-09-20
hCoV-19/Germany/BE-RKI-I-984659/2022|EPI_ISL_15148198|2022-09-20
hCoV-19/Germany/BE-RKI-I-984655/2022|EPI_ISL_15148194|2022-09-20
hCoV-19/Germany/BE-RKI-I-984653/2022|EPI_ISL_15148192|2022-09-20
hCoV-19/Germany/BE-RKI-I-984639/2022|EPI_ISL_15148179|2022-09-20
hCoV-19/Germany/BE-RKI-I-984636/2022|EPI_ISL_15148176|2022-09-20
hCoV-19/Germany/BE-RKI-I-984667/2022|EPI_ISL_15148206|2022-09-20
hCoV-19/Germany/BE-RKI-I-984664/2022|EPI_ISL_15148203|2022-09-20
hCoV-19/Germany/BE-RKI-I-984660/2022|EPI_ISL_15148199|2022-09-20
hCoV-19/Germany/BE-RKI-I-984658/2022|EPI_ISL_15148197|2022-09-20

Data pipeline stuck since Saturday 25th of June

Dear Users,

There seems to be a problem at Bundesdruckerei which leads to us not receiving any new DESH-Data. The BDR was informed and now we can hope that the error will be fixed soon. The Autopilot pipeline continues to run anyway, so the GISAID reports will keep getting updated, but the DESH-Data which will be processed will stay on the level of last Friday evenings data.

We hope to fixe the error soon and get new data again.

Best Regrads
@HannesWuensche
Team RKI | Open Data

Very diverse set of sequences with S:P348H (almost exclusive to Germany) in just two submission dates

I noticed that there are ~222 sequences from Germany with S:P384H that come from a big range of lineages suggesting the mutation is an artefact.

image

image

Maybe this is a similar issue as in #27

Could you check with the lab what's going on there?

See where they lie on the tree - these are all the German ones, this mutation is basically non-existent outside of Germany

image

These are the EPI_ISLs:
EPI_ISL_13241333
EPI_ISL_13241331
EPI_ISL_13944767
EPI_ISL_13241276
EPI_ISL_13241242
EPI_ISL_13944809
EPI_ISL_13241312
EPI_ISL_13944771
EPI_ISL_13944776
EPI_ISL_13241342
EPI_ISL_13944821
EPI_ISL_10294132
EPI_ISL_13241290
EPI_ISL_13944834
EPI_ISL_13944779
EPI_ISL_13241340
EPI_ISL_13944783
EPI_ISL_13241292
EPI_ISL_13241246
EPI_ISL_13241341
EPI_ISL_13944869
EPI_ISL_13241300
EPI_ISL_13944848
EPI_ISL_13241317
EPI_ISL_13241235
EPI_ISL_13944770
EPI_ISL_13241250
EPI_ISL_13241278
EPI_ISL_13241316
EPI_ISL_13241238
EPI_ISL_13241263
EPI_ISL_13241282
EPI_ISL_13241308
EPI_ISL_13241293
EPI_ISL_13944860
EPI_ISL_13944831
EPI_ISL_13241335
EPI_ISL_13944766
EPI_ISL_13241343
EPI_ISL_13944850
EPI_ISL_13241320
EPI_ISL_13241251
EPI_ISL_13944852
EPI_ISL_13944777
EPI_ISL_13241277
EPI_ISL_13241249
EPI_ISL_13241306
EPI_ISL_13241241
EPI_ISL_13241243
EPI_ISL_13241280
EPI_ISL_13944801
EPI_ISL_13241301
EPI_ISL_13944790
EPI_ISL_13944763
EPI_ISL_13944827
EPI_ISL_13944780
EPI_ISL_13944810
EPI_ISL_13944846
EPI_ISL_13241304
EPI_ISL_13241267
EPI_ISL_13944817
EPI_ISL_13944798
EPI_ISL_13944761
EPI_ISL_13241314
EPI_ISL_13241330
EPI_ISL_13944858
EPI_ISL_13944781
EPI_ISL_13944833
EPI_ISL_13241272
EPI_ISL_13241337
EPI_ISL_13241311
EPI_ISL_13241237
EPI_ISL_13241328
EPI_ISL_13241295
EPI_ISL_13944760
EPI_ISL_13944864
EPI_ISL_13241285
EPI_ISL_13944842
EPI_ISL_13944868
EPI_ISL_13944857
EPI_ISL_13241299
EPI_ISL_13944775
EPI_ISL_13241296
EPI_ISL_13944786
EPI_ISL_13944870
EPI_ISL_13241255
EPI_ISL_13944820
EPI_ISL_13944862
EPI_ISL_13944859
EPI_ISL_13241288
EPI_ISL_13944806
EPI_ISL_13241307
EPI_ISL_13241309
EPI_ISL_13944815
EPI_ISL_13241303
EPI_ISL_13241271
EPI_ISL_13241240
EPI_ISL_13944819
EPI_ISL_13944813
EPI_ISL_13944808
EPI_ISL_13241268
EPI_ISL_13944836
EPI_ISL_13241279
EPI_ISL_13944797
EPI_ISL_13241325
EPI_ISL_13944778
EPI_ISL_13944824
EPI_ISL_13944789
EPI_ISL_13944832
EPI_ISL_13241245
EPI_ISL_13944818
EPI_ISL_13944782
EPI_ISL_13241318
EPI_ISL_13944849
EPI_ISL_13944765
EPI_ISL_13944773
EPI_ISL_13241344
EPI_ISL_13944843
EPI_ISL_13241291
EPI_ISL_13944811
EPI_ISL_13241259
EPI_ISL_13944768
EPI_ISL_13944826
EPI_ISL_13944867
EPI_ISL_13944787
EPI_ISL_13241256
EPI_ISL_13241338
EPI_ISL_13944794
EPI_ISL_13944796
EPI_ISL_13241287
EPI_ISL_13944769
EPI_ISL_13944855
EPI_ISL_13241322
EPI_ISL_13241305
EPI_ISL_13241258
EPI_ISL_13241332
EPI_ISL_13241254
EPI_ISL_13241324
EPI_ISL_13241262
EPI_ISL_13944830
EPI_ISL_13944800
EPI_ISL_13944799
EPI_ISL_13944784
EPI_ISL_13944841
EPI_ISL_13241244
EPI_ISL_13944828
EPI_ISL_13944838
EPI_ISL_13944861
EPI_ISL_13241265
EPI_ISL_13944793
EPI_ISL_13944792
EPI_ISL_13241286
EPI_ISL_13241270
EPI_ISL_13241239
EPI_ISL_13241323
EPI_ISL_13241315
EPI_ISL_13241253
EPI_ISL_13944844
EPI_ISL_13944863
EPI_ISL_13944772
EPI_ISL_13944866
EPI_ISL_13241302
EPI_ISL_13241329
EPI_ISL_13944854
EPI_ISL_13241298
EPI_ISL_13241247
EPI_ISL_13241284
EPI_ISL_13944795
EPI_ISL_13944871
EPI_ISL_13944839
EPI_ISL_13944823
EPI_ISL_13241260
EPI_ISL_13944802
EPI_ISL_13944805
EPI_ISL_13944812
EPI_ISL_13944788
EPI_ISL_13944865
EPI_ISL_13241319
EPI_ISL_13241289
EPI_ISL_13241339
EPI_ISL_13944785
EPI_ISL_13241266
EPI_ISL_13944853
EPI_ISL_13944764
EPI_ISL_13241283
EPI_ISL_13241313
EPI_ISL_13241248
EPI_ISL_13944816
EPI_ISL_13241236
EPI_ISL_13944825
EPI_ISL_13944856
EPI_ISL_13944847
EPI_ISL_13944814
EPI_ISL_13241264
EPI_ISL_13241334
EPI_ISL_13944845
EPI_ISL_13241257
EPI_ISL_13241327
EPI_ISL_13241273
EPI_ISL_13241297
EPI_ISL_13944829
EPI_ISL_13241281
EPI_ISL_13944804
EPI_ISL_13241310
EPI_ISL_13944791
EPI_ISL_13944837
EPI_ISL_13241275
EPI_ISL_13944807
EPI_ISL_13944840
EPI_ISL_13241336
EPI_ISL_13944835
EPI_ISL_13241261
EPI_ISL_13241321
EPI_ISL_13944762
EPI_ISL_13944851
EPI_ISL_13944774
EPI_ISL_13944803
EPI_ISL_13944822
EPI_ISL_13241274
EPI_ISL_13241294
EPI_ISL_13241252
EPI_ISL_13241326

Repository size will grow too much due to compressing textual files

Git is different from other version control systems: on cloning the repository you always obtain the complete repository, including all commits/versions of all files ever contained. Git never forgets. Contrary to e.g. svn with only obtaining a snapshot of all files at a chosen changelist.

Git internally tries to store only the delta of a file to it's previous version. This will fail for pre-compressed file to a very high degree. Consequently the repository actually will grow every day by the sizes of the XZ-files, actually about 65M per day. And the repo will become very un-handy within some weeks.

Rule of thumb for git repositories (afaik): avoid high frequently changing binary files.

For the csv files one should simply remove the compression. As only single lines will change per day. Resulting in a very low growth of the repository.

I guess the lines fo data within the .fasta file will never change again. If so one should separate them to files on a per day basis. Or a directory per day with one file per IMS_ID. And as the data does not change again, one can stay with it's compression.

Ein paar Labore geben das Probendatum fälschlicherweise gleich dem Submissiondatum an

Mir ist aufgefallen, dass es ein paar Submissions gibt mit draw_date == processing_date, siehe die Delay-Verteilung hier:
image
https://github.com/corneliusroemer/desh-data/blob/main/plots/sequencing_delay.png

Weniger als 5 Tage Delay ist schon bemerkenswert. 0 ist praktisch unmöglich. Die Probe muss ja erst vom Patienten zum Labor für PCR, PCR muss gemacht werden, dann Sequenzierung, das dauert Stunden bis Tage, dann Bioinformatik, dann Submission.

Viel plausibler: hier werden Daten falsch eingegeben. Interessant ist, dass vor allem ein Labor betroffen ist mit PLZ 44879, vermutlich Eurofins MVZ Labor Gelsenkirchen.

Das hier sind sending_pc der Labore mit Delay = 0:

44879    2331
76131     190
13353      77
69126      18
32545      12
97422      10
48143       5
21502       3
13347       3
20095       1

Und das die sequencing_pc mit Delay = 0:

44879    2331
76131     200
13353      77
69126      18
32545      12
48143       5
21502       3
13347       3
23845       1

Das ist die Verteilung für das Labor mit PLZ 44879, hier scheint das also systematisch zu sein:
sequencing_delay

Beim Sequencing Labor mit PLZ 76131 sind 0/1 Tage die Ausnahme, ziemlich sicher also Fehler, denn warum sollte es bei den paar Proben nur 0-1 Tage sein, wenn die meisten Proben 10 Tage brauchen:
sequencing_delay

Trouble importing zipped csv into R

Hi,

I´m trying to download the https://github.com/robert-koch-institut/SARS-CoV-2-Sequenzdaten_aus_Deutschland/blob/master/SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz file programmatically into R, but Github blocks the download of binary files. Would it be possible to have this file as a CSV rather than zipping it? Additionally this would prevent your repository from growing too large.

Just FYI, what I am trying to do is

URL <- "https://github.com/robert-koch-institut/SARS-CoV-2-Sequenzdaten_aus_Deutschland/blob/master/SARS-CoV-2-Entwicklungslinien_Deutschland.csv.xz?raw=true"
x <- getURL(URL, ssl.verifypeer=FALSE)
out <- read.csv(untar(textConnection(x)))

but the getURL() cannot read this properly.

Thanks in advance!

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.