Skip to content

Latest commit

 

History

History
41 lines (26 loc) · 3.49 KB

survstat.md

File metadata and controls

41 lines (26 loc) · 3.49 KB

SurvStat und die Populationsdaten

Am 19.05.2021 wurden wir von Robert Gieseke darauf hingewiesen, dass unsere Inzidenzen nach Altersgruppen vermutlich nicht vollständig korrekt sind. Die ursprüngliche Entdeckung dieses Fehlers geht auf @icestormfr zurück.

Problemfall: Populationsdaten

Die letzte Volksählung in Deutschland war der Zensus 2011. Dort wurden die Populationsdaten auf Gemeindeebene und pro Altersjahr erfasst. Da sich die Bevölkerungstruktur durchgehend leicht ändert, erstellt das Statistische Bundesamt Fortschreibungen des Bevölkerungsstandes. Zuletzt mit dem Stand 31.12.2019. Öffentlich zugänglich sind dabei auf Kreisebene aber nur Bevölkerungsdaten nach Altersgruppen (z.B. 0-3, 3-6, ...) und nicht nach Altersjahren. Auf Bundeslandebene sind wiederrum Populationsdaten nach Altersjahren möglich.

Das RKI mit dem Interface SurvStat veröffentlicht Inzidenzwerte (für Covid-19 und andere Krankheiten) und auch absolute Werte der Anzahl an positiv getesteten nach Altersjahren. Da beide Datenwerte abgefragt werden können, haben wir uns dazu entschlossen die Populationsdaten, welche dem RKI vorliegen, aus der Inzidenz und den absoluten Zahlen zurückzurechnen. Dabei erhalten wir Populationsdaten pro Altersjahr und auf Kreisebene. Fortlaufend fragen wir deshalb immer nur die absoluten Werte bei SurvStat ab und errechnen die Inzidenzwerte selbst.

Hierbei haben nun @icestormfr und Robert Gieseke festgestellt, dass das RKI/SurvStat einen Mittelwert der Populationsdaten errechnet wenn man keinen expliziten Filter für die Jahre 2020 und 2021 setzt. Hierbei werden also Bevölkerungsstände von mehreren Jahren vermischt was selbstverständlich keinen Sinn ergibt. Sinnvollerweise würde man die Inzidenzwerte auf die Populationsdaten des entsprechenden Jahres beziehen.

Die Auswirkungen dieses Fehlers sind in den folgenden zwei Bildern beispielhaft für den Landkreis Konstanz dargestellt.

Inzidenzwerte vor der Behebung des Fehlers:

before bug

Inzidenzwerte nach der Behebung des Fehlers:

after bug

Wie auch schon durch @icestormfr festgestellt sind die Inzidenzwerte durch den Fehler tendenziell erhöht. Dies muss allerdings nicht für alle Kreise und Altersgruppen/-jahre generell gelten.

Es bleibt anzumerken, dass alle anderen Inzidenzwerte, welche in CoronaVis dargestellt werden, nicht von dem Fehler betroffen waren da wir hier bereits die aktuellsten Populationsdaten vom Statistischen Bundesamt verwendet haben und nicht auf die Populationsdaten des RKI zurückgegriffen haben.

Wir bedauern den Fehler und bedanken uns nochmals herzlich bei @icestormfr und Robert Gieseke für die Hinweise und Erläuterungen.