Statistikerin: Zahlen sind falsch, weil sie nicht die Realität abbilden

0
161
Werbebanner

Problem der Fallzahlen : Statistikerin: Die Coronazahlen sind falsch, weil sie nicht die Realität abbilden

Die Fallzahlen, die vermeintliche “Experten” seit Wochen analysieren, bilden keineswegs das wahre Ausmaß der Corona-Epidemie in Deutschland ab. Deshalb ist es jetzt unerlässlich, repräsentativ zu testen. Nur so werden wir genug Daten haben, um das Virus richtig einzuschätzen.

In den letzten Tagen analysieren immer mehr „Statistik-Experten“ die COVID-19-Fallzahlen bis zum Äußersten. In bunten, interaktiven Grafiken wird uns erklärt, was jetzt aber wirklich die Wahrheit ist. Mit Datenkompetenz hat das nichts zu tun.

Wir wissen, dass jede unserer Modellrechnungen falsch sein muss. Trotzdem sind die Schlussfolgerungen richtig: Schaffen wir es nicht, die Ansteckungsrate rasch auf einen Wert zu bringen, der geringer ist als derjenige der optimistischsten Szenarien, wird unser Gesundheitssystem kollabieren. Selbst das „best case“ Szenario erlaubt keine Sorglosigkeit. Es braucht erhebliche Datenkompetenz, um zu verstehen, dass man auch aus „falschen“ Zahlen richtiges Handeln ableiten kann.

Spannend, aber gerade keine Zeit?

Die Zahlen sind „falsch“, weil sie nur einen kleinen Teil der Realität abbilden: die schwer Erkrankten, einen Teil der leichter Erkrankten mit Symptomen und einen ganz kleinen Teil von Menschen ohne Krankheitszeichen, die getestet wurden, weil sie Verdachtsfälle waren. Die Dunkelziffer ist unbekannt. Wir Statistiker haben deshalb ein Problem. Von uns wird erwartet, dass wir Prognosen erstellen, aber die Daten sind dafür nicht geeignet, weil sie zu wenige Informationen enthalten.

Je länger diese Phase der Unsicherheit andauert, umso größer die Gefahr, dass viele Menschen die Einschränkungen nicht mehr akzeptieren wollen. Deswegen ist es unerlässlich, Tests an repräsentativen Bevölkerungsstichproben durchzuführen.

Politik kann und muss Verantwortung übernehmen

Hier kann und muss die Politik Verantwortung übernehmen, indem sie dafür sorgt, dass hierfür genügend Testkapazität zur Verfügung steht. Es geht nicht darum, offensichtlich kranken Menschen Tests „für die Statistik“ zu verweigern. Belastbare Statistiken benötigen nur etwa 1.000 Tests am Tag. Damit ließe sich praktisch sofort die Wirksamkeit der Steuerungsmaßnahmen beurteilen, ohne dass man wie jetzt bis zu zwei Wochen auf die neu gemeldeten Fälle/Todesfälle warten muss.

 

Gemeldete Coronavirusfälle in Deutschland (klicken Sie auf Ihr Bundesland)

 
 

Zur Einschätzung der aktuellen, retrospektiven und prospektiven Infektionsrate können wir verschiedene Ansätze kombinieren. Zufälliges, wiederholtes Testen mit den verfügbaren PCR-Tests erlaubt es, Maßnahmen für die Gesamtbevölkerung valide zu begründen. Eine solche Strategie kann zudem Cluster Infizierter aufzudecken, in denen verstärkt getestet wird oder besondere Vorsichtsmaßnahmen nötig sind.

Ein Test-Pooling, in dem die Proben mehrerer Personen gemeinsam getestet werden, kann zumindest am Anfang effizienter sein. Finden sich in zehn gepoolten Test mit den Proben von jeweils zehn Personen zwei Tests mit positiven Ergebnissen, so können die darin abgebildeten 20 Personen nachgetestet werden. Man benötigt also nur 30 Tests statt 100, um 100 Personen zu testen.

Daten kombinieren und als „Big Data“ analysieren

Alle vorhandenen Daten sollten kombiniert und als „Big Data“analysiert werden.

  • Was charakterisiert Menschen mit Symptomen, die nicht den Einschlusskriterien für Tests genügen?
  • Welche Tests stammen aus Gruppen mit erhöhtem Risiko, z.B. von Krankenhauspersonal
  • Wo wurden im Haushalt lebende Angehörige nicht getestet und sind diese symptomatisch?
  • Wie alt und krank waren positiv Getestete im Gegensatz zu negativ Getesteten, waren Menschen mit Symptomen und solche ohne?
  • Wie viele Tests gab es überhaupt bisher?

Um das Gesamtbild zu erkennen, können wir einen großzügigen Maßstab an die Sensitivität und Spezifität der Tests anlegen. Es ist kein Argument, repräsentatives Testen mit Hinweis auf Fehlerraten abzulehnen, solange diese Fehlerraten bekannt sind und nicht mit der Wahrscheinlichkeit zusammenhängen, in die Stichprobe aufgenommen zu werden. Dann lassen sich die falsch positiven und falsch negativen Ergebnisse herausrechnen. Fehlerraten spielen erst eine Rolle, wenn im Einzelfall ein Verdacht auf COVID-19 vorliegt und man ein zuverlässiges Ergebnis benötigt.

Nordische Länder wie Island, Norwegen und Schweden gehen beispielhaft voran, auch Luxemburg plant eine Strategie für repräsentative Tests. Verleicht man die Verteilung der nachgewiesenen COVID-19-Fälle auf die Altersgruppen zwischen Island und den Niederlanden, fällt auf wie stark die Verzerrung durch nicht-repräsentative Tests ist. Auch wenn man berücksichtig, dass die isländische Bevölkerung im Schnitt rund 6 Jahre jünger ist als die niederländische, bleibt ein gravierender Unterschied.

 

Alle wichtigen Meldungen zum Coronavirus im FOCUS-Online-Newsletter. Jetzt abonnieren.

 
 

Europaweit abgestimmte Strategie ist unverzichtbar

Eine europaweit abgestimmte Strategie, die ein Benchmarking erlaubt, ist unverzichtbar. Nur so können wir stufenweise zu einem einigermaßen normalen Leben zurückkehren und damit die negativen Folgen dieser Pandemie einigermaßen begrenzen. Es geht dabei nicht bloß um die Wirtschaft. Die Isolation ist eine Katastrophe für psychisch kranke Menschen und für Frauen und Kinder (und natürlich auch Männer), die von häuslicher Gewalt bedroht sind. Diese möglichen Konsequenzen, die unsere Gesellschaft nachhaltig aus den Fugen bringen können, sind nicht zu Ende gedacht.

Dabei hat im November 2019 die Bundesregierung erst ein Eckpunktepapier zur Datenstrategie vorgelegt. Es beginnt mit den Worten: „Daten [sind] eine Schlüsselressource (..) für staatliches Handeln. Die Fähigkeit, Daten verantwortungsvoll und selbstbestimmt zu nutzen, (…) ist gleichermaßen Grundlage für (…) das Generieren von Wissen und für den gesellschaftlichen Zusammenhalt.“. Als zentrale Handlungsfelder werden die verantwortungsvolle Datennutzung und die Erhöhung der Datenkompetenz gefordert.

Der Stifterverbands der Wissenschaften hingegen hat bereits im August 2019 mit dem „Data Literacy Framework“ einen umfassenden Kompetenzrahmen für Data Literacy vorgelegt, der konkrete Beispiele für die Anwendung von Datenethik liefert. Insbesondere ist die Notwendigkeit der Einbeziehung verschiedenster Perspektiven (Fachexperte, Datenexperte, Datenschützer, Datenethiker) herausgearbeitet.

Bayrische Regierung prescht vor

Daher ist der Vorstoß der bayerischen Staatsregierung zur Durchführung einer randomisierten Stichprobe uneingeschränkt zu begrüßen, selbst wenn sich Bayerns Wissenschaftsminister Bernd Sibler damit der Meinung des RKI-Präsidenten und anderer Wissenschaftler entgegenstellt. Sibler verweist zu Recht darauf, dass man das Coronavirus und seine Verbreitung erst besser verstehen müsse, um darauf mit den richtigen Maßnahmen reagieren zu können. Das aber sei nur auf Basis von belastbaren Zahlen und Datenanalysen möglich.

Im Rahmen der Münchener COVID-19-Kohorte werden 3000 Haushalte Haushalte aus München ausgewählt. Das Tropeninstitut der Ludwig-Maximilians-Universität München will an rund 4500 Personen herausfinden, wie viele Menschen tatsächlich schon mit dem Coronavirus infiziert sind. Etwa drei Milliliter Blut werden bei der Probenentnahme jeweils abgenommen und dann auch auf Antikörper gegen SARS-CoV-2 getestet.

So lassen sich auch Personen finden, die vermutlich immun gegen das Coronavirus sind –  entweder, weil sie die Krankheit überwunden haben, oder weil sie eine vorab bestehende Immunität aufweisen. An der Studie sind Ärzte, Epidemiologen, Mikrobiologen, aber auch Statistiker, Mathematiker und Informatiker beteiligt.

  • Lesetipp: Alle Neuigkeiten zum Ausbruch des Coronavirus lesen Sie im News-Ticker

Datenkompetenz und Datenethik

Eine solche interdisziplinäre Zusammenarbeit ist dringend notwendig, um nicht nur Daten zu generieren, sondern Handlungswissen. Der Streit zwischen Wissenschaftlern unterschiedlicher und gleicher Disziplinen zeigt nämlich bisher vor allem eines: Wir haben viel Nachholbedarf beim Thema Datenkompetenz und -ethik. Die zahlreichen „Corona-Dashboards“, die mittlerweile im Internet zu finden sind, mögen eindrucksvolle Beweise dafür sein, dass ihre Ersteller die Anwendung professioneller Visualisierungs- und BI-Tools beherrschen. Mit Datenkompetenz als Schlüsselkompetenz des 21. Jahrhunderts hat das aber wenig zu tun.

Datenkompetenz umfasst:

  1. komplexes Fachwissen
  2. die Fähigkeit und Fertigkeit, es richtig anzuwenden
  3. die Motivation und Werthaltung, mit Daten das Richtige zu tun

Datenkompetenz setzt also einerseits die Fähigkeit voraus zu erkennen, welche Aussagekraft Daten besitzen und wo ihre Grenzen liegen. Das ist kritisches Denken. Andererseits braucht es die Motivation, Daten nicht so zu präsentieren, dass der Laie aus ihnen falsche Schlüsse zieht. Das ist Datenethik.

 

 
 

Eine Pandemie ist ein komplexes System

Der große Wissenschaftler und Nobelpreisträger Friedrich August von Hayek (1899–1992) warnte bereits vor vielen Jahrzehnten vor der Anmaßung von Wissen – wenn auch im Kontext des komplexen Systems der Ökonomie. Bei einer Pandemie handelt es sich ebenfalls um ein komplexes System, das mit Intuition allein nicht verstanden werden kann. „Es sieht manchmal so aus, als seien die Techniken der Wissenschaft leichter zu erlernen als das Denken, das uns zeigt, welches die Probleme sind und wie man sie angeht.“

München und Heinsberg, wo der Virologe Hendrik Streeck eine repräsentative Kohortenstudie durchführt, zeigen: Es geht auch anders. Es gilt, eine integrierte Perspektive einzunehmen, die sämtliche Konsequenzen für die Gesundheit, den gesellschaftlichen Zusammenhalt und Wohlstand in den Blick nimmt.

Dafür braucht es belastbare Daten, die die Effekte von COVID-19 und der verschiedenen Möglichkeiten staatlichen Handelns auf sämtliche Lebensbereiche messen können. Nur so kann der politische Umgang mit der Corona-Krise in Deutschland zum Lehrstück für verantwortungsvolle Datennutzung und Datenkompetenz werden.

Sehen Sie im Video: Masken selber nähen! Feuerwehr veröffentlicht einfache Video-Anleitung

 

[Coustom ad_2]
Dieser Beitrag ist ein öffentlicher RSS Feed. Sie finden den Original Post unter folgender Quelle (Website) .

Krypto-Nachrichten ist ein RSS-Nachrichtendienst und distanziert sich vor Falschmeldungen oder Irreführung. Unser Nachrichtenportal soll lediglich zum Informationsaustausch genutzt werden.

Werbebanner

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here

7 − 2 =