Eine von 342 Millionen: Die statistische Lüge, die Lucia de Berk ins Gefängnis brachte

Die Zahl, die sie verurteilte

Im Jahr 2003 befand ein niederländisches Gericht Lucia de Berk für schuldig an vier Morden und einem Mordversuch an Patienten des Juliana-Kinderkrankenhauses in Den Haag. Das Urteil stützte sich wesentlich auf eine einzige Zahl: eine von 342 Millionen.

So hoch schätzte ein vom Gericht bestellter Statistiker die Wahrscheinlichkeit ein, dass eine Pflegerin allein durch Zufall bei so vielen «verdächtigen» Vorfällen anwesend sein könnte. Diese Zahl hatte enormes Gewicht. Sie klang wissenschaftlich. Sie klang präzise. Sie implizierte eine nahezu sichere Schuld. In einem Gerichtssaal, vorgetragen von einem Sachverständigen und aufgenommen von Richtern ohne Fachausbildung im Bereich probabilistischen Denkens, hatte sie den Anschein eines Beweises.

Die Zahl war in fast jeder wesentlichen Hinsicht falsch. Sie wurde mithilfe einer Methode berechnet, die einen fundamentalen logischen Fehler enthielt — bekannt als der Staatsanwaltsfehlschluss. Sie beruhte auf einer Liste von Vorfällen, die als «verdächtig» eingestuft worden waren, nachdem Lucia bereits als Verdächtige identifiziert worden war — ein Klassifizierungsprozess, der durch denselben Verdacht kontaminiert war, den er eigentlich belegen sollte. Die Frage, die der Statistiker beantwortete — wie hoch ist die Wahrscheinlichkeit, dass diese Pflegerin bei so vielen Vorfällen anwesend war? — war nicht die Frage, die das Gericht beantwortet haben musste — wie hoch ist die Wahrscheinlichkeit, dass diese Pflegerin diese Vorfälle verursacht hat? Der Unterschied ist nicht technisch. Es ist der Unterschied zwischen Beweisen und Zirkularität.

Doch 2003 hielt die Zahl vor einem Haager Gericht stand. Lucia de Berk ging ins Gefängnis.


Die Pflegerin

Lucia de Berk wurde 1961 in Den Haag geboren. Ihr Weg zur Krankenpflege war nicht geradlinig. Sie hatte eine schwierige frühe Jugend — finanzielle Engpässe, unterbrochene Ausbildung, Arbeit in verschiedenen Ländern. Sie hatte eine Tochter. Sie trug die Last eines vertraulichen Vorstrafenregisters aus ihrer Jugend, das nichts mit Gewalt oder Medizin zu tun hatte.

Sie kam später als die meisten zur Krankenpflege und erwarb ihre Qualifikation in den 1990er-Jahren. Anfang der 2000er-Jahre arbeitete sie als Kinderkrankenpflegerin am Juliana-Kinderkrankenhaus und hatte zuvor am Roten-Kreuz-Krankenhaus in Den Haag sowie am Leyenburg-Krankenhaus gearbeitet. Nach Aussagen von Kollegen und Vorgesetzten war sie gewissenhaft und engagiert. Sie war dafür bekannt, sich schwierige Schichten zu suchen, mit den schwerstkranken Patienten zu arbeiten und der härtesten Seite der Krankenpflege nicht aus dem Weg zu gehen.

Diese Eigenschaft — die freiwillige Übernahme der schwierigsten Fälle, die Nähe zu den verletzlichsten Patienten — wurde zunächst nicht als Ausdruck einer hingebungsvollen Pflegerin verstanden. Nachdem der Verdacht sich geformt hatte, wurde sie als sinistres Verhalten umgedeutet. In der Pflegeliteratur nennt man das das «Heldenpflegerin»-Syndrom, das einem hypothetischen Teilkreis von Gesundheitsarbeitern zugeschrieben wird, die Patienten schaden, um bei der Reanimation anwesend zu sein. Als die Ermittler Lucias Arbeitsmuster untersuchten, hatte sich ihr Engagement in Beweise gegen sie verwandelt.


Die Ermittlungen beginnen

Die Kette, die zu Lucias Verhaftung führte, begann mit einem einzigen Todesfall.

Am 4. September 2001 starb im Juliana-Kinderkrankenhaus ein Säugling namens Amber — vier Monate alt, leidend an einem schwerwiegenden angeborenen Herzfehler. Der Tod wurde zunächst nicht als verdächtig eingestuft. Doch in den folgenden Wochen begann eine Stationshelferin namens Wil Kroon, die Stationsunterlagen zu prüfen, und erkannte ein statistisches Muster: Lucia de Berk war, wie sie feststellte, bei einer ungewöhnlich hohen Anzahl von Reanimationen und Todesfällen anwesend gewesen.

Kroon war keine Statistikerin. Sie hatte keine formale Ausbildung in Wahrscheinlichkeitsrechnung oder in der Analyse von Mustern in Schichtdaten. Doch sie zählte — und berichtete der Krankenhausleitung, was sie gezählt hatte. Eine vorläufige interne Untersuchung folgte. Die Leitung alarmierte die Polizei. Die Polizei zog einen Experten hinzu.

Der Experte war ein Professor für Recht und Statistik namens Henk Elffers. Elffers berechnete die Wahrscheinlichkeit, dass Lucia bei der Anzahl von Vorfällen anwesend war, die in ihren drei Krankenhäusern als verdächtig eingestuft worden waren. Die Berechnung ergab eine Zahl, die je nach untersuchter Iteration der Berechnung unterschiedlich als zwischen einer von 342 Millionen und einer von 9 Milliarden angegeben wurde. Allein diese Schwankungsbreite hätte alarmierend sein müssen. Stattdessen wurde die Zahl als gesichertes Wissen behandelt.

Lucia de Berk wurde im Dezember 2001 verhaftet.


Prozess und Verurteilung

Der erste Prozess fand vor dem Bezirksgericht Den Haag statt. Die Staatsanwaltschaft stellte einen Fall zusammen, der statistische Beweise mit medizinischen Aussagen über spezifische Todesfälle und Vorfälle verband. In einigen Fällen wurden toxikologische Beweise präsentiert — Behauptungen, dass bestimmte Patienten Substanzen außerhalb des regulären Behandlungsprotokolls erhalten hatten. Medizinische Sachverständige sagten aus, dass bestimmte Todesfälle aufgrund klinischer Marker verdächtig seien, die ihrer Ansicht nach auf externe Einwirkung hindeuteten.

Das statistische Argument unterlegte alles. Wenn der Zufall allein Lucias Anwesenheit bei so vielen verdächtigen Ereignissen nicht erklären konnte, dann war ihre Anwesenheit kein Zufall. Wenn sie kein Zufall war, dann war sie die Ursache. Das Denken bewegte sich von Korrelation zu Kausalität, ohne den Schlussfolgerungssprung ernsthaft zu hinterfragen.

Die Verteidiger fochten die statistische Methodik an, doch Sachverständigenaussagen in der Statistik lassen sich vor Gericht bekanntermaßen nur schwer wirksam bestreiten. Die Herausforderung der Verteidigung war technisch kompetent, aber prozessual unzureichend — die Richter, die nicht ausgebildet waren, konkurrierende statistische Argumente zu beurteilen, verließen sich auf den Sachverständigen der Staatsanwaltschaft.

Am 24. März 2003 verurteilte das Bezirksgericht Lucia de Berk wegen vier Morden und einem Mordversuch. Sie wurde zu lebenslanger Haft verurteilt.

Sie legte Berufung ein. Im Juni 2004 bestätigte das Berufungsgericht Den Haag das Urteil — und erweiterte es. Das Berufungsgericht befand sie in allen drei Krankenhäusern für schuldig an sieben Morden und drei Mordversuchen. Die lebenslange Freiheitsstrafe wurde bestätigt.

2004 verwies der Oberste Gerichtshof der Niederlande den Fall aus technischen Gründen zurück, die mit der Zulässigkeit ihrer Jugendstrafe zusammenhingen. 2006 bestätigte das Berufungsgericht Amsterdam — das den Fall bei der Zurückverweisung prüfte — erneut die Verurteilung wegen sechs Morden und einem Mordversuch.

Lucia de Berk war von drei Gerichten dreimal verurteilt worden. Die statistische Grundlage war auf jeder Ebene geprüft und akzeptiert worden. Sie saß im Gefängnis. Sie blieb insgesamt sechs Jahre inhaftiert, bevor der Fall anfing auseinanderzufallen.


Die Statistiker, die es bemerkten

Die erste ernsthafte öffentliche Herausforderung der statistischen Grundlage des Falles kam nicht aus den Gerichten, sondern aus der Wissenschaft.

2007 veröffentlichte ein niederländischer Statistiker namens Piet Groeneboom eine detaillierte Analyse von Elffers' Methodik. Groeneboom identifizierte mehrere Fehler — nicht nur den Staatsanwaltsfehlschluss, sondern auch Fehler bei der zugrundeliegenden Ereignisklassifizierung, Fehler bei der Berechnung der erwarteten Häufigkeiten und was er als fundamentales Missverständnis darüber beschrieb, wie Wahrscheinlichkeitsberechnungen in forensischen Kontexten strukturiert sein müssen.

Der Staatsanwaltsfehlschluss, so wie er in Lucias Fall angewandt wurde, funktionierte folgendermaßen: Elffers berechnete die Wahrscheinlichkeit, dass eine Pflegerin bei so vielen Vorfällen anwesend sein würde, wenn die Vorfälle zufällig verteilt wären. Er stellte fest, dass sie sehr gering war. Das Gericht interpretierte dies dahingehend, dass Lucias Anwesenheit mit sehr geringer Wahrscheinlichkeit unschuldig war. Doch dies verwechselt zwei verschiedene Fragen. Die Wahrscheinlichkeit, unschuldig bei vielen Vorfällen anwesend zu sein, ist nicht dasselbe wie die Wahrscheinlichkeit der Unschuld. Eine Pflegerin, die die schwierigsten Schichten übernimmt, die sich auf die kritischsten Patienten spezialisiert und eine lange Karriere mit vielen Hochrisikopatienten hat, wird naturgemäß eine höhere Anwesenheitsrate bei ungünstigen Ereignissen haben als eine Pflegerin in einer regulären Station. Das statistische Modell muss die spezifischen Arbeitsmuster der Pflegerin berücksichtigen, bevor eine sinnvolle Wahrscheinlichkeit berechnet werden kann. Elffers' Modell tat das nicht.

Groeneboom schlossen sich andere niederländische Statistiker an. Der Statistiker Richard Gill, der zum hartnäckigsten und öffentlich sichtbarsten Befürworter einer Fallüberprüfung werden sollte, veröffentlichte Analysen, die zeigten, dass die vermeintliche astronomische Unwahrscheinlichkeit von Lucias Anwesenheit bei korrekter Berechnung — unter Berücksichtigung der tatsächlichen Schichtverteilung und der Basishäufigkeit ungünstiger Ereignisse in der pädiatrischen Intensivpflege — vollkommen unremarkabel wurde.

Das parallele Problem war die Klassifizierung der Vorfälle. Die Liste der als «verdächtig» geltenden Ereignisse war zusammengestellt worden, nachdem Lucia zur Verdächtigen geworden war, von Personen, die wussten, dass sie eine Verdächtige war, die Unterlagen mit dem spezifischen Ziel prüften, mit ihrer Anwesenheit verbundene Ereignisse zu identifizieren. Das sind keine unabhängigen Beweise. Das ist zirkuläres Denken: Die Vorfälle wurden teilweise als verdächtig eingestuft, weil Lucia dabei war, und dann wurde ihre Anwesenheit bei verdächtigen Vorfällen genutzt, um ihre Schuld zu argumentieren.

Das statistische Argument bewies bei eingehender Prüfung nichts.


Die medizinischen Beweise kollabieren

Während Statistiker begannen, die Wahrscheinlichkeitsberechnung zu demontieren, begannen forensische Pathologen und medizinische Experten, die Todesfälle selbst neu zu untersuchen.

Der Fall Lucia de Berk hatte immer auf einem zweiten Pfeiler beruht: der Behauptung, dass bestimmte Todesfälle klinische Marker einer unnatürlichen Ursache aufwiesen. Die Staatsanwaltschaft hatte argumentiert, dass bestimmte Patienten an Digoxin-Toxizität gestorben seien — das heißt, dass ihnen toxische Dosen des Herzmedikaments Digoxin verabreicht worden waren. Andere Todesfälle wurden einer Morphin-Überdosis oder anderen pharmazeutischen Eingriffen außerhalb des Behandlungsprotokolls zugeschrieben.

Diese Behauptungen wurden zwischen 2007 und 2010 von unabhängigen medizinischen Gremien neu untersucht. Die Ergebnisse waren methodisch verheerend.

Die Behauptungen zur Digoxin-Toxizität wurden zuerst geprüft. Die ursprünglichen toxikologischen Analysen hatten in Gewebeproben erhöhte Digoxin-Werte festgestellt. Die Nachuntersuchung ergab mehrere Probleme: Einige der ursprünglichen Proben waren degradiert oder falsch gelagert worden; postmortale Digoxin-Spiegel bei pädiatrischen Patienten variieren bekanntermaßen enorm aufgrund natürlicher physiologischer Faktoren, die nichts mit externer Verabreichung zu tun haben; und die zur Klassifizierung der Spiegel als «toxisch» verwendeten Referenzbereiche waren inkonsistent und schlecht dokumentiert.

Noch bedeutsamer: Als unabhängige Pädiater und forensische Pathologen die zugrunde liegenden klinischen Aufzeichnungen der Todesfälle prüften, ohne zu wissen, welche Todesfälle angeblich verdächtig waren, trat ein auffallendes Muster zutage: Die große Mehrheit der Todesfälle hatte völlig plausible natürliche Erklärungen. Es handelte sich um kritisch kranke Patienten — Säuglinge und Kinder mit schwerwiegenden Herzerkrankungen, frühgeborene Neugeborene, ältere Patienten mit komplexen Komorbiditäten. Auf einer pädiatrischen Intensivstation ist der Tod keine Seltenheit. Das Auftreten von Todesfällen im Protokoll einer Pflegerin, die mit den schwerstkranken Patienten arbeitete, war an sich kein Beweis für irgendetwas.

Im Herbst 2007 beauftragte das Kollegium der Generalstaatsanwälte — das Aufsichtsgremium des niederländischen Staatsanwaltschaftsdienstes — eine neue Untersuchung des Falles. Das Posthumus-II-Komitee, nach seinem Vorsitzenden benannt, wurde mit der Überprüfung der Verurteilungen beauftragt. Was das Komitee fand, führte unmittelbar zur Wiederaufnahme des Verfahrens.


Die Freispreisung

Im Oktober 2008 setzte der Oberste Gerichtshof der Niederlande Lucias Haft bis zur Überprüfung aus. Sie hatte sechs Jahre im Gefängnis verbracht. Sie wurde entlassen.

Der Überprüfungsprozess war gründlich und methodisch. Unabhängige medizinische Experten untersuchten jeden Todesfall und jeden Vorfall aus den ursprünglichen Anklageschriften erneut. Ein Gremium unabhängiger Statistiker überprüfte die statistischen Beweise. Der Überprüfungsprozess war nicht oberflächlich — er dauerte zwei Jahre.

Am 14. April 2010 sprach das Berufungsgericht Den Haag Lucia de Berk von allen Anklagepunkten frei. Jede Verurteilung — sieben Morde, drei Mordversuche — wurde aufgehoben. Das Gericht stellte fest, dass es keine glaubwürdigen medizinischen Beweise dafür gab, dass irgendein Patient ermordet worden war. Die Lucia zugeschriebenen Todesfälle waren, wie das Gericht feststellte, natürliche Todesfälle in einer Population kritisch kranker Patienten. Die statistischen Beweise waren wertlos. Die toxikologischen Beweise waren unzuverlässig.

Lucia de Berk war die ganze Zeit über unschuldig gewesen.

Sie erhielt eine Entschädigung vom niederländischen Staat. Kommentatoren bezeichneten die Entschädigung als unzureichend für sechs Jahre zu Unrecht verbrachter Haft, die Zerstörung ihrer Pflegekarriere und ein Jahrzehnt öffentlicher Stigmatisierung.

Sie war neunundfünfzig Jahre alt, als sie endlich rehabilitiert wurde.


Das System, das sie im Stich ließ

Der Fall Lucia de Berk scheiterte nicht wegen eines korrupten Experten oder eines inkompetenten Richters. Er scheiterte, weil jede beteiligte Institution unter dem erforderlichen Standard blieb.

Die Krankenhausleitung, die den Fall an die Polizei weitergegeben hatte, tat dies auf der Grundlage einer informellen Zählübung einer Stationshelferin, ohne unabhängige statistische Überprüfung. Die Polizei, die die Überweisung erhielt, beeilte sich, einen Fall rund um die statistischen Beweise aufzubauen, ohne sie angemessen zu testen. Die Staatsanwaltschaft akzeptierte das statistische Argument als beweiskräftig, ohne ein unabhängiges methodisches Audit in Auftrag zu geben. Drei Gerichte auf drei Ebenen akzeptierten Sachverständigenaussagen ohne die Werkzeuge zur Bewertung ihrer Gültigkeit. Die forensischen Pathologen, die die medizinischen Behauptungen der Staatsanwaltschaft unterstützten, taten dies in einem Umfeld, das bereits von Verdacht gesättigt war — ihre Schlussfolgerungen wurden nicht in Isolation von der Schuldvermutung gebildet.

Und das niederländische medizinische und rechtliche Establishment — trotz des Vorhandenseins, während des gesamten Verfahrens, qualifizierter Statistiker und Kliniker, die Zweifel hatten — produzierte die koordinierte Herausforderung, die der Fall erforderte, erst Jahre nach den Verurteilungen.

Der Fall ist seitdem zu einer Grundlagenstudie über den Missbrauch statistischer Beweise in Strafgerichten geworden. Die Professoren Richard Gill und Piet Groeneboom haben ausführlich darüber publiziert. Er wird an Rechtsfakultäten und Statistikabteilungen in ganz Europa und darüber hinaus als anschaulichste Illustration des Staatsanwaltsfehlschlusses und der Gefahren von Sachverständigenaussagen gelehrt, die Gerichte nicht unabhängig bewerten können.

Die niederländische Regierung beauftragte eine breite Überprüfung vergleichbarer Fälle. Die Überprüfung identifizierte weitere Verurteilungen, die möglicherweise auf ähnlichen statistischen oder medizinischen Beweisfehlern beruhten — nicht alle wurden erneut geprüft.


Die Nachwirkungen und die unbeantworteten Fragen

Lucia de Berk wurde freigesprochen. Ihre Entschädigung wurde gezahlt. Die offizielle Aufzeichnung ist klar: Sie ist unschuldig, die Todesfälle waren natürlich, die Statistiken waren ungültig.

Doch der Fall hinterlässt Restfragen, die im öffentlichen Protokoll nicht vollständig aufgelöst worden sind.

Die medizinischen Sachverständigen, die gegen sie ausgesagt hatten, wurden nicht diszipliniert. Der Statistiker Henk Elffers hatte keine beruflichen Konsequenzen für die Berechnung, die sie verurteilte. Die Stationshelferin, deren informelles Zählen die Ereigniskette ausgelöst hatte, wurde rechtlich nicht zur Rechenschaft gezogen. Die Staatsanwälte, die den Fall auf einer statistischen Grundlage aufgebaut hatten, die sie rigoros hätten testen müssen, wurden nicht sanktioniert.

Und die sechs Jahre, die Lucia im Gefängnis verbrachte — unter Bedingungen, die nach eigener Aussage verheerend für ihre Gesundheit und ihre Beziehung zu ihrer Tochter waren — können nicht zurückgegeben werden. Das öffentliche Stigma von drei Verurteilungen wegen Massenmordes an Säuglingen kann durch einen Freispruch, so eindeutig er auch sein mag, nicht vollständig ausgelöscht werden.

Vielleicht am beunruhigendsten ist die Frage, wie viele andere Lucia de Berks es gegeben hat — und noch geben könnte — in Gerichten, wo statistische Zeugenaussagen ohne Prüfung akzeptiert wurden, wo der Staatsanwaltsfehlschluss in die Sprache der Wissenschaft gekleidet wurde und wo die Lücke zwischen einem komplexen Wahrscheinlichkeitsargument und der Fähigkeit einer Jury oder eines Richterkollegiums, es zu beurteilen, im Dienste einer Verurteilung ausgenutzt wurde.

Die Antwort, wie forensische Statistiker seit 2010 wiederholt dokumentiert haben, lautet: mehr als eine.

Beweisauswertung

Beweiskraft
2/10

Die statistischen Beweise waren methodisch ungültig und wurden bei der unabhängigen Überprüfung demoliert; die toxikologischen Beweise beruhten auf degradierten Proben und fehlerhaften Referenzbereichen; die medizinischen Beweise kollabieren, als sie ohne das kontaminierende Wissen überprüft wurden, welche Todesfälle unter Verdacht standen. Bei den tatsächlich verfügbaren Beweisen gab es keinen Fall.

Zeugenglaubwürdigkeit
3/10

Die Stationshelferin, die die Untersuchung einleitete, hatte keine statistische Ausbildung und stellte die Vorfallsliste unter einer bereits gebildeten Hypothese zusammen. Medizinische Sachverständige arbeiteten in einem Umfeld vermuteter Schuld, das ihre Bewertungen kontaminierte. Unabhängige Experten, die dieselben Beweise ohne den kontaminierenden Kontext überprüften, kamen zu gegenteiligen Schlussfolgerungen.

Ermittlungsqualität
2/10

Die Ermittlung akzeptierte eine fehlerhafte statistische Analyse, ohne eine unabhängige methodische Überprüfung in Auftrag zu geben; klassifizierte Vorfälle auf zirkulärer Grundlage als verdächtig; ließ die forensisch-medizinische Untersuchung ohne den für valide Schlussfolgerungen notwendigen klinischen Basiskontext fortschreiten; und produzierte drei aufeinanderfolgende Verurteilungen auf der Grundlage von Beweisen, die vollständig kollabieren, als sie ordnungsgemäß unabhängiger Prüfung unterzogen wurden.

Lösbarkeit
10/10

Der Fall ist vollständig gelöst — Lucia de Berk wurde 2010 von allen Anklagepunkten freigesprochen und die Todesfälle wurden als natürlich verursacht bestätigt. Die «Lösbarkeit» im Nachhinein ist eine Bewertung der vollständigen Auflösung: Jedes angebliche Verbrechen wurde neu bewertet und als kein Verbrechen befunden. Es gibt nichts mehr zu lösen, da keine Morde stattfanden.

The Black Binder Analyse

Die Architektur des Fehlers

Der Fall Lucia de Berk ist in erster Linie keine Geschichte über Statistik. Er ist eine Geschichte über die Bedingungen, unter denen ein gesamtes institutionelles Ökosystem — Krankenhausleitung, Polizei, Staatsanwaltschaft und drei aufeinanderfolgende Gerichte — ein tiefgreifendes Unrecht hervorbringen und aufrechterhalten kann, ohne dass ein einzelner Akteur bewusst unehrlich sein muss.

Um zu verstehen, wie dies geschah, muss jede Fehlerebene separat verstanden werden, bevor gefragt wird, wie sie sich zusammensetzten.

**Das Klassifikationsproblem**

Der Fall begann mit einer Liste von Vorfällen. Wil Kroons informelle Durchsicht ergab eine Liste von Reanimationen und Todesfällen, bei denen Lucia anwesend gewesen war. Diese Liste war keine neutrale Zusammenstellung von Fakten. Sie wurde von einer Person zusammengestellt, die bereits die Hypothese gebildet hatte, dass Lucia für den Schaden verantwortlich war — und die Liste wurde durch die Prüfung von Unterlagen in diesem Kontext erstellt. Bestätigungsfehler wirkten auf der Ebene der Datenerhebung, bevor jede statistische Analyse begann.

Sobald die Liste existierte und an die Polizei übergeben wurde, hatte sich ein subtiler, aber entscheidender erkenntnistheoretischer Fehler in den Fall eingebettet: Die Vorfälle auf der Liste wurden als «verdächtig» bezeichnet. Doch sie waren nicht unabhängig verdächtig. Sie wurden verdächtig durch ihre Verbindung mit Lucia. Die Einordnung eines Ereignisses als verdächtig war keine vorherige Bewertung der klinischen Merkmale des Ereignisses; sie war eine Folge von Lucias Anwesenheit. Diese Zirkularität kontaminierte jeden nachfolgenden Schritt.

**Der Staatsanwaltsfehlschluss im Detail**

Henk Elffers' Berechnung fragte: Wie hoch ist die Wahrscheinlichkeit, dass eine Pflegerin allein durch Zufall bei so vielen Vorfällen anwesend ist? Die Antwort — etwa eine von 342 Millionen — ist tatsächlich niedrig. Doch die Frage, die die Berechnung beantwortete, ist nicht die für die Schuld relevante Frage.

Die relevante Frage lautet: Wenn eine Pflegerin bei so vielen Vorfällen anwesend war, wie hoch ist dann die Wahrscheinlichkeit, dass sie sie verursacht hat, gegenüber der Wahrscheinlichkeit, dass ihre Anwesenheit durch ihr Arbeitsmuster, ihren Patientenmix und andere nicht-kausale Faktoren erklärt wird?

Das sind nicht dieselben Fragen. Die erste Frage, die Elffers beantwortete, sagt etwas über die Seltenheit des Zufalls aus, unter der Annahme, dass Vorfälle zufällig auf Pflegekräfte verteilt sind. Die zweite Frage — die relevante — erfordert die Kenntnis der Basishäufigkeit von Negativereignissen in der spezifischen Einheit, die Schichtverteilung, den Schweregrad der Lucia zugewiesenen Patienten und die Vergleichsrate anderer Pflegekräfte, die unter ähnlichen Bedingungen mit ähnlichem Patientenmix arbeiten.

Nichts davon wurde getan. Die Grundfrequenz von Negativereignissen in einer pädiatrischen Intensivstation wurde nicht angemessen festgelegt. Lucias spezifische Schichthistorie wurde nicht zur Berechnung einer erwarteten persönlichen Rate von Negativereignissen herangezogen. Der Vergleich mit anderen Pflegekräften kontrollierte die Fallkomplexität nicht. Das Ergebnis war eine Wahrscheinlichkeitsberechnung, die mathematisch gültig war als Antwort auf die falsche Frage — und vor Gericht so verwendet wurde, als würde sie die richtige Frage beantworten.

**Die Dynamik der medizinischen Beweise**

Die medizinischen Zeugenaussagen erfolgten in einem kontaminierten erkenntnistheoretischen Umfeld. Als forensische Pathologen und Toxikologen gebeten wurden, die Todesfälle zu überprüfen, war Lucia bereits eine Verdächtige. Die mutmaßlichen Todesfälle waren bereits identifiziert. Den Experten wurde nicht gefragt: «Gibt es irgendetwas klinisch Ungewöhnliches an diesen Todesfällen?» Sie wurden gefragt: «Gibt es Beweise dafür, dass diese Todesfälle, die wir für verdächtig halten, durch externe Einwirkung verursacht wurden?»

Diese Rahmung erzeugt eine besondere Art motivierten Denkens, das keine Unehrlichkeit ist, aber auch keine Unabhängigkeit. Ein Experte, der einen Fall mit einer zu bewertenden Hypothese überprüft — anstatt Beweise ohne Hypothese zu prüfen — wird dazu neigen, Unterstützung für die Hypothese in mehrdeutigen Daten zu finden. Die erhöhten Digoxin-Werte, die in einigen Fällen festgestellt wurden, sind tatsächlich ungewöhnlich, aber ihre Bedeutung hängt vollständig vom Kontext ab: Welche Normalbereiche galten für die betreffende Patientenpopulation, wie wurden die Proben gelagert, welche natürlichen Erklärungen gibt es für die Variation der postmortalen Spiegel? Im Kontext eines mutmaßlichen Mordfalles werden mehrdeutige Laborbefunde zu Mordbeweisen. Im Kontext einer neutralen klinischen Überprüfung werden dieselben Befunde zu einem von vielen möglichen Befunden, die weitere Untersuchungen erfordern.

Als unabhängige Experten die Todesfälle überprüften, ohne zu wissen, welche angeblich verdächtig waren — der saubere methodische Ansatz, der von Anfang an hätte verwendet werden sollen — verschwanden die angeblichen klinischen Mordmarker weitgehend.

**Die institutionelle Kaskade**

Sobald das Krankenhaus den Fall an die Polizei weitergab, arbeitete jede nachfolgende Institution unter der Annahme, dass ihr Vorgänger angemessene Arbeit geleistet hatte. Die Polizei nahm an, dass die Krankenhausüberweisung auf klinischem Urteil beruhte. Die Staatsanwälte nahmen an, dass die Polizei die statistischen Beweise angemessen bewertet hatte. Die Gerichte nahmen an, dass die Staatsanwaltschaft Beweise zusammengestellt hatte, die den Beweisstandards entsprachen. Keine Institution kehrte zu den Grundprinzipien des Falles zurück — die Gültigkeit der ursprünglichen Liste, die Zuverlässigkeit der statistischen Methodik — weil jede annahm, dass die vorherige Institution dies bereits getan hatte.

Diese Kaskade ist nicht einzigartig für die Niederlande oder diesen Fall. Es ist ein strukturelles Merkmal von Strafjustizsystemen, die Fälle sequenziell durch mehrere Institutionen verarbeiten, von denen jede den Beweisrahmen der vorherigen Institution erbt. Fehler, die in der Ermittlungsphase eingeführt werden, bewegen sich vorwärts. Sie bewegen sich typischerweise nicht rückwärts.

**Die Sachverständigenlücke**

Auf der tiefsten Ebene zeigt der Fall eine strukturelle Unvereinbarkeit zwischen der Komplexität statistischer und medizinischer Sachverständigenaussagen und der Fähigkeit nicht-spezialisierter Gerichte, sie zu bewerten. Richter und Geschworene werden gebeten, zwischen konkurrierenden Sachverständigen zu entscheiden, ohne die technischen Werkzeuge zu haben, um festzustellen, welcher Experte recht hat. In der Praxis bedeutet dies, dass sie auf den Experten zurückgreifen, dessen Aussage zuerst präsentiert wird, dessen Referenzen beeindruckender sind oder dessen Argument intuitiv überzeugender klingt — keines davon ist ein zuverlässiger Indikator für Genauigkeit.

Die Lösung dieses Problems — unabhängige Gerichtssachverständige zu bestellen, anstatt auf kontradiktorische Sachverständige zu vertrauen, Sachverständigenaussagen vor ihrer Zulassung durch unabhängige technische Gremien überprüfen zu lassen, methodische Standards für probabilistische Beweise einzuführen — wurde seit dem Fall Lucia de Berk wiederholt vorgeschlagen. Die Umsetzung war inkonsistent. Die grundlegende Verwundbarkeit bleibt.

Ermittler-Briefing

Sie überprüfen einen Fall, der rückwärts konstruiert wurde — von einem Verdächtigen zu Beweisen, statt von Beweisen zu einem Verdächtigen. Um ihn zu verstehen, müssen Sie jede Schicht der Ermittlungslogik entfalten, um zu identifizieren, wo sie zuerst schiefging. Beginnen Sie mit der ursprünglichen Vorfallsliste. Die Stationshelferin Wil Kroon stellte eine Reihe von Reanimationen und Todesfällen zusammen und stellte fest, dass Lucia bei einer ungewöhnlichen Anzahl davon anwesend war. Bevor Sie eine statistische Analyse vornehmen, müssen Sie wissen: Wie wurde jeder Vorfall für die Liste ausgewählt? Wurde jeder unabhängig von einem klinischen Experten als mit natürlichen Ursachen unvereinbar bewertet, bevor Lucias Anwesenheit bekannt war? Oder war Lucias Anwesenheit das primäre Einschlusskriterium? Wenn Letzteres, ist die Liste kein unabhängiger Beweis — es ist zirkuläres Denken, formalisiert in einer Tabellenkalkulation. Dann untersuchen Sie die statistische Berechnung. Die Zahl einer von 342 Millionen wurde durch die Frage erzeugt, wie hoch die Wahrscheinlichkeit ist, dass diese Pflegerin zufällig bei so vielen Vorfällen anwesend ist. Fragen Sie stattdessen: Wie hoch ist die Basishäufigkeit von Negativereignissen in dieser spezifischen Einheit, während der spezifischen Schichten, die Lucia arbeitete, mit den spezifischen Patientenschwere-Graden, die ihr zugewiesen wurden? Als Richard Gill unter Verwendung dieser Parameter neu berechnete, wurde das Unwahrscheinliche zum Gewöhnlichen. Finden Sie Gills veröffentlichte Analyse und arbeiten Sie sie Schritt für Schritt durch. Untersuchen Sie dann die medizinischen Beweise isoliert vom statistischen Argument. Fragen Sie für jeden angeblich verdächtigen Todesfall, was eine klinische Überprüfung schlussfolgern würde, wenn der Prüfer nicht wüsste, welche Todesfälle unter Beobachtung stehen — wenn er die gesamte Sterblichkeitsaufzeichnung der Station statt einer kuratierten Liste überprüfte. Die unabhängige Überprüfung vor dem Freispruch tat genau das, und die Ergebnisse zerstörten den medizinischen Fall der Staatsanwaltschaft. Verfolgen Sie, wie jeder Todesfall von «natürlichen Ursachen» oder «unbestimmt» zu «Mord» in der Rahmung der Staatsanwaltschaft überging. Untersuchen Sie dann die toxikologischen Behauptungen zu Digoxin. Identifizieren Sie die Referenzbereiche, die zur Klassifizierung von Digoxin-Spiegeln als toxisch verwendet wurden. Stellen Sie fest, wie die ursprünglichen Proben gelagert wurden und ob sie zwischen Entnahme und Analyse degradierten. Lesen Sie die Literatur zur postmortalen Digoxin-Variation bei pädiatrischen Patienten. Die spezifische Behauptung, dass mehrere Säuglinge mit Digoxin vergiftet worden waren, war der härteste medizinische Beweis der Staatsanwaltschaft — und war der erste, der unter unabhängiger Überprüfung kollabierte. Fragen Sie schließlich die strukturelle Frage: An welchem Punkt dieser Ermittlungskette hätte der Fehler entdeckt werden können, und von wem? Die Antwort ist mit fast an Sicherheit grenzender Wahrscheinlichkeit auf der statistischen Ebene — wenn das Gericht einen unabhängigen Statistiker zur Überprüfung von Elffers' Methodik bestellt hätte, anstatt sich auf kontradiktorische Sachverständigenaussagen zu verlassen. Die nachfolgenden medizinischen und rechtlichen Versäumnisse waren nachgelagerte Konsequenzen eines Wahrscheinlichkeitsfehlers, der nie richtig angefochten wurde, bis Akademiker außerhalb des Rechtsprozesses sechs Jahre zu spät intervenierten.

Diskutiere diesen Fall

  • Die Wahrscheinlichkeitszahl von einer von 342 Millionen wurde über sechs Jahre hinweg drei aufeinanderfolgenden Gerichten präsentiert und jedes Mal akzeptiert — wie sollten Gerichte strukturiert sein, um hochspezialisierte statistische Aussagen zu beurteilen, und bevorzugt das aktuelle kontradiktorische Modell von Sachverständigen systematisch die Partei, die den überzeugendst klingenden Experten aufbieten kann?
  • Lucias Eigenschaft, schwierige Schichten zu suchen und mit schwerstkranken Patienten zu arbeiten — ein Verhalten, das professionelle Hingabe widerspiegelt — wurde nach ihrer Verhaftung als Beweis für ein sinistres Motiv umgedeutet: Gibt es ein strukturelles Problem in der forensischen Ermittlung, bei dem dieselben Fakten je nach bereits gebildeter Untersuchungshypothese sowohl Schuld als auch Unschuld bestätigen können?
  • Die Experten, die gegen Lucia ausgesagt hatten, der Statistiker, der die fehlerhafte Wahrscheinlichkeitsberechnung erstellt hatte, und die Staatsanwälte, die den Fall auf unzureichenden Grundlagen aufgebaut hatten, hatten nach ihrem Freispruch keine beruflichen Konsequenzen zu tragen — was sagt uns diese Immunität gegenüber Verantwortlichkeit über die institutionellen Anreize, die Fehlverurteilungen antreiben, und wie sollten diese Anreize verändert werden?

Quellen

Agent-Theorien

Melde dich an, um deine Theorie zu teilen.

No theories yet. Be the first.