Dr. Stefan Lang am 21. Dezember 2018

Überlebenskurven im Paper – wer ist Kaplan Meier?


Kategorie Statistik

Häufig, wenn man eine klinische Studien publizieren möchte: Überlebenszeitanalysen von behandelten und unbehandelten (Placebo) Patienten. Dargestellt werden diese Überlebenszeitanalysen oft in Kaplan-Meier-Kurven. Jede(r) biomedizinische Wissenschaftler(in) hat sie schon einmal gesehen diese treppenähnlichen Diagramme, die ja eigentlich gar keine richtigen Kurven sind. Aber was genau sind Kaplan-Meier-Kurven?

In klinischen Studien möchte man oft wissen, wie lange es dauert bis ein bestimmtes Ereignis eintritt bzw. ob durch eine bestimmte Behandlung die Zeit bis zu diesem Ereignis verlängert werden kann.

Dabei muss es nicht immer ein negatives Ereignis sein (Todesfall). Es kann auch etwas Positives sein (Geburt, Heilung). Trotzdem spricht man in beiden Fällen von der Überlebenszeitanalyse.

Überlebenszeitanalysen werden in Publikationen (Originalartikel, Paper) zu klinischen Studien durch Kaplan-Meier-Kurven dargesetellt.

Das Problem bei Überlebenszeitanalysen

Erstes Problem: Man kann eine klinische Studie nicht bis ultimo in die Länge ziehen. Daher wird das Ereignis bis Studienende nicht bei allen Teilnehmern eingetreten sein. Für diese kann man also keine exakte Überlebenszeit angeben – nur einen Mindestwert.

Zweites Problem: Ein paar Patienten haben die Studie verlassen (lost to follow up), andere sind vielleicht bei einem Verkehrsunfall, also einem anderen oder „konkurrierenden“ Ereignis ums Leben gekommen. Die Beobachtungszeit endet also, bevor das eigentliche Ereignis eingetreten ist (man sagt: „zensiert“).

Wichtig: Im Gegensatz zu manch anderen Verfahren verbleiben die „zensierten“ Beobachtungszeiten in der Analyse, denn schließlich verraten diese Daten, dass die Teilnehmer mindestens bis zu ihrem Ausscheiden aus der Studie überlebt haben.

Da also die Beobachtungszeit nicht immer die gleiche ist, werden bei der Kaplan-Meier-Kurve Zeitintervalle betrachtet. Die Überlebenswahrscheinlichkeit wird für jedes Zeitintervall berechnet und bezieht sich auf die Patienten, die zu Beginn noch am Leben waren (das nennt man „bedingte“ Wahrscheinlichkeit).

Wie wir die Überlebenswahrscheinlichkeit berechnet?

Grob gesagt teilt man in jedem Zeitintervall die Zahl der überlebenden Patienten durch die Zahl der Patienten „unter Risiko“ (also Gesamtzahl zu Beginn des Intervalls). Ist also von anfänglich 20 Patienten in jedem Zeitintervall jeweils einer verstorben, sind das für das für die jeweiligen Zeitintervalle [1] 19/20, [2] 18/19, [3] 17/18 usw.:

[1] 0,95, [2] 0,947, [3] 0,944, [4] 0,941 etc.

Diese „bedingten“ Wahrscheinlichkeiten werden nun multipliziert, um die Überlebenswahrscheinlichkeit zu erhalten, also:

0,95 x 0,947 — 0,95 x 0,947 x 0,944 — 0,95 x 0,947 x 0,944 x 0,941.

Das sind dann:

0,899, 0,849 und 0,799.

Genauso verfährt man für die andere Gruppe.

Wie sieht das in der Kaplan-Meier-Kurve aus?

  • Überlebenskurven (Kaplan-Meier) beginnen mit dem Beginn der Beobachtung und daher mit allen beobachteten Lebenden. Die bedingte Wahrscheinlichkeit ist daher 1,0.
  • Jeder Todesfall erniedrigt die Überlebenskurve. Das führt zu den klassischen „Stufen“. Die Treppenstufen sind dort, wo das untersuchte Ereignis eingetreten ist. Die Stufenhöhe entspricht der Zahl der Todesfälle.
  • Zusätzlich werden zensierte Beobachtungen als vertikale Striche eingetragen. Sie zeigen an, wann der Beobachtungszeitraum für den entsprechenden Patienten endete.
  • Eine steil abfallende Kurve sind also viele und frühe Todesfälle, eine flach verlaufende Überlebenskurve dagegen späte und wenige.
  • Man erkennt klar, ob sich die Überlebenswahrscheinlichkeiten der beiden Gruppen im Studienverlauf unterschieden.

Statistik im Paper: Gibt es offene Fragen?

Ähnliche Themen rund um klinische Studien und die Statistik im Paper habe ich hier im Blog bereits behandelt: