Dr. Stefan Lang am 01. August 2017
Statistik in klinischen Studien: POWER
Was passiert eigentlich, wenn eine medizinische Behandlung einen tatsächlichen Effekt hat, aber Ihre Daten keine statistische Signifikanz erreichen? Dann kommt die Frage ins Spiel, wie oft Sie das Experiment wiederholen müssten, damit ein bestimmter Anteil der Ergebnisse statistisch signifikant ist. Was hier also relevant wird, ist die Sache mit der ‚Power‘.
Definition: die Power klinischer Studien
Eine Poweranalyse zeigt, mit welcher Chance in einer klinischen Studie ein Behandlungseffekt tatsächlich nachgewiesen werden kann. Laut Definition ist die Teststärke (Power) die Wahrscheinlichkeit, mit der ein Signifikanztest zugunsten der Nullhypothese entscheidet.
Mal angenommen die Nullhypothese ist nicht wahr, dann ist die Power der Anteil der Experimente, der zu einem statistisch signifikanten Ergebnis führt (zu den Begriffen: Hazra A, Gogtay N. Overview of Hypothesis Testing. Indian J Dermatol. 2016 Mar-Apr;61(2):137-45 [PubMed-Link]).
Einfaches Beispiel: Statistik Faktoren der Power-Analyse
O. k. – das klingt sehr kompliziert. Aber im Scientific Writing wollen wir die Power nicht berechnen, wir wollen sie verstehen. Das gelingt am besten mit einer kleinen Analogie:
Nullhypothese
Einmal angenommen, Sie möchte mit einem Bekannten an Ihrem Motorrad schrauben. Während der Arbeit fehlt ein Werkzeug. Sie schicken also Ihren Bekannten in die Werkstatt, um es zu holen. Nach wenigen Minuten kommt er zurück und sagt: „Es ist nicht da.“
Wahrscheinlichkeit: Sample, Difference, Scatter
Sind Sie sicher, dass er recht hat? Nein, sicher können Sie nicht sein, deswegen brauchen Sie eine Wahrscheinlichkeit: Wenn das Werkzeug wirklich in der Werkstatt ist, wie groß ist dann die Wahrscheinlichkeit, dass Ihr Bekannter es hätte finden müssen? Kommt darauf an. Denn die Wahrscheinlichkeit hängt von drei Dingen ab:
- Sample: Wie lange hat er gesucht? Wenn man richtig lange sucht, ist die Wahrscheinlichkeit größer, etwas zu finden. Das ist eine Analogie zum Stichprobenumfang. Je größer der Stichprobenumfang, desto größer die Power.
- Difference: Wie groß ist das Werkzeug? Hat es die Größe eines Vorschlaghammers oder die einer Stecknadel? Hier geht es also um die Effektstärke. Die Power ist bei starken Effekten natürlich größer als bei schwachen.
- Scatter: Haben Sie Ihre Werkstatt aufgeräumt? Wenn Ihre Werkstatt eher ein Saustall ist, wird sich Ihr Bekannter schwertun, das Werkzeug zu entdecken. Das wiederum ist nun eine Analogie zur Standardabweichung. Ist sie sehr klein, ist die Power größer.
Statistik: Davon hängt die Power einer klinischen Studie ab
In klinischen Studien hängt die Power also von drei Dingen ab: Stichprobenumfang, Effektstärke, Streuung.
Aber wie viel Power sollten es nun sein? Beträgt die Power eines Studiendesigns nur 50%, dann wird jede zweite klinische Studie mit diesem Design zu keinem signifikanten Ergebnis führen. Eine Power von ≥80% sollte man daher schon anstreben. Bei großen Phase III Studien sind es 80% bis 95%.
- Stichprobenumfang
- Effektstärke
- Streuung
Fazit
Ein grundlegendes Verständnis statistischer Begriffe braucht man, um fundiert wissenschaftlich schreiben zu können. Die „Power“ ist ein solcher Begriff.
Abgesehen von der Statistik: Was beim Schreiben und Publizieren von klinischen Studien sonst noch wichtig ist, erfahren Sie im Schreibratgeber für biomedizinische Originalartikel, dem Paper-Protokoll. Folgen Sie dem 4-stufigen Prozess vom Konzept oder Abstract, über die Gliederung und dem Schreiben der Rohfassung bis zur finalen Überarbeitung. Der Vorteil: Jeder Schritt lässt sich separat kontrollieren. So klappt auch die Zusammenarbeit mit den Koautoren und das Paper hat die besten Chancen, publiziert zu werden.