Dr. Stefan Lang am 05. Dezember 2016
Data, was sind Daten im Scientific Writing?
Daten (data) können auf verschiedene Weise dargestellt, zusammengefasst oder verglichen werden. Bevor man sich jedoch tief in die statistische Analyse seiner Daten begibt, sollte man sich darüber im klaren werden, was man da eigentlich vor sich liegen hat: Was für Daten habe ich eigentlich?
Zwei Kategorien von Daten in klinischen Studien: kategorisch und numerisch
Zunächst gibt es in der Results Section eines Papers aus dem Bereich der klinischen Forschung zwei Kategorien von Daten: kategorische Daten und numerische Daten.
- Kategorische Daten haben im eigentlichen Sinne keinen Wert, d.h. sie können nicht gemessen werden. Die Daten werden – wie es der Name sagt – in bestimmte Kategorien eingeteilt (also zum Beispiel die Anzahl der Patienten eingeteilt in bestimmte Erkrankungsstadien).
- Numerische Daten können dagegen ganz normal gezählt oder gemessen werden (zum Beispiel Konzentrationen, Gewicht etc.).
Kategorische Daten in klinischen Studien: kategorisch, ordinal
Kategorische Daten können wiederum eingeteilt werden in:
- nominale Daten wie zum Beispiel Geschlecht, Blutgruppe, Todesursache etc. (die Reihenfolge spielt hier keine Rolle)
- ordinale Daten wie zum Beispiel Erkrankungsstadien 1-4 oder der Level der Patientenzufriedenheit: sehr unzufrieden, unzufrieden, zufrieden, sehr zufrieden; es gibt eine logische Reihenfolge dieser Daten.
Ordinale Daten sind keine echten Zahlen
Hierbei muss man sich vor Augen führen, dass auch die ordinalen Daten keine echten Zahlen sind (die Erkrankungsstadien 1-4 sind auch nur Kategorien). Das ist bei der statistischen Analyse der klinischen Daten wichtig.
Numerische oder metrische Daten in klinischen Studien
Auch hier gibt es zwei Subtypen, nämlich die kontinuierlichen und die diskreten Daten.
- Kontinuierliche Daten werden durch Messungen erhoben (Beispiele Körpergewicht, Cholesterinlevel im Serum [mmol/l], Temperatur, Größe) und können alle möglichen Werte annehmen.
- Diskrete Daten können nur bestimmte Werte haben, da sie nahezu ausnahmslos durch Zählungen entstehen (Zahl der Arztbesuche pro Jahr, Zahl der Kinder).
Beispiel: Patienten-Charakteristika in der klinischen Forschung
- Gesamtzahl der Patienten (N): numerisch diskret
- Durchschnittsalter der Patienten: numerisch kontinuierlich
- Geschlecht: kategorisch nominal
- durchschnittliches Körpergewicht: numerisch kontinuierlich
- Auftreten bestimmter Risikofaktoren (N): kategorisch nominal
- Tage seit dem letzten Auftreten der Symptome im Durchschnitt: numerisch kontinuierlich
- Anzahl der durchschnittlich betroffenen Organe, Blutgefäße etc. (N): numerisch diskret
Kleiner Hinweis: Statistisches Detailwissen wird im Paper-Protokoll oder in meinen Büchern zur medizinischen Doktorarbeit oder wissenschaftlichen Postern nicht (!) vermittelt. Der Grund: In meinen Ratgebern möchte ich meinen Lesern ausschließlich den wissenschaftlichen Schreibprozess näher bringen. Ich möchte zeigen, wie sie effektiv gute wissenschaftliche Manuskripte schreiben und publizieren können.