Medizinische Statistik für Dummies - Geraldine Rauch - E-Book

Medizinische Statistik für Dummies E-Book

Geraldine Rauch

0,0
22,99 €

-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.
Mehr erfahren.
Beschreibung

Wenn auch Sie Ihre kleinen Problemchen mit medizinischer Statistik haben, sind Sie hier genau richtig. Mit viel Witz bringen Ihnen die Autoren Geraldine Rauch, Konrad Neumann, Ulrike Grittner, Carolin Herrmann und Jochen Kruppa die Prinzipien der Biostatistik näher. In diesem Buch lernen Sie alles, was Sie benötigen, um Statistik im medizinischen Bereich erfolgreich einzusetzen. Angefangen bei der Begriffskunde und den Grundlagen, erfahren Sie alles von Studientypen über deskriptive Verfahren, Verteilungen, Schätzungen oder Korrelation und Regression bis hin zur Ereigniszeitanalyse, diagnostischen Tests und multiplem Testen. Die Autoren bringen Ihnen das theoretisch vermittelte Wissen mit vielen anschaulichen Beispielen näher. So schaffen Sie die nächste Klausur mit Links!

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern

Seitenzahl: 535

Veröffentlichungsjahr: 2020

Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Medizinische Statistik für Dummies

Schummelseite

DIESE BEGRIFFE SOLLTEN SIE UNBEDINGT KENNEN

Konfirmatorische Studien haben das Ziel, eine vorab klar definierte Forschungshypothese durch einen statistischen Test zu belegen und die Studienergebnisse auf die Grundgesamtheit zu verallgemeinern. Explorative Studien dienen zur Generierung neuer Forschungshypothesen und werden anhand deskriptiver Methoden ausgewertet.Ein statistischer Test dient als Entscheidungskriterium zwischen zwei gegensätzlichen Hypothesen (Null- und Alternativhypothese), die sich auf eine Zielpopulation beziehen. Die Entscheidung erfolgt anhand der Daten einer repräsentativen Stichprobe und kann auch falsch sein.Die Nullhypothese ist die Hypothese, die der Forscher widerlegen möchte. In einer randomisierten, kontrollierten Studie ist die Nullhypothese meist als Gleichheit der beiden Gruppen bezüglich einer statistischen Kennzahl formuliert, zum Beispiel bezüglich zweier Erwartungswerte oder Anteile.Die Alternativhypothese oder Forschungshypothese ist die Hypothese, die der Forscher belegen will. In einer randomisierten, kontrollierten Studie ist die Alternativhypothese meist als Ungleichheit der beiden Gruppen bezüglich einer statistischen Kennzahl formuliert, zum Beispiel bezüglich zweier Erwartungswerte oder Anteile.Ein Fehler 1. Art, auch α-Fehler genannt, entsteht, wenn der statistische Test die Nullhypothese verwirft, obwohl diese in Wahrheit zutrifft. Die Wahrscheinlichkeit für einen Fehler 1. Art ist nach oben durch das vorab festgelegte Signifikanzniveau begrenzt. Dieses wird meist auf 5 % gesetzt. Wenn die Nullhypothese verworfen wird, können Sie daher ziemlich sicher sein, dass Sie die richtige Testentscheidung getroffen haben. Beachten Sie, dass ein signifikantes Testergebnis nichts über die Größe und Relevanz des Behandlungseffekts aussagt.Ein Fehler 2. Art, auch β-Fehler genannt, entsteht, wenn der statistische Test die Nullhypothese beibehält, obwohl die Alternativhypothese zutrifft. Die Wahrscheinlichkeit für einen Fehler 2. Art ist unbekannt und hängt von verschiedenen Größen ab. Wenn die Nullhypothese beibehalten wird, können Sie daher nicht sicher sein, ob Sie die richtige Testentscheidung getroffen haben, und dürfen in diesem Fall nicht auf die Gültigkeit der Nullhypothese schließen. Der Fehler 2. Art lässt sich nur indirekt über eine Fallzahlplanung kontrollieren.Die Power oder Güte eines statistischen Tests bezeichnet die Wahrscheinlichkeit, dass der statistische Test die Nullhypothese verwirft, wenn die Alternativhypothese zutrifft. Die Power berechnet sich als eins minus der Wahrscheinlichkeit für einen Fehler 2. Art.Die Teststatistik ist eine Transformationsformel für die beobachteten Daten der Stichprobe. Die Transformation ist notwendig, um nach einem einheitlichen Maßstab und unabhängig von den Einheiten des erhobenen Merkmals zu beurteilen, wie »extrem« ein Ergebnis ist. Die Formel wird so gewählt, dass die Verteilung der transformierten Daten unter der Nullhypothese bekannt ist. Meist ist der statistische Test nach dieser Verteilung benannt, zum Beispiel folgt die Teststatistik des t-Tests unter der Nullhypothese einer t-Verteilung.Der kritische Wert ist der Schwellenwert für den Wert der Teststatistik, ab dem die Ergebnisse als so extrem eingestuft werden, dass die Nullhypothese als unplausibel und damit als widerlegt gilt. Der kritische Wert ist das entsprechende Quantil der Verteilung der Teststatistik.Eine Verteilung charakterisiert, wie häufig die Ausprägungen eines Merkmals in einer Population auftreten. Eine gängige symmetrische Verteilung für stetige Merkmale ist die Normalverteilung, die durch einen Erwartungswert (Populationsmittel) sowie die Varianz (Streuung des Merkmals) charakterisiert wird. Darüber hinaus werden für Verteilungen häufig auch Quantile angegeben. Das sind Schwellenwerte, unter denen ein bestimmter Prozentsatz der Merkmalsausprägungen liegt.Der p-Wert ist die Wahrscheinlichkeit, den in der Stichprobe beobachteten Wert der Teststatistik oder einen in Richtung der Alternativhypothese noch extremeren Wert zu erhalten, wenn in Wahrheit die Nullhypothese gilt. Der p-Wert misst somit, wie plausibel die Daten unter der Nullhypothese sind. Der p-Wert ist die Fläche unterhalb der Verteilung der Teststatistik, die durch den beobachteten Wert der Teststatistik abgegrenzt wird. Damit ist der p-Wert ebenfalls eine Transformation für die beobachteten Daten. Während die Teststatistiken unterschiedlicher Tests jedoch verschiedenen Verteilungen folgen (zum Beispiel der t-Verteilung oder der Chiquadrat-Verteilung), so ist der p-Wert immer eine Wahrscheinlichkeit zwischen 0 und 1, und ist damit einheitlich zu interpretieren.Das Konfidenzintervall ist eine Kombination aus Lage- und Streuungsmaß und stellt dar, wie präzise und somit vertrauenswürdig die Schätzung des Behandlungseffekts ist. Es überdeckt den wahren, unbekannten Parameter mit einer vorgegebenen Wahrscheinlichkeit. Der Punktschätzer für den Behandlungseffekt liegt immer innerhalb des Konfidenzintervalls.

Medizinische Statistik für Dummies

Bibliografische Information der Deutschen Nationalbibliothek

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

1. Auflage 2019

© 2019 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim

All rights reserved including the right of reproduction in whole or in part in any form. This book published by arrangement with John Wiley and Sons, Inc.

Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form. Dieses Buch wird mit Genehmigung von John Wiley and Sons, Inc. publiziert.

Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.

Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.

Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.

Korrektur: Claudia Lötschert

Print ISBN: 978-3-527-71584-8ePub ISBN: 978-3-527-82118-1mobi ISBN: 978-3-527-82119-8

Über die Autoren

Das sind wir: Wir Autoren sind ein bunter Haufen von Wissenschaftlern mit unterschiedlichsten Hintergründen. Wir alle teilen die Liebe zu unserem Fach. Wir hoffen, dass ein Teil unserer Begeisterung vielleicht auch auf Sie als Leser übergeht. Unser Motto:

»Statistik macht Spaß!«

Geraldine Rauch leitet seit Juli 2017 das Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Die Heidelbergerin studierte Mathematik an der Universität Bremen. Nach einem Forschungsaufenthalt an der Cardiff University in Wales promovierte Geraldine Rauch bei der Firma Roche Diagnostics in Penzberg. Im Jahre 2009 trat sie eine Stelle als wissenschaftliche Mitarbeiterin am Institut für Medizinische Biometrie und Informatik des Universitätsklinikums Heidelberg an und übernahm dort drei Jahre später die Leitung der Arbeitsgruppe »Klinische Studien«. Im Jahre 2015 schloss sie ihre Habilitation ab. Für die daraus resultierende Arbeit »Opportunities and challenges of combined effect measures based on prioritized outcomes« gewann sie 2014 den Paul Martini Preis der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS). Neben ihrer beruflichen Tätigkeit gründete Geraldine Rauch im Jahre 2011 die Arbeitsgruppe »Lehre und Didaktik in der Biometrie« innerhalb der Deutschen Region der Internationalen Biometrischen Gesellschaft, die ein Forum zur Vernetzung und zum Austausch von Unterrichtskonzepten und Ideen im Bereich der Biometrie-Lehre bietet. Im Januar 2017 folgte Prof. Rauch dem Ruf auf eine W3-Professur für Medizinische Biometrie an das Universitätsklinikum Hamburg-Eppendorf (UKE), wo sie die stellvertretende Leitung des Instituts für Medizinische Biometrie und Epidemiologie innehatte. Sie wechselte nur ein halbes Jahr später auf die jetzige Position in Berlin.

Konrad Neumann stammt aus München und ist zurzeit wissenschaftlicher Mitarbeiter am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Nach einem Studium der Mathematik an den Universitäten Heidelberg und Erlangen-Nürnberg promovierte er in Erlangen in Mathematik. Darauf folgte ein zweijähriger Forschungsaufenthalt an der Tel Aviv University (Israel) als Minerva-Stipendiat. Danach konnte er in einem privaten Versicherungsunternehmen Erfahrung in Versicherungsmathematik und Datenverarbeitung sammeln. Seit 2002 arbeitet er an der Charité. Der Schwerpunkt seiner Tätigkeit ist dort neben methodischer Forschung die statistische Beratung von forschenden Medizinern.

Ulrike Grittner leitet aktuell die Arbeitsgruppe »Beobachtungsstudien Registerdaten« am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Ulrike Grittner ist Potsdamerin und studierte Mathematik, Bildende Kunst und Erziehungswissenschaften in Erfurt und Berlin. Im Jahr 2006 promovierte sie im Bereich Erziehungswissenschaften. Im Jahr 2017 erfolgte die Habilitation im Bereich Public Health. Sie ist Coautorin bei mehr als 130 wissenschaftlichen Publikationen und lehrt seit mehr als 15 Jahren Biostatistik für Studierende der Medizin und verschiedener Master-Studiengänge im Bereich Public Health.

Carolin Herrmann leitet aktuell die Arbeitsgruppe »Klinische Studien« am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Sie studierte Mathematik an der Universität Bielefeld sowie in Bergen, Norwegen. Im Anschluss trat sie ihre Stelle als wissenschaftliche Mitarbeiterin an der Charité an. Ihr Forschungsschwerpunkt ist die Optimierung von klinischen Studiendesigns durch eine Anpassung der Fallzahl während einer laufenden Studie. Darüber hinaus liegt ihr die Lehre besonders am Herzen. Sie unterrichtet Studierende der Medizin, Bioinformatik, Statistik und Gesundheitswissenschaften an verschiedenen Hochschulen.

Jochen Kruppa leitet aktuell die Arbeitsgruppe »Statistische Bioinformatik« am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Der Uelzener studierte Pflanzenbiotechnologie mit Schwerpunkt Biostatistik an der Leibniz Universität Hannover. Jochen Kruppa promovierte als wissenschaftlicher Mitarbeiter an der Universität zu Lübeck mit dem Themenschwerpunkt Maschinelles Lernen und Epidemiologie auf genetischen Datensätzen. In den folgenden zwei Jahren war er erst am Universitätsklinikum Göttingen am Institut für Biometrie in der bioinformatorischen und statistischen Beratung beschäftigt und anschließend an der Tierärztlichen Hochschule Hannover als Bioinformatiker. Seit 2018 ist Jochen Kruppa an der Charité - Universtätsmedizin Berlin tätig. Darüber hinaus unterrichtet Jochen Kruppa statistische Themen als freier Dozent für Doktoranden und PostDocs unter anderem am Leibniz-Zentrum Borstel. Von 2018 bis 2019 leitete er die Arbeitsgruppe »Lehre und Didaktik in der Biometrie« innerhalb der Deutschen Region der Internationalen Biometrischen Gesellschaft.

An diesem Buch haben aber nicht nur die Autoren mitgewirkt. Es gibt ein paar Personen, die in stundenlanger Arbeit gelesen, korrigiert, gezeichnet und gemalt haben. Deswegen bitten wir um einen kurzen Applaus für Annett Kaphahn, fürs Schafe zeichnen, Grashalme malen, Grafiken optimieren und für das Aufrechterhalten der allgemeinen guten Laune. Uwe Schöneberg, Lorena Hafermann und Nilufar Akbari fürs Korrektur- und Testlesen bis zum Umfallen mit einer Gründlichkeit, die ihres Gleichen sucht. Uwe Schöneberg wäre auch ein guter Deutschlehrer gewesen und die Autoren haben viel über Kommasetzung gelernt.

Inhaltsverzeichnis

Cover

Über die Autoren

Einleitung

Über dieses Buch

Was Sie nicht lesen müssen

Konventionen in diesem Buch

Törichte Annahmen über den Leser

Wie dieses Buch aufgebaut ist

Symbole, die in diesem Buch verwendet werden

Teil I: Medizinische Statistik - Gel(i)ebte Daten

Kapitel 1: Statistik und Medizin – wie passt das zusammen?

Medizinische Statistik, Biostatistik, medizinische Biometrie: Eine Begriffsbestimmung

Wo wird medizinische Statistik gebraucht?

Aufgabenbereiche der medizinischen Statistik

Literatur

Kapitel 2: Besser beraten lassen - Hilfe holen erwünscht

Wo finden Sie biometrische Unterstützung?

Vorbereitung auf einen Beratungstermin

Welche Software brauchen Sie?

Literatur

Teil II: Keine Forschung ohne Fundament - Grundlagen

Kapitel 3: Grundbegriffe und Studientypen

Grundlegende Begriffe empirischer Forschung in der Medizin

Verschiedene Studientypen unterscheiden

Klinische Studie konzipieren - das Studiendesign

Noch einmal in Kürze

Literatur

Kapitel 4: Modelle für die Wirklichkeit

Was sind Wahrscheinlichkeiten?

Modellannahmen, Verteilungen und Schätzung

Merkmale und Verteilungen

Gängige Verteilungsannahmen

Literatur

Teil III: Was Sie unbedingt brauchen - Theorie trifft Praxis

Kapitel 5: Die Kunst der Beschreibung - Deskriptive Statistik

Was ist das eigentlich - deskriptive Statistik?

Wo brauchen Sie deskriptive Statistik?

Merkmale unterscheiden - Skalenniveaus

Methoden der Deskription

Beschreibung kategorieller Merkmale

Beschreibung ordinalskalierter Merkmale

Beschreibung intervall- und verhältnisskalierter Merkmale

Wichtiges hervorheben, Unwichtiges weglassen

Literatur

Kapitel 6: Nachweis durch Kontrolle des Zufalls - Konfirmatorische Statistik

Konfirmatorisch, induktiv, schließend - eine Begriffsbestimmung

Idee des statistischen Tests - der konfirmatorische Umweg

Die sechs Schritte des statistischen Tests

Von der Fragestellung zur Hypothese

Was sagen die Daten? Von den Daten zur Testentscheidung

Interpretation des Testergebnisses - nichts ist bewiesen

Literatur

Kapitel 7: t-Test & Co: Die Klassiker unter den Tests

Statistische Tests zum Vergleich von Erwartungswerten und anderen Lagemaßen

Statistische Tests zum Vergleich von Anteilen und Wahrscheinlichkeiten

Literatur

Kapitel 8: Den Behandlungseffekt quantifizieren - Punktschätzer und Konfidenzintervalle

Quantifizierung des Effekts - der Punktschätzer

Die Größe des Effekts - das Konfidenzintervall

Signifikanz versus Relevanz - nicht zu verwechseln

Punktschätzer und Konfidenzintervalle für verschiedene Datensituationen

Literatur

Kapitel 9: Was sonst noch wichtig ist - Vor und nach dem statistischen Test

Kontrolle des Fehlers 2. Art? Grundprinzip der Fallzahlplanung

Mehr als eine Fragestellung - multiples Testen

Das Ergebnis einer Studie berichten

Literatur

Kapitel 10: Zusammenhänge und Vorhersage – Korrelation und Regression

Wie stark ist die Verbindung - Maße des Zusammenhangs

Regressionsmodelle

Die logistische Regression

Literatur

Teil IV: Blick über den Tellerrand - weiterführende Methoden

Kapitel 11: Wer lebt länger? Analyse von Ereigniszeiten

Was sind Ereigniszeitdaten? Zeiten, Ereignisse und Zensierungen

Schätzung von Ereigniswahrscheinlichkeiten - Kaplan-Meier zeigt, wie es geht

Gruppenvergleich - Überlebensfunktion, Hazards und Hazard Ratios

Logrank-Test und Cox-Regression

Literatur

Kapitel 12: Methoden zur Bewertung der Diagnostik und Übereinstimmung

Diagnostische Studien

Goldstandard und Referenzdiagnostik

Güte von diagnostischen Tests - Sensitivität und Spezifität

Prädiktive Werte und Satz von Bayes

Die ROC-Kurve

Literatur

Kapitel 13: Ausgewählte Methoden epidemiologischer Studien

Verzerrungen vermeiden durch Matching

Löcher in den Daten - Vom Umgang mit fehlenden Werten

Literatur

Kapitel 14: Methodik von systematischen Reviews und Metaanalysen

Systematische Reviews und Metaanalysen in der Medizin

Ablauf von systematischen Reviews und Metaanalysen

Vor- und Nachteile von systematischen Reviews und Metaanalysen

Literatur

Teil V: Der Top-Ten-Teil

Zehn statistische Irrtümer

Irrtum 1: Statistische Tests liefern wertvollere Ergebnisse als deskriptive Datenauswertungen

Irrtum 2: Ein nicht-signifikantes Testergebnis deutet auf die Gültigkeit der Nullhypothese hin

Irrtum 3: Der p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese richtig ist

Irrtum 4: Ein kleiner p-Wert spricht immer für einen großen Effekt

Irrtum 5: Bei Verwendung eines parametrischen Tests müssen die Daten normalverteilt sein

Irrtum 6: Signifikante Ergebnisse sind immer auch klinisch relevant

Irrtum 7: Alle p-Werte unter 5% sind signifikante Ergebnisse

Irrtum 8: Für eine Fallzahlplanung werden nur ein paar Werte in eine Eingabemaske eingegeben

Irrtum 9: Ein multivariates Regressionsmodell dient der Vorhersage einer Zielgröße aus mehreren Einflussgrößen

Irrtum 10: Nur Studien mit signifikanten Ergebnissen sollten publiziert werden

Stichwortverzeichnis

End User License Agreement

Tabellenverzeichnis

Kapitel 2

Tabelle 2.1: Vor- und Nachteile verschiedener statistischer Softwareprogramme.

Kapitel 5

Tabelle 5.2: Tabellarische Datenerfassung.

Tabelle 5.3: Übersicht der verschiedenen Skalenniveaus.

Tabelle 5.4: Codierung eines Datensatzes.

Tabelle 5.6: Kreuztabelle für Bluthochdruck nach Geschlecht.

Tabelle 5.7: Bezeichnungen spezieller Quantile.

Kapitel 6

Tabelle 6.1: Wichtige Begrifflichkeiten eines statistischen Tests.

Tabelle 6.2: Wahrheit und Testentscheidung.

Kapitel 7

Tabelle 7.3: Mittelwerte (Standardabweichungen) der PSA-Werte in ng/ml.

Tabelle 7.4: Mittelwerte (Standardabweichungen) der PSA-Werte.

Tabelle 7.6: BIC in % und zugehörige Ränge von Implantat-Typen A und B.

Tabelle 7.11: Beobachtete und erwartete Häufigkeiten.

Tabelle 7.12: Ansprechhäufigkeiten auf zwei Antipsychotika.

Tabelle 7.13: Beobachtete Häufigkeiten in einer allgemeinen Kreuztabelle.

Tabelle 7.14: Kreuztabelle für die dreiarmige Studie.

Tabelle 7.15: Beobachtete und erwartete Zellhäufigkeiten.

Tabelle 7.16: Allgemeine Kreuztabelle für den McNemar-Test

Tabelle 7.17: Daten der Studie zur Diagnostik des Nasopharynxkarzinoms.

Kapitel 9

Tabelle 9.1: Patientencharakterisika zur Baseline. Intervallskalierte Merkmale werd...

Kapitel 10

Tabelle 10.2: Berechnung der Flächen der Rechtecke.

Tabelle 10.3: Bakterienwachstum über die Zeit.

Tabelle 10.4: Rangvergabe.

Tabelle 10.5: Flächen der Rechtecke für die Ränge.

Tabelle 10.6: Bakterienvermehrung über die Zeit.

Tabelle 10.8: Kreuztabelle zum Rentenalter und Übergewicht.

Tabelle 10.10: Ausgabe des Statistikprogramms.

Kapitel 11

Tabelle 11.1: Auszug aus den Studiendaten.

Kapitel 12

Tabelle 12.1: Vergleich eines Diagnosetests mit dem Goldstandard.

Tabelle 12.3: Geschätzte Sensitivität und Spezifität für verschiedene Schwellenwert...

Kapitel 13

Tabelle 13.1: Beispieldatensatz zum Rechtsherzkatheter.

Tabelle 13.3: Altersgruppe und Geschlecht bei 200 Patienten mit koronarer Herzkrank...

Tabelle 13.4: Propensity Score für den Datensatz zum Rechtsherzkatheter.

Kapitel 14

Tabelle 14.1:

PSA: mittlere Abnahme des PSA-Werts (ng/ml) während sechs Monate The...

Illustrationsverzeichnis

Kapitel 1

Abbildung 1.1: Kommunikation ist alles.

Kapitel 2

Abbildung 2.1: Nicht alles, was eine Statistiksoftware ausspuckt, ergibt auch Sinn.

Kapitel 3

Abbildung 3.1: Nur bei einer

repräsentativen Stichprobe

sind Rückschlüsse auf ...

Abbildung 3.2: Zufälliges Ziehen sorgt für eine repräsentative Stichprobe.

Abbildung 3.3: Ein Confounder beeinflusst sowohl die Zielgröße als auch ein anderes...

Abbildung 3.4: Während bei einer explorativen Studie generell nach neuen Forschungs...

Abbildung 3.5: Retrospektive Studien nutzen existierende Datenquellen (links), pros...

Abbildung 3.6: Grundidee von Randomisierung.

Abbildung 3.7: Blockrandomisierung gewährleistet gleiche Gruppengrößen.

Abbildung 3.8: Stratifizierte Randomisierung.

Kapitel 4

Abbildung 4.1: Dichtefunktionen einer diskreten Verteilung für die Anzahl der Mädch...

Abbildung 4.2: Dichte der Normalverteilung für

und

(oben links);

und

(oben ...

Abbildung 4.3: Quantile der Standardnormalverteilung (rot):

-Quantil (links);

-Qu...

Abbildung 4.4: Die Wahrscheinlichkeit, dass eine Familie mit drei Kindern zwei Mädc...

Abbildung 4.5: Dichte der Binomialverteilung für

und

(von links nach rechts).

Abbildung 4.6: Dichte der Studentschen t-Verteilung mit 3 Freiheitsgraden (blau) im...

Abbildung 4.7: Dichtefunktionen der Chiquadrat-Verteilung mit einem Freiheitsgrad (...

Abbildung 4.8: Verschiedene Möglichkeiten für Dichten der Log-Normalverteilung, die...

Abbildung 4.9: Verschiedene Möglichkeiten für Dichten der Exponential-Verteilung, d...

Kapitel 5

Abbildung 5.1: Forscher sollten Theorien immer an Stichproben auf Plausibilität übe...

Abbildung 5.2: Tortendiagramm zum Familienstand von 1000 Befragten.

Abbildung 5.3: Einfaches Balkendiagramm.

Abbildung 5.4: Gruppiertes Balkendiagramm für Männer und Frauen.

Abbildung 5.5: Gestapeltes Balkendiagramm nach Altersgruppen.

Abbildung 5.6: Der Boxplot.

Abbildung 5.7: Verteilungsdichten und zugehörige Boxplots - symmetrische Verteilung...

Abbildung 5.8: Gruppierte Boxplots für das Merkmal Gewicht in kg.

Abbildung 5.9: Geometrische Veranschaulichung der empirischen Varianz und der Stand...

Abbildung 5.10: Das Histogramm am Beispiel der Körpergröße.

Abbildung 5.11: Histogramm für das Merkmal Körpergröße und Veranschaulichung der mi...

Abbildung 5.12: Histogramme für einem Datensatz mit

gemessenen Körpergrößen mit 3...

Abbildung 5.13: Deskriptive Methoden nach Skalenniveau.

Kapitel 6

Abbildung 6.1: Der konfirmatorische Umweg.

Abbildung 6.2: Körpergröße ist relativ zum Maßstab.

Abbildung 6.3: Verteilung der Teststatistik unter

und Ablehnungsbereiche.

Abbildung 6.4: Teststatistik und p-Wert.

Kapitel 7

Abbildung 7.1: Dichte der Standardnormalverteilung (grau) und der t-Verteilung mit ...

Abbildung 7.2: Dichtefunktionen eines normalverteilten Merkmals in zwei Gruppen (bl...

Abbildung 7.3: t-Verteilung mit 168 Freiheitsgraden. Links: kritischer Wert

und z...

Abbildung 7.4: Normalverteilung in zwei Gruppen mit gleichen (links) und unterschie...

Abbildung 7.5: Durch Paarbildung entsteht aus zwei unverbundenen Stichproben (links...

Abbildung 7.6: F-Verteilung mit 2 Zähler- und 94 Nennerfreiheitsgraden. Links: krit...

Abbildung 7.7: Zwei Dichtefunktionen, die sich bei gleichem Erwartungswert in der S...

Abbildung 7.8: U-Verteilung für

. Links: oberer und unterer kritischer Wert

und ...

Abbildung 7.9: Verteilung der Teststatistik W für

Links: oberer und unterer kriti...

Abbildung 7.10: Chiquadrat-Verteilung für einen Freiheitsgrad. Links: kritischer We...

Abbildung 7.11: Chiquadrat-Verteilung für vier Freiheitsgrade. Links: kritischer We...

Abbildung 7.12: Binomialverteilung für

und Trefferwahrscheinlichkeit

. Links: kr...

Kapitel 8

Abbildung 8.1: Konfidenzintervalle können die unbekannte Wahrheit nicht aufdecken.

Abbildung 8.2: Zwanzig 90

-Konfidenzintervalle aus unabhängigen Versuchswiederholun...

Abbildung 8.3: Konfidenzintervalle und Bewertung der Signifikanz und Relevanz des E...

Kapitel 9

Abbildung 9.1: Die Fallzahlplanung erfordert Angaben zu diversen statistischen Größ...

Abbildung 9.2: Verteilung der Teststatistik unter

und

und Wahrscheinlichkeiten ...

Abbildung 9.3: Verteilung der Teststatistik unter

und unter

und Wahrscheinlichk...

Abbildung 9.4: Verteilung der Teststatistik unter

und unter

und Wahrscheinlichk...

Abbildung 9.5: Viele große und kleine p-Werte sagen wenig aus.

Abbildung 9.6: Schematische Darstellung des hierarchischen Testverfahrens...

Kapitel 10

Abbildung 10.1: Das Streudiagramm.

Abbildung 10.2: Die Mittelwerte beider Merkmale teilen das Streudiagramm in Quadran...

Abbildung 10.3: Positiver Zusammenhang (links), kein Zusammenhang (mittig) und nega...

Abbildung 10.4: Die Anzahl der Punkte pro Quadrant liefert noch kein gutes Maß für ...

Abbildung 10.5: Konstruktion der empirischen Kovarianz aus dem Streudiagramm als mi...

Abbildung 10.6: Streudiagramme für keinen Zusammenhang (oben) sowie verschieden sta...

Abbildung 10.7: Streudiagramm für das Geburtsgewicht in Gramm in Abhängigkeit der S...

Abbildung 10.8: Nichtlinearer Zusammenhang zwischen den Merkmalen.

Abbildung 10.9: Scheinkorrelation verursacht durch die Subgruppen der Jahreszeit (l...

Abbildung 10.10: Streudiagramm mit Ausreißer (links) und ohne Ausreißer (rechts). A...

Abbildung 10.11: Bakterienwachstum über die Zeit - das Streudiagramm lässt einen mo...

Abbildung 10.12: Nicht monotoner Zusammenhang zweier Merkmale.

Abbildung 10.13: Datenpunkt

mit eingezeichnetem Residuum

in lila. Der Achsenabs...

Abbildung 10.14: Illustration der Abstandsquadrate (Residuenquadrate). Die »perfekt...

Abbildung 10.15: Residuenplot - Residuen streuen gleichmäßig (links); Residuenvaria...

Abbildung 10.16: Residuenplots zu betrachten, kann sehr romantisch sein.

Abbildung 10.17: Ist die Uhrzeit des Einschlafens eine echte Einflussgröße für Kopf...

Abbildung 10.18: Streudiagramm für den Schwangerschaftsstatus in Abhängigkeit des h...

Abbildung 10.19: Vom logistischen Modell vorhergesagte Wahrscheinlichkeit für eine ...

Abbildung 10.20: Odds und Wahrscheinlichkeit am Beispiel des fairen Würfels.

Kapitel 11

Abbildung 11.1: Darstellung von Ereigniszeitdaten.

Abbildung 11.2: Kaplan-Meier-Kurve (schwarz) als Schätzung für die wahre Überlebens...

Abbildung 11.3: Kaplan-Meier-Kurve für neun Eintagsfliegen, von denen vier vorzeiti...

Abbildung 11.4: Bestimmung des medianen Überlebens aus einer Kaplan-Meie...

Abbildung 11.5: Kaplan-Meier-Kurven für die Prostatektomie-Gruppe (rot) und die Bes...

Abbildung 11.6: Überlebensfunktion (links), zugehörige Hazardfunktionen ...

Kapitel 12

Abbildung 12.1: Krake Paul als Diagnosetest.

Abbildung 12.2: Baumdiagramm zur Herleitung der prädiktiven Werte.

Abbildung 12.3: Baumdiagramm für die diagnostische Studie zu Diabetes.

Abbildung 12.4: Vom quantitativem zum binärem Diagnosetest - der Schwellenwert beei...

Abbildung 12.5: Zusammenhang zwischen Verteilungsdichten der Kranken (blau) und Ges...

Abbildung 12.6: Schrittweise Konstruktion einer ROC-Kurve. Je nach Schwellenwert än...

Kapitel 13

Abbildung 13.1: Sind Fische, die in einem Salzwasseraquarium leben (links), weniger...

Abbildung 13.2: Der linke Käse hat zufällige Löcher, während der Käse rechts zufäll...

Kapitel 14

Abbildung 14.1: Die Evidenz-Pyramide: von der Einzelfalldarstellung (unterste Schic...

Abbildung 14.2: Forest-Plot für das Beispiel der Metaanalyse zur Wirkung von Polyph...

Abbildung 14.3: Wie der Forest-Plot zu seinem Namen kommt.

Abbildung 14.4: Forest-Plot für die Metaanalyse zu Polyphenon E.

Abbildung 14.5: Links: Funnel-Plot zeigt keine Anzeichen für das Vorliegen eines Pu...

Abbildung 14.6: Schwarze Zebras deuten auf einen Publication Bias hin.

Orientierungspunkte

Cover

Inhaltsverzeichnis

Fangen Sie an zu lesen

Seitenliste

1

2

5

6

7

8

17

18

19

20

21

23

24

25

26

27

28

29

31

32

33

34

35

36

37

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

382

383

384

385

386

387

Einleitung

»Mathe konnte ich noch nie!« So oder so ähnlich reagieren viele, denen wir von unserem Fach erzählen. Mathematik ist nicht gerade beliebt, und Statistik ist sicher nicht das Lieblingsfach von Studierenden der Medizin. Und Viele fragen sich auch, was dieses Fach überhaupt mit Medizin zu tun hat.

Medizinische Statistik ist eine Wissenschaft, die die medizinische Forschung unterstützt. Warum studieren Sie Medizin oder üben einen Gesundheitsberuf aus? Vielleicht wollen Sie Patienten helfen, gesund zu werden, und den Gesunden helfen, es zu bleiben. Dazu braucht es gute praktizierende Ärzte und gute medizinische Forschung. Und genau da brauchen Sie die medizinische Statistik - um aus Forschung gute Forschung zu machen. Leider geht diese schöne Motivation für unser Fach im Alltag manchmal verloren. Sie müssen die Klausur bestehen? Eine Doktorarbeit schreiben? Ein Manuskript in einer angesehenen Zeitschrift veröffentlichen? Sie möchten Ihren Drittmittelantrag bewilligt bekommen? Die Chancen können Sie erhöhen, indem Sie Ihr Forschungsprojekt statistisch valide planen und auswerten. Allerdings sind gute Noten, Publikationen, Impaktfaktoren und eingeworbene Drittmittel in unserem Wissenschaftssystem nicht unbedingt Indikatoren für gute, patientenorientierte Forschung. Halten Sie doch daher einmal inne und überlegen Sie sich, warum Sie forschen. Vielleicht haben Sie jemanden in Ihrem engeren Freundeskreis, der gerade im Krankenhaus liegt? Vielleicht kennen Sie sogar jemanden, der an einer klinischen Studie teilnimmt und sich Hoffnung auf Heilung durch eine neue Therapie macht? Gute medizinische Forschung ist eine Aufgabe mit Verantwortung - sie lässt sich nicht durch Impaktfaktoren messen. Deshalb ist eine angemessene Forschungsmethodik so wichtig und deshalb ist die medizinische Statistik unerlässlich. Sie ist ein Werkzeug, das Sie für gute Forschung brauchen. Die medizinische Statistik hat es sich also verdient, dass Sie ihr etwas echte Aufmerksamkeit schenken - zum Beispiel indem Sie dieses Buch lesen. Dabei werden Sie vermutlich feststellen: So kompliziert ist das ja gar nicht. Im Gegenteil, vieles ist so, wie es einem der gesunde Menschenverstand vorgibt. Und es kommt sogar noch besser: Statistik kann durchaus unterhaltsam, ja sogar lustig sein.

Viele der Beispiele und Anekdoten in diesem Buch haben wir Autoren so oder so ähnlich tatsächlich erlebt. Beim Schreiben haben wir viel gelacht, und wir wünschen uns, dass Sie das beim Lesen auch tun.

Über dieses Buch

Sie stehen gerade in einer Buchhandlung, suchen nach einem statistischen Lehrbuch und fragen sich, ob Sie sich genau dieses Buch zulegen sollen? Ja klar! Auf jeden Fall brauchen Sie kein statistisches Vorwissen, um das Buch, das Sie gerade in den Händen halten, zu verstehen. Dieses Buch ist kein hochtrabendes Fachbuch, das Sie nur verstehen, wenn Sie bereits alle Grundlagen der medizinischen Statistik im Schlaf beherrschen. Dieses Buch vermittelt Ihnen eine große Bandbreite an biometrischen Themen von Grund auf – und zwar mit so wenig Fachbegriffen und so einfach erklärt wie möglich. Das Buch soll Sie außerdem ermächtigen, die Sprache der Statistik besser zu verstehen und somit auch besser mit Statistikern in einer Beratungssituation kommunizieren zu können.

Wir haben uns sehr viel Mühe gegeben, ein möglichst umfassendes Buch über das weite Feld der medizinischen Biometrie und über Teile der Epidemiologie zu schreiben. Leider ist auch hier der Platz begrenzt. Was dieses Buch nicht leisten kann, sind vollständige Kochrezepte für die Nutzung von statistischen Software-Programmen. Wir haben uns bewusst gegen eine Einbettung von Software-Kommandos entschieden. Zum einen veralten Code-Beispiele sehr schnell, und zum anderen werden in der medizinischen Forschung verschiedene Software-Pakete benutzt. Viele Institutionen, die Beratung anbieten, haben Einführungskurse für diese statistischen Programme in ihrem Angebot.

Dieses Buch richtet sich an Studierende der Medizin, der Gesundheitswissenschaften oder verwandter Studienfächer, an praktizierende Ärzte und Forscher sowie an alle Interessierten, die die medizinische Statistik auf eine kurzweilige, aber dennoch präzise Art und Weise vermittelt bekommen wollen. Sie werden mit diesem Buch in kürzester Zeit sehr viele neue Erkenntnisse erlangen. Ihnen werden erleuchtende Einfälle kommen, wie unserem Schaf »Signifikanz-Sissy« auf dem Buchcover. Sissy benutzt dieses Buch als Trittbrett, um leichter über das Signifikanzniveau zu springen. Was unter Signifikanz zu verstehen ist, werden Sie in diesem Buch erfahren. So viel sei bereits an dieser Stelle gesagt: Das Wort wird viel zu häufig an unpassenden Stellen verwendet. Die Lektüre dieses Buches lohnt sich also. Und vielleicht können Sie dann bald bei Ihren Kommilitonen, Kollegen und Freunden glänzen und Ihr Wissen weitergeben. Signifikanz-Sissy gibt es übrigens wirklich! Es ist das Patenschaf unseres Instituts und steht auf dem Kinderbauernhof »Knirpsenfarm« in Berlin.

Was Sie nicht lesen müssen

Dieses Buch ist so geschrieben, dass Sie es als Nachschlagewerk nutzen und bei einem beliebigen, Sie besonders interessierenden Kapitel, starten können. Es lohnt sich aber immer, auch einen Blick in die benachbarten Kapitel zu werfen, um einen etwas breiteren Überblick zu bekommen.

Konventionen in diesem Buch

Wenn Sie viele Kapitel dieses Buchs lesen oder gar so viel Freude an der medizinischen Statistik (gefunden) haben, dass Sie das Buch von der ersten bis zur letzten Seite lesen, kann Ihnen die eine oder andere Begriffsdefinition bereits bekannt vorkommen. Dies machen wir nicht, weil wir denken, dass Sie alles schon wieder vergessen haben! Das Buch ist absichtlich modular geschrieben, sodass Sie fast jedes Kapitel separat lesen und verstehen können - damit alles in guten Portionen leicht zu verdauen ist. Sollten Sie dennoch an einem Thema mal länger zu beißen haben - nehmen Sie es nicht so schwer! Sie müssen ja nicht von heute auf morgen zum Statistiker werden. Auch könnte es sein, dass Sie sich als Leserin nicht immer direkt angesprochen fühlen, wenn Sie von Medizinern, Statistikern und Forschern lesen. Wir meinen aber immer jegliche Geschlechter - das mit dem konsequenten Gendern macht einfach die Lesbarkeit schwierig. Und zu guter Letzt: Wenn Sie mal medizinische Statistik, mal Biometrie oder mal Biostatistik lesen – wir meinen immer das Gleiche.

Törichte Annahmen über den Leser

Sie wollen mehr über medizinische Statistik erfahren - aus eigenem Antrieb oder vielleicht gar, weil Ihr Studium oder Ihre Arbeit Sie »dazu zwingt«? Wir setzen keinerlei Vorkenntnisse voraus und erklären alles von Grund auf mit möglichst verständlichen Worten. Vielleicht stehen Sie kurz vor einer Biometrie-Prüfung oder vor der Abgabe Ihrer Doktorarbeit und merken, dass das Fach eher weiter unten auf Ihrer Prioritätenliste rangiert? Oder Sie sind praktizierender Arzt und hinterfragen die methodische Vorgehensweise in einer medizinischen Publikation? Vielleicht haben Sie beruflich auch gar nichts mit Medizin zu tun und überlegen, an einer klinischen Studie teilzunehmen, und es interessiert Sie daher, wie so eine Studie wissenschaftlich eigentlich aufgebaut ist? Egal aus welcher Motivation heraus Sie dieses Buch lesen, es soll Ihnen als verständliches und umfassendes Nachschlagewerk dienen. Unser Ziel ist es nicht, einen fertig ausgebildeten Biometriker aus Ihnen zu machen. Wir wollen vielmehr die Freude an der medizinischen Statistik in Ihnen wecken, Ihnen grundlegende Aspekte verständlich und manchmal mit einem Augenzwinkern näherbringen. Wir hoffen, dass Sie nach der Lektüre medizinische Publikationen mit anderen Augen lesen und entdecken, wieso die medizinische Statistik so wichtig für gute klinische Forschung ist.

Wie dieses Buch aufgebaut ist

Dieses Buch besteht aus vier Teilen. Im ersten Teil lernen Sie, was die medizinische Statistik ist, wo Sie mit ihr in Berührung kommen und wo Sie sich Hilfe suchen können, wenn Sie mehr lernen wollen, als in diesem Buch steht. Die anderen drei Teile behandeln die Begriffe und die zugrunde liegende Theorie der medizinischen Statistik. Der zweite und der dritte Teil widmen sich hauptsächlich den Grundlagen, während Sie im vierten Teil eine Fülle von etwas komplexeren, anwendungsrelevanten Themen präsentiert bekommen.

Teil I: Medizinische Statistik – Gel(i)ebte Daten

Was ist überhaupt medizinische Statistik und wo laufen Sie ihr über den Weg? Und warum müssen Sie sich als Mediziner mit Statistik befassen? Was hat medizinische Forschung mit Statistik zu tun? Wo erhalten Sie Hilfe, wenn Sie nicht nur dieses Buch lesen wollen, sondern einen Ansprechpartner brauchen? All dies erfahren Sie im ersten Teil des Buchs.

Teil II: Keine Forschung ohne Fundament - Grundlagen für einen gelungenen Start

In diesem Teil lernen Sie grundlegende Begriffe der medizinischen Forschung kennen sowie die mathematischen Grundlagen, die den statistischen Methoden zugrunde liegen. Was ist eigentlich eine Studie? Warum brauchen Sie dafür Statistik? Wie ist eine Studie aufgebaut? Welche Fehlerquellen gibt es? In diesem Teil erfahren Sie, wie Sie für Ihr Forschungsprojekt ein solides Fundament planen und es so zum Erfolg führen können.

Teil III: Was Sie unbedingt brauchen - Theorie trifft Praxis

Welche statistischen Methoden sollten Sie unbedingt beherrschen? Wenn Sie lernen wollen, wie Sie Ihre Daten aussagekräftig beschreiben können, welche statistischen Tests infrage kommen und wie Sie Zusammenhänge passend darstellen können, sind Sie im dritten Teil richtig.

Teil IV: Blick über den Tellerrand - weiterführende Methoden

Wenn Sie die grundlegenden Methoden schon kennen und nun sehen wollen, was die medizinische Statistik sonst noch so zu bieten hat, dann sind Sie in diesem Teil genau richtig aufgehoben. Von der Analyse von Ereigniszeiten über diagnostische Gütemaße bis hin zu Metaanalysen lernen Sie so einiges kennen. Das Lesen lohnt sich.

Symbole, die in diesem Buch verwendet werden

Neben den Teilen und Kapiteln helfen Ihnen auch sechs Symbole, sich in diesem Buch zurechtzufinden und wichtige Aspekte hervorzuheben.

Hinweise, Tipps und Tricks, die Ihnen Ihr Leben mit der medizinischen Statistik vereinfachen, sind durch dieses Symbol gekennzeichnet.

Vieles ist einfacher zu verstehen, wenn die Begriffe erst einmal eindeutig definiert sind. Definitionen sind durch diese Lupe gekennzeichnet. Neu eingeführte Begriffe können Sie so schnell erkennen.

Die Hinweise und Warnungen neben diesem Symbol sollten Sie genau lesen. Hier weisen wir auf typische Fehler hin, die Sie meist relativ einfach vermeiden können.

Zum besseren Verständnis haben wir viele illustrierende Beispiele in das Buch aufgenommen - viele davon sind den »wahren« Erfahrungen des einen oder anderen Biostatistikers nachempfunden. Vielleicht finden Sie Parallelen zu Ihrem eigenen Forschungsprojekt in einem der Beispiele wieder, sodass Ihnen die Anwendung der statistischen Methoden anschließend noch leichterfällt.

In einer grau unterlegten Box mit diesem Symbol finden Sie mathematische Hintergründe und technisches Zusatzwissen. Dieses Wissen benötigen Sie nicht, um den übrigen Text im Buch zu verstehen. Sie können diesen daher auch überspringen. Wir freuen uns natürlich, wenn Sie den Text dennoch lesen und so Ihren eigenen mathematischen Horizont erweitern.

Es ist leichter, sich Dinge zu merken, die »merkwürdig« sind. In einer grau unterlegten Box mit diesem Symbol finden Sie kleine illustrative und teilweise wahre Geschichten, die manchmal zum Schmunzeln anregen. Wenn Sie es eilig haben, brauchen Sie diese Texte aber nicht zu lesen.

Grundsätzlich gilt - Text, der in einer grauen Box steht, können Sie ohne Bedenken überspringen, ohne dass Ihnen wichtiges Wissen für das Verständnis der folgenden Seiten fehlt. Nun aber viel Freude beim Nachschlagen, Schmökern und bei einleuchtenden Erkenntnisgewinnen!

Teil I

Medizinische Statistik - Gel(i)ebte Daten

IN DIESEM TEIL …

lernen Sie, was Statistik eigentlich mit Medizin zu tun hat,erfahren Sie, warum Sie als Mediziner Statistik können sollten,zeigen wir Ihnen, was genau Sie wissen müssen und wo Sie biometrische Unterstützung bekommen,bekommen Sie Tipps, welche Software für Sie hilfreich ist.

Kapitel 1

Statistik und Medizin – wie passt das zusammen?

IN DIESEM KAPITEL

Was ist medizinische Statistik?

Wo wird sie gebraucht?

Aufgabenbereiche der medizinschen Statistik

Medizinische Statistik« - was ist das eigentlich? Was hat Statistik mit Medizin zu tun? Warum haben alle größeren Universitätskliniken und die meisten größeren Pharmaunternehmen eigene Statistik-Abteilungen oder Institute? Als Leser dieses Buchs sind Sie vermutlich angehender Mediziner. Sie haben sich also entschieden, als praktizierender Arzt oder forschender Grundlagenmediziner arbeiten zu wollen. Patienten helfen - dies ist das oberste Ziel der Medizin. Mathematische Sachverhalte oder Statistik interessieren dabei eigentlich nicht, oder? Der medizinische Fortschritt lebt von Forschung, seien es Zellexperimente im Labor, Tierversuche oder Studien an Patienten. Die medizinische Forschung beruht dabei auf dem Prinzip, neue Substanzen oder Therapien systematisch auszuprobieren - es werden Experimente durchgeführt. Eine klinische Studie ist genau das - ein Experiment an Patienten. Wie aber muss ein Experiment angelegt sein, damit es aussagekräftige Ergebnisse liefert? Wie oft müssen Sie den Versuch wiederholen? Was sind geeignete Vergleichsgruppen? Welche Merkmale werden verglichen? Wie können Sie zufällige von systematischen Effekten unterscheiden? Für all diese Fragen brauchen Sie Statistik. Nun gibt es Statistik natürlich nicht nur in der Medizin, sondern zum Beispiel auch in der Wirtschaft, im Versicherungswesen, im Marketing und in vielen weiteren Bereichen. Gibt es wirklich unterschiedliche Arten von Statistik? Braucht es den Zusatz »medizinische Statistik«? Tatsächlich sind die mathematischen Grundlagen der Statistik in allen Anwendungsbereichen dieselben. Allerdings haben die verschiedenen Fächer unterschiedliche Zielsetzungen und Forderungen an die Statistik. Dadurch kommen in den verschiedenen Disziplinen unterschiedliche statistische Methoden zum Einsatz, und es haben sich auch verschiedene Empfehlungen und Leitlinien etabliert. Sie können also gerne ein allgemeines Buch über Statistik lesen und werden dabei viel lernen. Die spezifischen Anforderungen statistischer Methoden in der Medizin finden Sie dort aber vermutlich nicht. Aber das macht nichts - Sie haben ja jetzt dieses Buch in der Hand.

Medizinische Statistik, Biostatistik, medizinische Biometrie: Eine Begriffsbestimmung

Dieses Buch trägt im Titel die Bezeichnung medizinische Statistik. Sie haben bereits erfahren, dass es durchaus sinnvoll ist, Statistik in der Medizin als einen eigenen Bereich in der Statistik anzusehen. Allerdings gibt es noch andere Bezeichnungen dafür. Im Deutschen ist der Begriff medizinische Biometrie gebräuchlich.

In dem Wort Biometrie stecken die altgriechischen Wörter »bíos«, zu Deutsch »Leben« und »métron« für »Maß«. Es geht also um die Lehre der Messung, Erfassung und Auswertung in den Lebenswissenschaften.

Die Lebenswissenschaften umfassen die Medizin, aber auch Biologie und Landwirtschaft. Daher sollten Sie den Zusatz medizinische Biometrie verwenden, wenn Sie von Statistik in der Medizin sprechen. Im Englischen gibt es zwar das entsprechende Wort »medical biometry«, weitaus gebräuchlicher ist aber der Begriff »biostatistics«. Der deutsche Begriff Biostatistik wird daher häufig als Synonym für medizinische Statistik oder medizinische Biometrie verwendet. Streng genommen ist dieser Begriff aber weniger aussagekräftig, da er sich wieder auf die gesamten Lebenswissenschaften und nicht nur auf die Medizin bezieht. Für Sie ist es erst einmal nur wichtig, dass Sie alle Begrifflichkeiten schon mal gehört haben und als Synonyme verwenden können.

Wo wird medizinische Statistik gebraucht?

Medizinische Statistik wird in der medizinischen Forschung gebraucht. Damit finden Sie medizinische Statistik überall da, wo medizinische Forschung stattfindet - nämlich

an Universitätskliniken und anderen Forschungseinrichtungen ((Fach-)Hochschulen, Bundesinstitute …) und

in pharmazeutischen Unternehmen und Auftragsforschungsunternehmen.

Tatsächlich hat fast jedes Universitätsklinikum ein eigenes Institut für medizinische Statistik. Oft sind diese Institute zusätzlich auch fächerübergreifend für die Bereiche medizinische Informatik und Epidemiologie zuständig. In großen pharmazeutischen Unternehmen gibt es meist eigene Statistik-Abteilungen. Kleinere Unternehmen kaufen sich die statistische Expertise oft als Dienstleistung ein.

Aufgabenbereiche der medizinischen Statistik

Die medizinische Statistik hat ihre Daseinsberechtigung in der medizinischen Forschung. Damit ist die medizinische Statistik eine Hilfswissenschaft - medizinische Statistik hat keinen Selbstzweck. Auch wenn die medizinische Statistik eine Hilfswissenschaft ist, so sind Biostatistiker weit mehr als »Datendienstleister«. Biostatistiker sorgen nicht nur dafür, dass die statistischen Methoden korrekt angewandt werden, sondern entwickeln auch neue Methoden. Da Biostatistiker immer an der Schnittstelle zur Medizin arbeiten, müssen sie außerdem den forschenden Medizinern die verwendeten Methoden vermitteln können.

Die Aufgaben von medizinischen Statistikern gliedern sich daher in folgende Bereiche:

Anwendung statistischer Methoden

in Planung, Auswertung und Interpretation medizinischer Forschungsprojekte,

Vermittlung und Kommunikation

statistischer Sachverhalte an medizinische Anwender und

Optimierung und Entwicklung

neuer statistischer Methoden für eine effizientere, aussagekräftigere medizinische Forschung.

Diese drei Hauptaufgabenbereiche sind dabei nicht streng getrennt. So kann eine spezielle Studiensituation die Entwicklung neuer Methoden erfordern. Welche Methoden für ein Forschungsprojekt angewendet oder entwickelt werden müssen, kann wiederum nur im engen Austausch zwischen Statistikern und Medizinern herausgefunden werden.

Anwendung statistischer Methoden in medizinischen Forschungsprojekten

Es gibt eine Vielzahl statistischer Methoden für die unterschiedlichsten Datensituationen. Meistens gibt es sogar für ein und dieselbe Datensituation mehrere Herangehensweisen. Die Anwendung existierender Methoden ist daher kein Selbstläufer. Gute Biostatistiker müssen viele Methoden und ihre Vor- und Nachteile kennen. Sie müssen außerdem wissen, wo und wie sie sich schnell über neuere Methoden informieren können, denn die medizinische Statistik entwickelt sich stetig weiter. Zwar gibt es Verfahren, wie zum Beispiel den t-Test, die seit Jahrzehnten etabliert sind und nichts an ihrer Aktualität eingebüßt haben. Aber auch lang etablierte Methoden können irgendwann durch wesentlich effizientere Verfahren abgelöst werden.

Nicht nur die medizinische Statistik entwickelt sich weiter. Auch die medizinische Forschung muss sich ständig neuen Herausforderungen stellen. So liefert etwa das zunehmend digitalisierte Gesundheitssystem immer neue Datenquellen für die Forschung. Diese Daten enthalten allerdings oft viele Fehlwerte und Verzerrungsquellen. Daraus resultiert der Bedarf an statistischen Methoden, solche Verzerrungen aufzudecken und damit adäquat umzugehen. Der begrüßenswerte Trend hin zur personalisierten Medizin erfordert, dass Patienten in immer spezifischere Subgruppen eingeteilt werden - es werden also statistische Methoden für kleine Fallzahlen erforderlich. Auch der angewandte Statistiker muss sich daher methodisch immer weiterbilden. Falsch angewandte statistische Methoden können im schlimmsten Fall dazu führen, dass die Ergebnisse fehlinterpretiert werden - mit negativen Konsequenzen für die Patienten und die Gesellschaft. Medizinische Statistiker haben hier also eine große Verantwortung zu tragen.

Kommunikation mit medizinischen Anwendern

Mathematiker gelten oft als »Nerds«. Sie sitzen in dunklen Räumen vor Computerbildschirmen oder brüten den ganzen Tag über Formeln. Biostatistiker sind anders! Der Erfolg eines Biostatistikers hängt maßgeblich von seinen kommunikativen Fähigkeiten ab, wie Zapf et al. (2019) darlegen. Ein Statistiker, der jede Formel kennt, aber diese nicht vermitteln kann, hilft der medizinische Forschung nicht. Der medizinische Statistiker hat die Aufgabe, die Methoden so vereinfacht und dennoch richtig zu kommunizieren, dass der forschende Mediziner diese verstehen kann. Für Biostatistiker, die an Universitätskliniken angestellt sind, ist eine zentrale Form der Kommunikation die studentische Lehre. Aber auch klassische statistische Beratungsgespräche im kleinen Kreis erfordern diese kommunikativen Fähigkeiten.

Forschende Mediziner sind keine Statistiker und müssen es auch nicht werden. Der medizinische Statistiker ist kein Mediziner und muss es ebenfalls nicht werden. Damit sich beide Spezies miteinander unterhalten können, müssen einige Regeln beachtet werden. Viele Mediziner haben eine gewisse Scheu vor statistischen Inhalten. Nicht selten kommen Studierende mit einer gewissen Angst in statistische Vorlesungen oder in eine statistische Beratung. Aber vergessen Sie nicht: Der Statistiker hat Ihnen zwar bezüglich der Formeln etwas voraus, aber er kennt die medizinischen Zusammenhänge weit weniger gut als Sie. Mediziner und Statistiker müssen sich also auf ein gemeinsames Niveau begeben, wie Abbildung 1.1 zeigt. Nicht selten haben junge, angehende Biostatistiker deshalb in einer Beratungssituation ebenfalls Angst - nämlich davor, die medizinischen Inhalte nicht zu verstehen.

Auf beiden Seiten gilt: Abkürzungen, Fach- und Fremdwörter vermeiden, auch wenn sie noch so gebräuchlich erscheinen.Vermutlich wird nicht gleich alles verstanden, was der Gesprächspartner sagt: Nachfragen erwünscht!

Entwicklung neuer statistischer Methoden

Da die medizinische Statistik eine Hilfswissenschaft ist, werden Statistiker leider manchmal zu Hilfswissenschaftlern degradiert - als Datendienstleister. Viele Biostatistiker sind aber selbst Forscher. Statistische Methodenforschung ist oft sehr anspruchsvoll, denn dabei geht es tatsächlich um Mathematik. Nicht alle Biostatistiker betreiben methodische Forschung, und das muss auch nicht sein. Aber die medizinische Statistik entwickelt sich weiter durch die Biostatistiker, die nicht nur Methoden anwenden, sondern auch welche entwickeln. Biostatistiker und medizinische Forscher sollten sich daher unbedingt auf Augenhöhe begegnen!

Abbildung 1.1: Kommunikation ist alles.

Literatur

Zapf, A., Huebner, M., Rauch, G., Kieser, M. (2019). What Makes a Biostatistician?

Statistics in Medicine

38(4): 695–701.

Kapitel 2

Besser beraten lassen - Hilfe holen erwünscht

IN DIESEM KAPITEL

Wo finde ich biometrische Beratung?

Wie kann eine Beratung helfen?

Ein Überblick über statistische Software

In diesem Kapitel erfahren Sie mehr über das Thema »biometrische Beratung«, wo Sie eine biometrische Beratung finden können, wie Ihnen dort geholfen werden kann und was Sie mitbringen können, um den maximalen Nutzen aus der Beratung zu ziehen. Wir haben Ihnen eine subjektive Auswahl an beratenden Instituten zusammengefasst, um Ihnen eine Orientierung zu geben. Wir bieten Ihnen auch einen kleinen Wegweiser durch das Buch, wenn es Ihnen nur um Fragen rund um die Beratung geht. Wo in diesem Buch finden Sie Informationen zu üblichen Fragen, die Statistiker Ihnen im Rahmen eines Beratungsgesprächs stellen könnten? Abgeschlossen wird dieses Kapitel mit einer kurzen Vorstellung gängiger statistischer Software, die Sie für die Auswertung Ihrer Daten nutzen können.

Wo finden Sie biometrische Unterstützung?

Sie haben ein wissenschaftliches Projekt vor sich, arbeiten an Ihrer Doktorarbeit oder sind mitten in einem Experiment? Abhängig von Ihrer Erfahrung haben Sie vielleicht schon die eine oder andere Datenauswertung gemacht oder aber Sie sind ganz neu in dem Feld der biometrischen Auswertung. Egal, ob Sie einen Ethikantrag oder einen Tierschutzantrag einreichen möchten, ob Sie einen Drittmittelantrag vorbereiten oder ob Sie sich schon in der Phase der Auswertung eines Projekts befinden - eine biometrische Beratung kann Ihnen dabei helfen. Die gute Nachricht ist: In der DACH-Region (Deutschland, Österreich und Schweiz) gibt es eine Vielzahl an Angeboten für biometrische Unterstützung. Das Beratungsangebot ist bezüglich der Organisation und der Leistungen teilweise sehr heterogen, Sie finden aber an fast jeder Universitätsklinik einen Ansprechpartner. Viele städtische Kliniken haben Kooperationsverträge mit Universitätskliniken abgeschlossen, sodass auch dort die Möglichkeit einer Beratung gegeben ist. Häufig ist die (Erst-)Beratung kostenlos! Biometriker sind dazu ausgebildet, forschende Mediziner zu unterstützen, und helfen gerne!

Eine Suche im Internet mit den Suchbegriffen »biometrische Beratung« oder »statistische Beratung« und dem jeweiligen Namen der Universität liefert meist den entsprechenden Ansprechpartner. Wir haben im Folgenden eine nicht repräsentative Liste von Beratungsangeboten in der DACH-Region für Sie zusammengestellt (geografisch sortiert). Die Kontaktaufnahme erfolgt meist über eine webbasierte Anmeldemaske oder per E-Mail. Viele Standorte haben auch eine »Statistikambulanz«, eingerichtet, bei der Ratsuchende an einem bestimmten Tag der Woche ohne Voranmeldung eine statistische Beratung bekommen können. Aus Erfahrung empfiehlt es sich aber, gerade bei komplexeren Forschungsvorhaben, dem Beratenden vor der Beratung schon einige Informationen zu dem Projekt zukommen zu lassen und ihm ein wenig Zeit zu geben, sich in die medizinische und daraus ergebende biometrische Fragestellung einzudenken.

Auswahl von beratenden Instituten in der DACH-Region

Eine (nicht vollständige!) Auswahl an Instituten, die in Deutschland, Österreich und Schweiz (DACH-Region) biometrische Beratung anbieten:

Das Institut für Medizinische Biometrie und Epidemiologie am Universitätsklinikum Hamburg-Eppendorf (https://www.uke.de/kliniken-institute/institute/medizinische-biometrie-und-epidemiologie/wir-bieten-an/beratung.html)Das Institut für Biometrie und Klinische Epidemiologie der Charité – Universitätsmedizin Berlin (https://biometrie.charite.de/service_unit_biometrie/kostenloses_beratungsangebot/)Das Statistisches Beratungszentrum an der Technischen Universität Dortmund (https://www.statistik.tu-dortmund.de/beratung.html)Das Institut für Medizinische Biometrie und Informatik am Uniklinikum Heidelberg (https://www.klinikum.uni-heidelberg.de/medizinische-biometrie/biometrische-beratung/)Das Institut für Medizinische Biometrie und Statistik an der Albert-Ludwigs-Universität Freiburg (https://www.imbi.uni-freiburg.de/studien_beratung/statBeratung/studien_beratung/)Das Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie der Ludwig-Maximilians-Universität München (https://www.ibe.med.uni-muenchen.de/services/promotionsberatung/)Die Methodenberatung der Universität Zürich (https://www.methodenberatung.uzh.ch/de.html)Das Institut für Klinische Biometrie an der Medizinischen Universität Wien (https://cemsiis.meduniwien.ac.at/kb/services/statistische-beratung/)

Auf geht's! Melden Sie sich zu einer biometrischen Beratung in Ihrer Nähe an und bringen Sie Ihr Projekt weiter auf dem Weg zu einer erfolgreichen Dissertation, Publikation oder einem Drittmittelantrag. Eine Beratung kann hierbei nur nützlich sein!

Nehmen Sie rechtzeitig Kontakt zu einer beratenden Institution auf und bedenken Sie, dass der Berater nicht gleich im ersten Gespräch die Fallzahl für Ihre Studie nennen oder den Drittmittelantrag guten Gewissens unterschreiben kann. Der Berater muss sich dazu erst einarbeiten und wird Rückfragen an Sie haben. Meist sind mehrere Beratungstermine erforderlich.

Vorbereitung auf einen Beratungstermin

Sie haben einen statistischen Beratungstermin an der entsprechenden Institution Ihrer Hochschule vereinbart? Sie fragen sich jetzt, wie Sie sich für den Beratungstermin vorbereiten können? Dabei hilft Ihnen unsere Checkliste.

Checkliste zur Vorbereitung auf einen statistischen Beratungstermin:

Wenn mehrere Personen an dem Forschungsprojekt beteiligt sind, so ist es meist sinnvoll, auch zusammen zu dem statistischen Beratungstermin zu gehen. Viele Missverständnisse entstehen durch »Flüsterpost-Effekte«: Der Berater gibt Hinweise, der Ratsuchende gibt diese mündlich an andere Projektpartner weiter, etwa an den Doktorvater oder die Doktormutter, kann aber nicht alles inhaltlich korrekt wiedergeben. Der Projektpartner schreibt die verfälschten Ratschläge im Projektantrag nieder und verzerrt durch die Formulierung wieder etwas den eigentlichen Wortlaut des Ratschlags. Am Ende enthält das Schriftstück gravierende statistische Mängel, obwohl ein Rat eingeholt wurde. Dies kann verhindert werden, indem alle Projektpartner mit dem Statistiker sprechen und indem der Statistiker alle schriftlichen Dokumente vor der offiziellen Verwendung noch einmal überprüft.

Sie sollten Ihre medizinische(n) Forschungsfrage(n) (jeweils) in einer konkreten mit »Ja« oder »Nein« beantwortbaren Frage formulieren können. Es hilft, wenn Sie die Forschungsfragen schriftlich niederschreiben. Oft wird dann erst ersichtlich, was vielleicht noch nicht konkret genug ist. Näheres zur Formulierung der Fragestellung erfahren Sie in

Kapitel 6

.

Sie können die Zielgrößen Ihrer Studie, also den primären Endpunkt und die relevanten sekundären Endpunkte, klar benennen. Überlegen Sie sich, in welcher physikalischen Einheit die Zielgrößen gemessen werden und mit welchen Erhebungsinstrumenten diese gemessen werden. In

Kapitel 3

erfahren Sie alles rund um das Thema »Endpunkte«.

Sie kennen die relevante Literatur zu Ihrem Forschungsthema. Die zwei bis drei wichtigsten Literaturquellen können Sie in die Beratung mitbringen.

Sofern Ihre Daten schon vorliegen, sollte die Datentabelle geeignet formatiert sein, um für gängige Statistiksoftware einlesbar zu sein. Denken Sie daran, dass der Biometriker zu keiner Zeit Einsicht in personenidentifizierende Daten haben darf. Die Namen der Patienten sollten daher in der Tabelle nicht erscheinen. Wie Sie Ihre Daten am besten formatieren, erfahren Sie in

Kapitel 5

.

Machen Sie sich erste Gedanken, welche Software Sie für die Auswertung der Daten verwenden möchten. Einen Überblick über verschiedene Software-Lösungen finden Sie am Ende dieses Kapitels.

Sie haben das Gefühl, eigentlich nicht so richtig »was zu wissen«? Das ist kein Problem! In eine statistische Beratung können Sie auch dann gehen, wenn Sie fast kein statistisches Vorwissen haben. Besser ist es natürlich, wenn Sie selbst schon einmal anfangen, sich zu belesen, zum Beispiel mit diesem Buch!

Welche Software brauchen Sie?

Es gibt eine breite Palette an statistischen Software-Lösungen für die medizinische Forschung. Diese Programme haben unterschiedliche Vor- und Nachteile, die wir Ihnen im Folgenden aufzeigen. Viele der Programme kosten Lizenzgebühren, die im Preis sehr unterschiedlich sind. An vielen Universitätskliniken gibt es allerdings auch zentral nutzbare Lizenzen für solche Programme. Oft werden auch Lizenzen für die gesamte Universität abgeschlossen, sodass keine weiteren Kosten für den Endnutzer entstehen.

SPSS - gut für Anwender

Das Statistikprogramm SPSS (https://www.ibm.com/de-de/analytics/spss-statistics-software), offizieller Name IBM SPSS Statistics, ist in der Medizin weit verbreitet. Ursprünglich kommt es aus den Sozialwissenschaften, was auch der Name »Statistical Package for the Social Sciences« (SPSS) nahelegt. SPSS orientiert sich in der Programmführung an Microsoft Excel. Das erleichtert den Einstieg in SPSS. Es gibt einen Reiter für die Datenansicht, der ähnlich aufgebaut ist wie ein Excel-Arbeitsblatt. Zusätzlich gibt es einen weiteren Reiter für die Variablenansicht, in dem Sie die Eigenschaften jeder Variablen definieren können. SPSS hat eine einfach bedienbare Benutzeroberfläche - Sie brauchen keine Programmiersprache zu können, um SPSS zu bedienen. Das birgt allerdings auch Gefahren. Durch ein paar einfache »Klicks«, gelangen Sie zu Ergebnissen. Das Programm spuckt auch dann etwas aus, wenn Sie die falschen Methoden auf die Daten anwenden. Kurz: Es ist einfach, sich eine Menge Mist zusammenzuklicken, wie in Abbildung 2.1 dargestellt. Wenn Sie möchten, können Sie auch ohne die Benutzeroberfläche Ihre Kommandos direkt in SPSS programmieren. Das ist zwar mehr Programmieraufwand, erfordert aber auch mehr Nachdenken über die angewandte Methodik. Eine weitere Möglichkeit ist, die durch Klicks entstandenen Befehle in einer Syntax-Datei abzuspeichern. Damit können Sie auch »zusammengeklickte« Methoden nachvollziehbar speichern.

Abbildung 2.1: Nicht alles, was eine Statistiksoftware ausspuckt, ergibt auch Sinn.

Die Methoden, die Sie mit SPSS anwenden, sollten Sie immer inhaltlich verstanden haben. Eine Software berechnet auch unsinnige Dinge, wenn Sie nicht die richtigen Befehle eingeben. Das gilt grundsätzlich für jede Software - durch die Nutzung grafischer Benutzeroberflächen ist die Versuchung besonders groß, den Kopf »auszuschalten«.

Fast alle gängigen statistischen Methoden stehen in SPSS zur Verfügung. Die Betonung liegt hier auf gängig. Wenn Sie komplexere Methoden anwenden wollen oder aber sehr aktuelle, neue Methoden nutzen möchten, ohne selbst Kommandos zu programmieren, dann müssen Sie auf andere Programme zurückgreifen. Es gibt eine große Fülle von Einführungsliteratur in SPSS - zum Beispiel von Brosius (2017) und Faik (2018) aus der »Dummie«-Serie.

R Project - Am Puls der neusten biometrischen Methoden

Sie haben eine medizinische Fragestellung, die komplexe biometrische Verfahren benötigt? Wollen Sie etwa maschinelle Lernverfahren nutzen? Oder haben Sie in einer Veröffentlichung von einer neuen biometrischen Methode gelesen und wollen diese auch auf Ihre Daten anwenden? In diesem Fall können Sie die statistische Programmiersprache R (https://www.r-project.org/) nutzen. Da es sich bei R um eine konsolenbasierte Programmiersprache handelt, empfiehlt es sich, zusätzlich ein Bearbeitungsprogramm (Editor) zu nutzen, das Ihnen die Anwendung erleichtert. Wir empfehlen Ihnen hier RStudio (https://www.rstudio.com/). Beide Programme, R und RStudio, haben den entscheidenden Vorteil, dass sie kostenfrei erhältlich sind. Jeder Nutzer von R kann selbst neue Software-Komponenten entwickeln (sogenannte »Pakete«) und diese anderen Nutzern frei zur Verfügung stellen. Wenn Sie noch keine Programmiererfahrung haben, so ist die Nutzung von R jedoch am Anfang schwierig und bedarf einer gewissen Einarbeitungszeit. Diese Zeit lohnt sich jedoch, da mit R fast alles möglich ist. Es gibt im Internet (zum Beispiel bei YouTube) viele sehr gute Tutorien, die einen Einstieg in R ermöglichen und natürlich auch zahlreiche Bücher, zum Beispiel das von De Vries und Meys (2015) aus der »Dummie«-Serie. Auch gibt es an fast jeder Universität R-Kurse für Programmieranfänger. Grundsätzlich sollten Sie sich die Frage stellen, ob Sie in Ihrer zukünftigen Forscherkarriere immer wieder Datenanalysen selbst durchführen wollen. In diesem Fall lohnt und empfiehlt sich die Einarbeitung in R unbedingt. Wenn Sie nur für die Doktorarbeit eine Auswertung brauchen und danach ohnehin als niedergelassener Arzt arbeiten wollen, ist SPSS einfacher und völlig ausreichend.

SAS und STATA - validiert für die Industrie

Die Software R ist kostenlos und ein Alleskönner. Allerdings ist gerade die Tatsache, dass die Software kostenlos ist und sich ständig weiterentwickelt, auch ein Nachteil - die riesige Vielzahl an ständig wachsenden Programm-Paketen ist nämlich schwer zu validieren. Gerade für klinische Studien der Pharmaindustrie ist die Validierung der genutzten Software aber eine zentrale Notwendigkeit. Viele Firmen greifen deshalb auf kostenpflichtige und validierte Software zurück. Am weitesten verbreitet sind hier SAS (www.sas.com) und STATA (www.stata.com). STATA hat ebenfalls eine einfach bedienbare Benutzeroberfläche und die Möglichkeit, direkt über eine Konsole zu programmieren. Mit diesen Programmen werden Sie als Mediziner vermutlich aber eher selten in Berührung kommen. Wenn Sie dennoch an einer Einführung in die Programme interessiert sind, dann schauen Sie doch mal in die Bücher von Krämer et al. (2018), Kohler und Kreuter (2016) und Field (2013).

Tabelle 2.1 zeigt Ihnen im Überblick Vor- und Nachteile der verschiedenen Softwareprogramme.

Programm

Kostenfrei

Grafische Benutzeroberfläche

Validiert(für die Industrie)

Methoden-vielfalt

SPSS

R

SAS

STATA

Tabelle 2.1: Vor- und Nachteile verschiedener statistischer Softwareprogramme.

Literatur

Brosius, F. (2017). SPSS 24 für Dummies. John Wiley & Sons.

De Vries, A., Meys, J. (2017). R für Dummies. John Wiley & Sons.

Faik, J. (2018). Statistik mit SPSS Alles in einem Band für Dummies. John Wiley & Sons.

Field, A. (2013). Discovering statistics using IBM SPSS statistics. Sage.

Kohler, U., Kreuter, F. (2016). Datenanalyse mit Stata: allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. Walter de Gruyter GmbH & Co KG.

Krämer, W., Schoffer, O., Tschiersch, L., Gerß, J. (2018). Datenanalyse mit SAS

®

: Statistische Verfahren und ihre grafischen Aspekte. Springer Gabler.

Teil II

Keine Forschung ohne Fundament - Grundlagen

IN DIESEM TEIL …

lernen Sie, was Sie brauchen, um endlich los zu forschen,erfahren Sie, welche Arten von Studien es gibt,zeigen wir Ihnen, was ein Studiendesign ist und wie Sie sich eins »schneidern« können,lernen Sie die wichtigsten Grundbegriffe der medizinischen Forschung kennen,legen wir ein paar mathematische Grundlagen fest,lernen Sie was ein statistisches Modell ist, was Verteilungen sind und natürlich, wie diese Konzepte helfen, Ihr Forschungsprojekt auf sichere Füße zu stellen.

Kapitel 3

Grundbegriffe und Studientypen

IN DIESEM KAPITEL

Stichprobe und Grundgesamtheit

Endpunkte und Einflussfaktoren

Konfirmatorisch versus explorativ

Studiendesigns und Studientypen

Ziel medizinischer Forschung ist eine verbesserte Patientenversorgung. Die medizinische Forschung hat in den letzten Jahrzehnten enorme Fortschritte gemacht, und vieles wurde bereits detailliert erforscht. Dennoch bleiben sehr viele medizinische Fragestellungen unbeantwortet, zum Beispiel im Bereich der seltenen Erkrankungen oder der Onkologie. In Zukunft werden sicher noch viele neue Fragen dazukommen. In der Medizin werden ständig Antworten auf offene Forschungsfragen generiert. Damit diese Forschungsergebnisse auch tatsächlich die richtige Antwort auf die Forschungsfrage liefern, ist eine sorgfältige Planung einer Studie vor deren eigentlichem Beginn sehr wichtig.

Denken Sie mal kurz an Ihren nächsten Urlaub. Wenn Sie nur einen knapp bemessenen zeitlichen und finanziellen Rahmen dafür haben, sollten Sie sich vorab folgende Fragen stellen: »Wohin möchte ich reisen?« »Wie komme ich dort hin?« »Was möchte ich dort machen?« All diese Fragen erlauben es Ihnen zu präzisieren, wie ein Urlaub sein muss, damit Sie ihn als gelungen empfinden. Viele Urlaubsanbieter bieten Suchmaschinen im Internet an - mit einer geeigneten Stichwortsuche kommen Sie Ihrem Traumziel so schnell näher. Ähnlich verhält es sich auch mit der empirischen Forschung in der Medizin - Sie sollten eine Studie gründlich planen und dafür die notwendigen Stichwörter kennen. In diesem Kapitel stellen wir Ihnen die grundlegenden Begriffe für empirische Studien in der Medizin vor. Sie lernen verschiedene Studientypen kennen und werden mit unterschiedlichen Studiendesigns vertraut gemacht.

Grundlegende Begriffe empirischer Forschung in der Medizin

Empirische Forschung in der Medizin beschreibt das systematische Erforschen von medizinischen Themen mittels beobachteter Zusammenhänge anhand erhobener Daten, um letztlich relevante Aussagen für die medizinische Praxis treffen zu können. Sie brauchen also Daten! Woher kommen die eigentlich?

Grundgesamtheit und Stichprobe