22,99 €
Wenn auch Sie Ihre kleinen Problemchen mit medizinischer Statistik haben, sind Sie hier genau richtig. Mit viel Witz bringen Ihnen die Autoren Geraldine Rauch, Konrad Neumann, Ulrike Grittner, Carolin Herrmann und Jochen Kruppa die Prinzipien der Biostatistik näher. In diesem Buch lernen Sie alles, was Sie benötigen, um Statistik im medizinischen Bereich erfolgreich einzusetzen. Angefangen bei der Begriffskunde und den Grundlagen, erfahren Sie alles von Studientypen über deskriptive Verfahren, Verteilungen, Schätzungen oder Korrelation und Regression bis hin zur Ereigniszeitanalyse, diagnostischen Tests und multiplem Testen. Die Autoren bringen Ihnen das theoretisch vermittelte Wissen mit vielen anschaulichen Beispielen näher. So schaffen Sie die nächste Klausur mit Links!
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 535
Veröffentlichungsjahr: 2020
Medizinische Statistik für Dummies
Medizinische Statistik für Dummies
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
1. Auflage 2019
© 2019 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim
All rights reserved including the right of reproduction in whole or in part in any form. This book published by arrangement with John Wiley and Sons, Inc.
Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form. Dieses Buch wird mit Genehmigung von John Wiley and Sons, Inc. publiziert.
Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.
Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.
Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.
Korrektur: Claudia Lötschert
Print ISBN: 978-3-527-71584-8ePub ISBN: 978-3-527-82118-1mobi ISBN: 978-3-527-82119-8
Das sind wir: Wir Autoren sind ein bunter Haufen von Wissenschaftlern mit unterschiedlichsten Hintergründen. Wir alle teilen die Liebe zu unserem Fach. Wir hoffen, dass ein Teil unserer Begeisterung vielleicht auch auf Sie als Leser übergeht. Unser Motto:
»Statistik macht Spaß!«
Geraldine Rauch leitet seit Juli 2017 das Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Die Heidelbergerin studierte Mathematik an der Universität Bremen. Nach einem Forschungsaufenthalt an der Cardiff University in Wales promovierte Geraldine Rauch bei der Firma Roche Diagnostics in Penzberg. Im Jahre 2009 trat sie eine Stelle als wissenschaftliche Mitarbeiterin am Institut für Medizinische Biometrie und Informatik des Universitätsklinikums Heidelberg an und übernahm dort drei Jahre später die Leitung der Arbeitsgruppe »Klinische Studien«. Im Jahre 2015 schloss sie ihre Habilitation ab. Für die daraus resultierende Arbeit »Opportunities and challenges of combined effect measures based on prioritized outcomes« gewann sie 2014 den Paul Martini Preis der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS). Neben ihrer beruflichen Tätigkeit gründete Geraldine Rauch im Jahre 2011 die Arbeitsgruppe »Lehre und Didaktik in der Biometrie« innerhalb der Deutschen Region der Internationalen Biometrischen Gesellschaft, die ein Forum zur Vernetzung und zum Austausch von Unterrichtskonzepten und Ideen im Bereich der Biometrie-Lehre bietet. Im Januar 2017 folgte Prof. Rauch dem Ruf auf eine W3-Professur für Medizinische Biometrie an das Universitätsklinikum Hamburg-Eppendorf (UKE), wo sie die stellvertretende Leitung des Instituts für Medizinische Biometrie und Epidemiologie innehatte. Sie wechselte nur ein halbes Jahr später auf die jetzige Position in Berlin.
Konrad Neumann stammt aus München und ist zurzeit wissenschaftlicher Mitarbeiter am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Nach einem Studium der Mathematik an den Universitäten Heidelberg und Erlangen-Nürnberg promovierte er in Erlangen in Mathematik. Darauf folgte ein zweijähriger Forschungsaufenthalt an der Tel Aviv University (Israel) als Minerva-Stipendiat. Danach konnte er in einem privaten Versicherungsunternehmen Erfahrung in Versicherungsmathematik und Datenverarbeitung sammeln. Seit 2002 arbeitet er an der Charité. Der Schwerpunkt seiner Tätigkeit ist dort neben methodischer Forschung die statistische Beratung von forschenden Medizinern.
Ulrike Grittner leitet aktuell die Arbeitsgruppe »Beobachtungsstudien Registerdaten« am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Ulrike Grittner ist Potsdamerin und studierte Mathematik, Bildende Kunst und Erziehungswissenschaften in Erfurt und Berlin. Im Jahr 2006 promovierte sie im Bereich Erziehungswissenschaften. Im Jahr 2017 erfolgte die Habilitation im Bereich Public Health. Sie ist Coautorin bei mehr als 130 wissenschaftlichen Publikationen und lehrt seit mehr als 15 Jahren Biostatistik für Studierende der Medizin und verschiedener Master-Studiengänge im Bereich Public Health.
Carolin Herrmann leitet aktuell die Arbeitsgruppe »Klinische Studien« am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Sie studierte Mathematik an der Universität Bielefeld sowie in Bergen, Norwegen. Im Anschluss trat sie ihre Stelle als wissenschaftliche Mitarbeiterin an der Charité an. Ihr Forschungsschwerpunkt ist die Optimierung von klinischen Studiendesigns durch eine Anpassung der Fallzahl während einer laufenden Studie. Darüber hinaus liegt ihr die Lehre besonders am Herzen. Sie unterrichtet Studierende der Medizin, Bioinformatik, Statistik und Gesundheitswissenschaften an verschiedenen Hochschulen.
Jochen Kruppa leitet aktuell die Arbeitsgruppe »Statistische Bioinformatik« am Institut für Biometrie und Klinische Epidemiologie der Charité - Universitätsmedizin Berlin. Der Uelzener studierte Pflanzenbiotechnologie mit Schwerpunkt Biostatistik an der Leibniz Universität Hannover. Jochen Kruppa promovierte als wissenschaftlicher Mitarbeiter an der Universität zu Lübeck mit dem Themenschwerpunkt Maschinelles Lernen und Epidemiologie auf genetischen Datensätzen. In den folgenden zwei Jahren war er erst am Universitätsklinikum Göttingen am Institut für Biometrie in der bioinformatorischen und statistischen Beratung beschäftigt und anschließend an der Tierärztlichen Hochschule Hannover als Bioinformatiker. Seit 2018 ist Jochen Kruppa an der Charité - Universtätsmedizin Berlin tätig. Darüber hinaus unterrichtet Jochen Kruppa statistische Themen als freier Dozent für Doktoranden und PostDocs unter anderem am Leibniz-Zentrum Borstel. Von 2018 bis 2019 leitete er die Arbeitsgruppe »Lehre und Didaktik in der Biometrie« innerhalb der Deutschen Region der Internationalen Biometrischen Gesellschaft.
An diesem Buch haben aber nicht nur die Autoren mitgewirkt. Es gibt ein paar Personen, die in stundenlanger Arbeit gelesen, korrigiert, gezeichnet und gemalt haben. Deswegen bitten wir um einen kurzen Applaus für Annett Kaphahn, fürs Schafe zeichnen, Grashalme malen, Grafiken optimieren und für das Aufrechterhalten der allgemeinen guten Laune. Uwe Schöneberg, Lorena Hafermann und Nilufar Akbari fürs Korrektur- und Testlesen bis zum Umfallen mit einer Gründlichkeit, die ihres Gleichen sucht. Uwe Schöneberg wäre auch ein guter Deutschlehrer gewesen und die Autoren haben viel über Kommasetzung gelernt.
Cover
Über die Autoren
Einleitung
Über dieses Buch
Was Sie nicht lesen müssen
Konventionen in diesem Buch
Törichte Annahmen über den Leser
Wie dieses Buch aufgebaut ist
Symbole, die in diesem Buch verwendet werden
Teil I: Medizinische Statistik - Gel(i)ebte Daten
Kapitel 1: Statistik und Medizin – wie passt das zusammen?
Medizinische Statistik, Biostatistik, medizinische Biometrie: Eine Begriffsbestimmung
Wo wird medizinische Statistik gebraucht?
Aufgabenbereiche der medizinischen Statistik
Literatur
Kapitel 2: Besser beraten lassen - Hilfe holen erwünscht
Wo finden Sie biometrische Unterstützung?
Vorbereitung auf einen Beratungstermin
Welche Software brauchen Sie?
Literatur
Teil II: Keine Forschung ohne Fundament - Grundlagen
Kapitel 3: Grundbegriffe und Studientypen
Grundlegende Begriffe empirischer Forschung in der Medizin
Verschiedene Studientypen unterscheiden
Klinische Studie konzipieren - das Studiendesign
Noch einmal in Kürze
Literatur
Kapitel 4: Modelle für die Wirklichkeit
Was sind Wahrscheinlichkeiten?
Modellannahmen, Verteilungen und Schätzung
Merkmale und Verteilungen
Gängige Verteilungsannahmen
Literatur
Teil III: Was Sie unbedingt brauchen - Theorie trifft Praxis
Kapitel 5: Die Kunst der Beschreibung - Deskriptive Statistik
Was ist das eigentlich - deskriptive Statistik?
Wo brauchen Sie deskriptive Statistik?
Merkmale unterscheiden - Skalenniveaus
Methoden der Deskription
Beschreibung kategorieller Merkmale
Beschreibung ordinalskalierter Merkmale
Beschreibung intervall- und verhältnisskalierter Merkmale
Wichtiges hervorheben, Unwichtiges weglassen
Literatur
Kapitel 6: Nachweis durch Kontrolle des Zufalls - Konfirmatorische Statistik
Konfirmatorisch, induktiv, schließend - eine Begriffsbestimmung
Idee des statistischen Tests - der konfirmatorische Umweg
Die sechs Schritte des statistischen Tests
Von der Fragestellung zur Hypothese
Was sagen die Daten? Von den Daten zur Testentscheidung
Interpretation des Testergebnisses - nichts ist bewiesen
Literatur
Kapitel 7: t-Test & Co: Die Klassiker unter den Tests
Statistische Tests zum Vergleich von Erwartungswerten und anderen Lagemaßen
Statistische Tests zum Vergleich von Anteilen und Wahrscheinlichkeiten
Literatur
Kapitel 8: Den Behandlungseffekt quantifizieren - Punktschätzer und Konfidenzintervalle
Quantifizierung des Effekts - der Punktschätzer
Die Größe des Effekts - das Konfidenzintervall
Signifikanz versus Relevanz - nicht zu verwechseln
Punktschätzer und Konfidenzintervalle für verschiedene Datensituationen
Literatur
Kapitel 9: Was sonst noch wichtig ist - Vor und nach dem statistischen Test
Kontrolle des Fehlers 2. Art? Grundprinzip der Fallzahlplanung
Mehr als eine Fragestellung - multiples Testen
Das Ergebnis einer Studie berichten
Literatur
Kapitel 10: Zusammenhänge und Vorhersage – Korrelation und Regression
Wie stark ist die Verbindung - Maße des Zusammenhangs
Regressionsmodelle
Die logistische Regression
Literatur
Teil IV: Blick über den Tellerrand - weiterführende Methoden
Kapitel 11: Wer lebt länger? Analyse von Ereigniszeiten
Was sind Ereigniszeitdaten? Zeiten, Ereignisse und Zensierungen
Schätzung von Ereigniswahrscheinlichkeiten - Kaplan-Meier zeigt, wie es geht
Gruppenvergleich - Überlebensfunktion, Hazards und Hazard Ratios
Logrank-Test und Cox-Regression
Literatur
Kapitel 12: Methoden zur Bewertung der Diagnostik und Übereinstimmung
Diagnostische Studien
Goldstandard und Referenzdiagnostik
Güte von diagnostischen Tests - Sensitivität und Spezifität
Prädiktive Werte und Satz von Bayes
Die ROC-Kurve
Literatur
Kapitel 13: Ausgewählte Methoden epidemiologischer Studien
Verzerrungen vermeiden durch Matching
Löcher in den Daten - Vom Umgang mit fehlenden Werten
Literatur
Kapitel 14: Methodik von systematischen Reviews und Metaanalysen
Systematische Reviews und Metaanalysen in der Medizin
Ablauf von systematischen Reviews und Metaanalysen
Vor- und Nachteile von systematischen Reviews und Metaanalysen
Literatur
Teil V: Der Top-Ten-Teil
Zehn statistische Irrtümer
Irrtum 1: Statistische Tests liefern wertvollere Ergebnisse als deskriptive Datenauswertungen
Irrtum 2: Ein nicht-signifikantes Testergebnis deutet auf die Gültigkeit der Nullhypothese hin
Irrtum 3: Der p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese richtig ist
Irrtum 4: Ein kleiner p-Wert spricht immer für einen großen Effekt
Irrtum 5: Bei Verwendung eines parametrischen Tests müssen die Daten normalverteilt sein
Irrtum 6: Signifikante Ergebnisse sind immer auch klinisch relevant
Irrtum 7: Alle p-Werte unter 5% sind signifikante Ergebnisse
Irrtum 8: Für eine Fallzahlplanung werden nur ein paar Werte in eine Eingabemaske eingegeben
Irrtum 9: Ein multivariates Regressionsmodell dient der Vorhersage einer Zielgröße aus mehreren Einflussgrößen
Irrtum 10: Nur Studien mit signifikanten Ergebnissen sollten publiziert werden
Stichwortverzeichnis
End User License Agreement
Kapitel 2
Tabelle 2.1: Vor- und Nachteile verschiedener statistischer Softwareprogramme.
Kapitel 5
Tabelle 5.2: Tabellarische Datenerfassung.
Tabelle 5.3: Übersicht der verschiedenen Skalenniveaus.
Tabelle 5.4: Codierung eines Datensatzes.
Tabelle 5.6: Kreuztabelle für Bluthochdruck nach Geschlecht.
Tabelle 5.7: Bezeichnungen spezieller Quantile.
Kapitel 6
Tabelle 6.1: Wichtige Begrifflichkeiten eines statistischen Tests.
Tabelle 6.2: Wahrheit und Testentscheidung.
Kapitel 7
Tabelle 7.3: Mittelwerte (Standardabweichungen) der PSA-Werte in ng/ml.
Tabelle 7.4: Mittelwerte (Standardabweichungen) der PSA-Werte.
Tabelle 7.6: BIC in % und zugehörige Ränge von Implantat-Typen A und B.
Tabelle 7.11: Beobachtete und erwartete Häufigkeiten.
Tabelle 7.12: Ansprechhäufigkeiten auf zwei Antipsychotika.
Tabelle 7.13: Beobachtete Häufigkeiten in einer allgemeinen Kreuztabelle.
Tabelle 7.14: Kreuztabelle für die dreiarmige Studie.
Tabelle 7.15: Beobachtete und erwartete Zellhäufigkeiten.
Tabelle 7.16: Allgemeine Kreuztabelle für den McNemar-Test
Tabelle 7.17: Daten der Studie zur Diagnostik des Nasopharynxkarzinoms.
Kapitel 9
Tabelle 9.1: Patientencharakterisika zur Baseline. Intervallskalierte Merkmale werd...
Kapitel 10
Tabelle 10.2: Berechnung der Flächen der Rechtecke.
Tabelle 10.3: Bakterienwachstum über die Zeit.
Tabelle 10.4: Rangvergabe.
Tabelle 10.5: Flächen der Rechtecke für die Ränge.
Tabelle 10.6: Bakterienvermehrung über die Zeit.
Tabelle 10.8: Kreuztabelle zum Rentenalter und Übergewicht.
Tabelle 10.10: Ausgabe des Statistikprogramms.
Kapitel 11
Tabelle 11.1: Auszug aus den Studiendaten.
Kapitel 12
Tabelle 12.1: Vergleich eines Diagnosetests mit dem Goldstandard.
Tabelle 12.3: Geschätzte Sensitivität und Spezifität für verschiedene Schwellenwert...
Kapitel 13
Tabelle 13.1: Beispieldatensatz zum Rechtsherzkatheter.
Tabelle 13.3: Altersgruppe und Geschlecht bei 200 Patienten mit koronarer Herzkrank...
Tabelle 13.4: Propensity Score für den Datensatz zum Rechtsherzkatheter.
Kapitel 14
Tabelle 14.1:
PSA: mittlere Abnahme des PSA-Werts (ng/ml) während sechs Monate The...
Kapitel 1
Abbildung 1.1: Kommunikation ist alles.
Kapitel 2
Abbildung 2.1: Nicht alles, was eine Statistiksoftware ausspuckt, ergibt auch Sinn.
Kapitel 3
Abbildung 3.1: Nur bei einer
repräsentativen Stichprobe
sind Rückschlüsse auf ...
Abbildung 3.2: Zufälliges Ziehen sorgt für eine repräsentative Stichprobe.
Abbildung 3.3: Ein Confounder beeinflusst sowohl die Zielgröße als auch ein anderes...
Abbildung 3.4: Während bei einer explorativen Studie generell nach neuen Forschungs...
Abbildung 3.5: Retrospektive Studien nutzen existierende Datenquellen (links), pros...
Abbildung 3.6: Grundidee von Randomisierung.
Abbildung 3.7: Blockrandomisierung gewährleistet gleiche Gruppengrößen.
Abbildung 3.8: Stratifizierte Randomisierung.
Kapitel 4
Abbildung 4.1: Dichtefunktionen einer diskreten Verteilung für die Anzahl der Mädch...
Abbildung 4.2: Dichte der Normalverteilung für
und
(oben links);
und
(oben ...
Abbildung 4.3: Quantile der Standardnormalverteilung (rot):
-Quantil (links);
-Qu...
Abbildung 4.4: Die Wahrscheinlichkeit, dass eine Familie mit drei Kindern zwei Mädc...
Abbildung 4.5: Dichte der Binomialverteilung für
und
(von links nach rechts).
Abbildung 4.6: Dichte der Studentschen t-Verteilung mit 3 Freiheitsgraden (blau) im...
Abbildung 4.7: Dichtefunktionen der Chiquadrat-Verteilung mit einem Freiheitsgrad (...
Abbildung 4.8: Verschiedene Möglichkeiten für Dichten der Log-Normalverteilung, die...
Abbildung 4.9: Verschiedene Möglichkeiten für Dichten der Exponential-Verteilung, d...
Kapitel 5
Abbildung 5.1: Forscher sollten Theorien immer an Stichproben auf Plausibilität übe...
Abbildung 5.2: Tortendiagramm zum Familienstand von 1000 Befragten.
Abbildung 5.3: Einfaches Balkendiagramm.
Abbildung 5.4: Gruppiertes Balkendiagramm für Männer und Frauen.
Abbildung 5.5: Gestapeltes Balkendiagramm nach Altersgruppen.
Abbildung 5.6: Der Boxplot.
Abbildung 5.7: Verteilungsdichten und zugehörige Boxplots - symmetrische Verteilung...
Abbildung 5.8: Gruppierte Boxplots für das Merkmal Gewicht in kg.
Abbildung 5.9: Geometrische Veranschaulichung der empirischen Varianz und der Stand...
Abbildung 5.10: Das Histogramm am Beispiel der Körpergröße.
Abbildung 5.11: Histogramm für das Merkmal Körpergröße und Veranschaulichung der mi...
Abbildung 5.12: Histogramme für einem Datensatz mit
gemessenen Körpergrößen mit 3...
Abbildung 5.13: Deskriptive Methoden nach Skalenniveau.
Kapitel 6
Abbildung 6.1: Der konfirmatorische Umweg.
Abbildung 6.2: Körpergröße ist relativ zum Maßstab.
Abbildung 6.3: Verteilung der Teststatistik unter
und Ablehnungsbereiche.
Abbildung 6.4: Teststatistik und p-Wert.
Kapitel 7
Abbildung 7.1: Dichte der Standardnormalverteilung (grau) und der t-Verteilung mit ...
Abbildung 7.2: Dichtefunktionen eines normalverteilten Merkmals in zwei Gruppen (bl...
Abbildung 7.3: t-Verteilung mit 168 Freiheitsgraden. Links: kritischer Wert
und z...
Abbildung 7.4: Normalverteilung in zwei Gruppen mit gleichen (links) und unterschie...
Abbildung 7.5: Durch Paarbildung entsteht aus zwei unverbundenen Stichproben (links...
Abbildung 7.6: F-Verteilung mit 2 Zähler- und 94 Nennerfreiheitsgraden. Links: krit...
Abbildung 7.7: Zwei Dichtefunktionen, die sich bei gleichem Erwartungswert in der S...
Abbildung 7.8: U-Verteilung für
. Links: oberer und unterer kritischer Wert
und ...
Abbildung 7.9: Verteilung der Teststatistik W für
Links: oberer und unterer kriti...
Abbildung 7.10: Chiquadrat-Verteilung für einen Freiheitsgrad. Links: kritischer We...
Abbildung 7.11: Chiquadrat-Verteilung für vier Freiheitsgrade. Links: kritischer We...
Abbildung 7.12: Binomialverteilung für
und Trefferwahrscheinlichkeit
. Links: kr...
Kapitel 8
Abbildung 8.1: Konfidenzintervalle können die unbekannte Wahrheit nicht aufdecken.
Abbildung 8.2: Zwanzig 90
-Konfidenzintervalle aus unabhängigen Versuchswiederholun...
Abbildung 8.3: Konfidenzintervalle und Bewertung der Signifikanz und Relevanz des E...
Kapitel 9
Abbildung 9.1: Die Fallzahlplanung erfordert Angaben zu diversen statistischen Größ...
Abbildung 9.2: Verteilung der Teststatistik unter
und
und Wahrscheinlichkeiten ...
Abbildung 9.3: Verteilung der Teststatistik unter
und unter
und Wahrscheinlichk...
Abbildung 9.4: Verteilung der Teststatistik unter
und unter
und Wahrscheinlichk...
Abbildung 9.5: Viele große und kleine p-Werte sagen wenig aus.
Abbildung 9.6: Schematische Darstellung des hierarchischen Testverfahrens...
Kapitel 10
Abbildung 10.1: Das Streudiagramm.
Abbildung 10.2: Die Mittelwerte beider Merkmale teilen das Streudiagramm in Quadran...
Abbildung 10.3: Positiver Zusammenhang (links), kein Zusammenhang (mittig) und nega...
Abbildung 10.4: Die Anzahl der Punkte pro Quadrant liefert noch kein gutes Maß für ...
Abbildung 10.5: Konstruktion der empirischen Kovarianz aus dem Streudiagramm als mi...
Abbildung 10.6: Streudiagramme für keinen Zusammenhang (oben) sowie verschieden sta...
Abbildung 10.7: Streudiagramm für das Geburtsgewicht in Gramm in Abhängigkeit der S...
Abbildung 10.8: Nichtlinearer Zusammenhang zwischen den Merkmalen.
Abbildung 10.9: Scheinkorrelation verursacht durch die Subgruppen der Jahreszeit (l...
Abbildung 10.10: Streudiagramm mit Ausreißer (links) und ohne Ausreißer (rechts). A...
Abbildung 10.11: Bakterienwachstum über die Zeit - das Streudiagramm lässt einen mo...
Abbildung 10.12: Nicht monotoner Zusammenhang zweier Merkmale.
Abbildung 10.13: Datenpunkt
mit eingezeichnetem Residuum
in lila. Der Achsenabs...
Abbildung 10.14: Illustration der Abstandsquadrate (Residuenquadrate). Die »perfekt...
Abbildung 10.15: Residuenplot - Residuen streuen gleichmäßig (links); Residuenvaria...
Abbildung 10.16: Residuenplots zu betrachten, kann sehr romantisch sein.
Abbildung 10.17: Ist die Uhrzeit des Einschlafens eine echte Einflussgröße für Kopf...
Abbildung 10.18: Streudiagramm für den Schwangerschaftsstatus in Abhängigkeit des h...
Abbildung 10.19: Vom logistischen Modell vorhergesagte Wahrscheinlichkeit für eine ...
Abbildung 10.20: Odds und Wahrscheinlichkeit am Beispiel des fairen Würfels.
Kapitel 11
Abbildung 11.1: Darstellung von Ereigniszeitdaten.
Abbildung 11.2: Kaplan-Meier-Kurve (schwarz) als Schätzung für die wahre Überlebens...
Abbildung 11.3: Kaplan-Meier-Kurve für neun Eintagsfliegen, von denen vier vorzeiti...
Abbildung 11.4: Bestimmung des medianen Überlebens aus einer Kaplan-Meie...
Abbildung 11.5: Kaplan-Meier-Kurven für die Prostatektomie-Gruppe (rot) und die Bes...
Abbildung 11.6: Überlebensfunktion (links), zugehörige Hazardfunktionen ...
Kapitel 12
Abbildung 12.1: Krake Paul als Diagnosetest.
Abbildung 12.2: Baumdiagramm zur Herleitung der prädiktiven Werte.
Abbildung 12.3: Baumdiagramm für die diagnostische Studie zu Diabetes.
Abbildung 12.4: Vom quantitativem zum binärem Diagnosetest - der Schwellenwert beei...
Abbildung 12.5: Zusammenhang zwischen Verteilungsdichten der Kranken (blau) und Ges...
Abbildung 12.6: Schrittweise Konstruktion einer ROC-Kurve. Je nach Schwellenwert än...
Kapitel 13
Abbildung 13.1: Sind Fische, die in einem Salzwasseraquarium leben (links), weniger...
Abbildung 13.2: Der linke Käse hat zufällige Löcher, während der Käse rechts zufäll...
Kapitel 14
Abbildung 14.1: Die Evidenz-Pyramide: von der Einzelfalldarstellung (unterste Schic...
Abbildung 14.2: Forest-Plot für das Beispiel der Metaanalyse zur Wirkung von Polyph...
Abbildung 14.3: Wie der Forest-Plot zu seinem Namen kommt.
Abbildung 14.4: Forest-Plot für die Metaanalyse zu Polyphenon E.
Abbildung 14.5: Links: Funnel-Plot zeigt keine Anzeichen für das Vorliegen eines Pu...
Abbildung 14.6: Schwarze Zebras deuten auf einen Publication Bias hin.
Cover
Inhaltsverzeichnis
Fangen Sie an zu lesen
1
2
5
6
7
8
17
18
19
20
21
23
24
25
26
27
28
29
31
32
33
34
35
36
37
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
»Mathe konnte ich noch nie!« So oder so ähnlich reagieren viele, denen wir von unserem Fach erzählen. Mathematik ist nicht gerade beliebt, und Statistik ist sicher nicht das Lieblingsfach von Studierenden der Medizin. Und Viele fragen sich auch, was dieses Fach überhaupt mit Medizin zu tun hat.
Medizinische Statistik ist eine Wissenschaft, die die medizinische Forschung unterstützt. Warum studieren Sie Medizin oder üben einen Gesundheitsberuf aus? Vielleicht wollen Sie Patienten helfen, gesund zu werden, und den Gesunden helfen, es zu bleiben. Dazu braucht es gute praktizierende Ärzte und gute medizinische Forschung. Und genau da brauchen Sie die medizinische Statistik - um aus Forschung gute Forschung zu machen. Leider geht diese schöne Motivation für unser Fach im Alltag manchmal verloren. Sie müssen die Klausur bestehen? Eine Doktorarbeit schreiben? Ein Manuskript in einer angesehenen Zeitschrift veröffentlichen? Sie möchten Ihren Drittmittelantrag bewilligt bekommen? Die Chancen können Sie erhöhen, indem Sie Ihr Forschungsprojekt statistisch valide planen und auswerten. Allerdings sind gute Noten, Publikationen, Impaktfaktoren und eingeworbene Drittmittel in unserem Wissenschaftssystem nicht unbedingt Indikatoren für gute, patientenorientierte Forschung. Halten Sie doch daher einmal inne und überlegen Sie sich, warum Sie forschen. Vielleicht haben Sie jemanden in Ihrem engeren Freundeskreis, der gerade im Krankenhaus liegt? Vielleicht kennen Sie sogar jemanden, der an einer klinischen Studie teilnimmt und sich Hoffnung auf Heilung durch eine neue Therapie macht? Gute medizinische Forschung ist eine Aufgabe mit Verantwortung - sie lässt sich nicht durch Impaktfaktoren messen. Deshalb ist eine angemessene Forschungsmethodik so wichtig und deshalb ist die medizinische Statistik unerlässlich. Sie ist ein Werkzeug, das Sie für gute Forschung brauchen. Die medizinische Statistik hat es sich also verdient, dass Sie ihr etwas echte Aufmerksamkeit schenken - zum Beispiel indem Sie dieses Buch lesen. Dabei werden Sie vermutlich feststellen: So kompliziert ist das ja gar nicht. Im Gegenteil, vieles ist so, wie es einem der gesunde Menschenverstand vorgibt. Und es kommt sogar noch besser: Statistik kann durchaus unterhaltsam, ja sogar lustig sein.
Viele der Beispiele und Anekdoten in diesem Buch haben wir Autoren so oder so ähnlich tatsächlich erlebt. Beim Schreiben haben wir viel gelacht, und wir wünschen uns, dass Sie das beim Lesen auch tun.
Sie stehen gerade in einer Buchhandlung, suchen nach einem statistischen Lehrbuch und fragen sich, ob Sie sich genau dieses Buch zulegen sollen? Ja klar! Auf jeden Fall brauchen Sie kein statistisches Vorwissen, um das Buch, das Sie gerade in den Händen halten, zu verstehen. Dieses Buch ist kein hochtrabendes Fachbuch, das Sie nur verstehen, wenn Sie bereits alle Grundlagen der medizinischen Statistik im Schlaf beherrschen. Dieses Buch vermittelt Ihnen eine große Bandbreite an biometrischen Themen von Grund auf – und zwar mit so wenig Fachbegriffen und so einfach erklärt wie möglich. Das Buch soll Sie außerdem ermächtigen, die Sprache der Statistik besser zu verstehen und somit auch besser mit Statistikern in einer Beratungssituation kommunizieren zu können.
Wir haben uns sehr viel Mühe gegeben, ein möglichst umfassendes Buch über das weite Feld der medizinischen Biometrie und über Teile der Epidemiologie zu schreiben. Leider ist auch hier der Platz begrenzt. Was dieses Buch nicht leisten kann, sind vollständige Kochrezepte für die Nutzung von statistischen Software-Programmen. Wir haben uns bewusst gegen eine Einbettung von Software-Kommandos entschieden. Zum einen veralten Code-Beispiele sehr schnell, und zum anderen werden in der medizinischen Forschung verschiedene Software-Pakete benutzt. Viele Institutionen, die Beratung anbieten, haben Einführungskurse für diese statistischen Programme in ihrem Angebot.
Dieses Buch richtet sich an Studierende der Medizin, der Gesundheitswissenschaften oder verwandter Studienfächer, an praktizierende Ärzte und Forscher sowie an alle Interessierten, die die medizinische Statistik auf eine kurzweilige, aber dennoch präzise Art und Weise vermittelt bekommen wollen. Sie werden mit diesem Buch in kürzester Zeit sehr viele neue Erkenntnisse erlangen. Ihnen werden erleuchtende Einfälle kommen, wie unserem Schaf »Signifikanz-Sissy« auf dem Buchcover. Sissy benutzt dieses Buch als Trittbrett, um leichter über das Signifikanzniveau zu springen. Was unter Signifikanz zu verstehen ist, werden Sie in diesem Buch erfahren. So viel sei bereits an dieser Stelle gesagt: Das Wort wird viel zu häufig an unpassenden Stellen verwendet. Die Lektüre dieses Buches lohnt sich also. Und vielleicht können Sie dann bald bei Ihren Kommilitonen, Kollegen und Freunden glänzen und Ihr Wissen weitergeben. Signifikanz-Sissy gibt es übrigens wirklich! Es ist das Patenschaf unseres Instituts und steht auf dem Kinderbauernhof »Knirpsenfarm« in Berlin.
Dieses Buch ist so geschrieben, dass Sie es als Nachschlagewerk nutzen und bei einem beliebigen, Sie besonders interessierenden Kapitel, starten können. Es lohnt sich aber immer, auch einen Blick in die benachbarten Kapitel zu werfen, um einen etwas breiteren Überblick zu bekommen.
Wenn Sie viele Kapitel dieses Buchs lesen oder gar so viel Freude an der medizinischen Statistik (gefunden) haben, dass Sie das Buch von der ersten bis zur letzten Seite lesen, kann Ihnen die eine oder andere Begriffsdefinition bereits bekannt vorkommen. Dies machen wir nicht, weil wir denken, dass Sie alles schon wieder vergessen haben! Das Buch ist absichtlich modular geschrieben, sodass Sie fast jedes Kapitel separat lesen und verstehen können - damit alles in guten Portionen leicht zu verdauen ist. Sollten Sie dennoch an einem Thema mal länger zu beißen haben - nehmen Sie es nicht so schwer! Sie müssen ja nicht von heute auf morgen zum Statistiker werden. Auch könnte es sein, dass Sie sich als Leserin nicht immer direkt angesprochen fühlen, wenn Sie von Medizinern, Statistikern und Forschern lesen. Wir meinen aber immer jegliche Geschlechter - das mit dem konsequenten Gendern macht einfach die Lesbarkeit schwierig. Und zu guter Letzt: Wenn Sie mal medizinische Statistik, mal Biometrie oder mal Biostatistik lesen – wir meinen immer das Gleiche.
Sie wollen mehr über medizinische Statistik erfahren - aus eigenem Antrieb oder vielleicht gar, weil Ihr Studium oder Ihre Arbeit Sie »dazu zwingt«? Wir setzen keinerlei Vorkenntnisse voraus und erklären alles von Grund auf mit möglichst verständlichen Worten. Vielleicht stehen Sie kurz vor einer Biometrie-Prüfung oder vor der Abgabe Ihrer Doktorarbeit und merken, dass das Fach eher weiter unten auf Ihrer Prioritätenliste rangiert? Oder Sie sind praktizierender Arzt und hinterfragen die methodische Vorgehensweise in einer medizinischen Publikation? Vielleicht haben Sie beruflich auch gar nichts mit Medizin zu tun und überlegen, an einer klinischen Studie teilzunehmen, und es interessiert Sie daher, wie so eine Studie wissenschaftlich eigentlich aufgebaut ist? Egal aus welcher Motivation heraus Sie dieses Buch lesen, es soll Ihnen als verständliches und umfassendes Nachschlagewerk dienen. Unser Ziel ist es nicht, einen fertig ausgebildeten Biometriker aus Ihnen zu machen. Wir wollen vielmehr die Freude an der medizinischen Statistik in Ihnen wecken, Ihnen grundlegende Aspekte verständlich und manchmal mit einem Augenzwinkern näherbringen. Wir hoffen, dass Sie nach der Lektüre medizinische Publikationen mit anderen Augen lesen und entdecken, wieso die medizinische Statistik so wichtig für gute klinische Forschung ist.
Dieses Buch besteht aus vier Teilen. Im ersten Teil lernen Sie, was die medizinische Statistik ist, wo Sie mit ihr in Berührung kommen und wo Sie sich Hilfe suchen können, wenn Sie mehr lernen wollen, als in diesem Buch steht. Die anderen drei Teile behandeln die Begriffe und die zugrunde liegende Theorie der medizinischen Statistik. Der zweite und der dritte Teil widmen sich hauptsächlich den Grundlagen, während Sie im vierten Teil eine Fülle von etwas komplexeren, anwendungsrelevanten Themen präsentiert bekommen.
Was ist überhaupt medizinische Statistik und wo laufen Sie ihr über den Weg? Und warum müssen Sie sich als Mediziner mit Statistik befassen? Was hat medizinische Forschung mit Statistik zu tun? Wo erhalten Sie Hilfe, wenn Sie nicht nur dieses Buch lesen wollen, sondern einen Ansprechpartner brauchen? All dies erfahren Sie im ersten Teil des Buchs.
In diesem Teil lernen Sie grundlegende Begriffe der medizinischen Forschung kennen sowie die mathematischen Grundlagen, die den statistischen Methoden zugrunde liegen. Was ist eigentlich eine Studie? Warum brauchen Sie dafür Statistik? Wie ist eine Studie aufgebaut? Welche Fehlerquellen gibt es? In diesem Teil erfahren Sie, wie Sie für Ihr Forschungsprojekt ein solides Fundament planen und es so zum Erfolg führen können.
Welche statistischen Methoden sollten Sie unbedingt beherrschen? Wenn Sie lernen wollen, wie Sie Ihre Daten aussagekräftig beschreiben können, welche statistischen Tests infrage kommen und wie Sie Zusammenhänge passend darstellen können, sind Sie im dritten Teil richtig.
Wenn Sie die grundlegenden Methoden schon kennen und nun sehen wollen, was die medizinische Statistik sonst noch so zu bieten hat, dann sind Sie in diesem Teil genau richtig aufgehoben. Von der Analyse von Ereigniszeiten über diagnostische Gütemaße bis hin zu Metaanalysen lernen Sie so einiges kennen. Das Lesen lohnt sich.
Neben den Teilen und Kapiteln helfen Ihnen auch sechs Symbole, sich in diesem Buch zurechtzufinden und wichtige Aspekte hervorzuheben.
Hinweise, Tipps und Tricks, die Ihnen Ihr Leben mit der medizinischen Statistik vereinfachen, sind durch dieses Symbol gekennzeichnet.
Vieles ist einfacher zu verstehen, wenn die Begriffe erst einmal eindeutig definiert sind. Definitionen sind durch diese Lupe gekennzeichnet. Neu eingeführte Begriffe können Sie so schnell erkennen.
Die Hinweise und Warnungen neben diesem Symbol sollten Sie genau lesen. Hier weisen wir auf typische Fehler hin, die Sie meist relativ einfach vermeiden können.
Zum besseren Verständnis haben wir viele illustrierende Beispiele in das Buch aufgenommen - viele davon sind den »wahren« Erfahrungen des einen oder anderen Biostatistikers nachempfunden. Vielleicht finden Sie Parallelen zu Ihrem eigenen Forschungsprojekt in einem der Beispiele wieder, sodass Ihnen die Anwendung der statistischen Methoden anschließend noch leichterfällt.
In einer grau unterlegten Box mit diesem Symbol finden Sie mathematische Hintergründe und technisches Zusatzwissen. Dieses Wissen benötigen Sie nicht, um den übrigen Text im Buch zu verstehen. Sie können diesen daher auch überspringen. Wir freuen uns natürlich, wenn Sie den Text dennoch lesen und so Ihren eigenen mathematischen Horizont erweitern.
Es ist leichter, sich Dinge zu merken, die »merkwürdig« sind. In einer grau unterlegten Box mit diesem Symbol finden Sie kleine illustrative und teilweise wahre Geschichten, die manchmal zum Schmunzeln anregen. Wenn Sie es eilig haben, brauchen Sie diese Texte aber nicht zu lesen.
Grundsätzlich gilt - Text, der in einer grauen Box steht, können Sie ohne Bedenken überspringen, ohne dass Ihnen wichtiges Wissen für das Verständnis der folgenden Seiten fehlt. Nun aber viel Freude beim Nachschlagen, Schmökern und bei einleuchtenden Erkenntnisgewinnen!
Teil I
IN DIESEM TEIL …
lernen Sie, was Statistik eigentlich mit Medizin zu tun hat,erfahren Sie, warum Sie als Mediziner Statistik können sollten,zeigen wir Ihnen, was genau Sie wissen müssen und wo Sie biometrische Unterstützung bekommen,bekommen Sie Tipps, welche Software für Sie hilfreich ist.Kapitel 1
IN DIESEM KAPITEL
Was ist medizinische Statistik?
Wo wird sie gebraucht?
Aufgabenbereiche der medizinschen Statistik
Medizinische Statistik« - was ist das eigentlich? Was hat Statistik mit Medizin zu tun? Warum haben alle größeren Universitätskliniken und die meisten größeren Pharmaunternehmen eigene Statistik-Abteilungen oder Institute? Als Leser dieses Buchs sind Sie vermutlich angehender Mediziner. Sie haben sich also entschieden, als praktizierender Arzt oder forschender Grundlagenmediziner arbeiten zu wollen. Patienten helfen - dies ist das oberste Ziel der Medizin. Mathematische Sachverhalte oder Statistik interessieren dabei eigentlich nicht, oder? Der medizinische Fortschritt lebt von Forschung, seien es Zellexperimente im Labor, Tierversuche oder Studien an Patienten. Die medizinische Forschung beruht dabei auf dem Prinzip, neue Substanzen oder Therapien systematisch auszuprobieren - es werden Experimente durchgeführt. Eine klinische Studie ist genau das - ein Experiment an Patienten. Wie aber muss ein Experiment angelegt sein, damit es aussagekräftige Ergebnisse liefert? Wie oft müssen Sie den Versuch wiederholen? Was sind geeignete Vergleichsgruppen? Welche Merkmale werden verglichen? Wie können Sie zufällige von systematischen Effekten unterscheiden? Für all diese Fragen brauchen Sie Statistik. Nun gibt es Statistik natürlich nicht nur in der Medizin, sondern zum Beispiel auch in der Wirtschaft, im Versicherungswesen, im Marketing und in vielen weiteren Bereichen. Gibt es wirklich unterschiedliche Arten von Statistik? Braucht es den Zusatz »medizinische Statistik«? Tatsächlich sind die mathematischen Grundlagen der Statistik in allen Anwendungsbereichen dieselben. Allerdings haben die verschiedenen Fächer unterschiedliche Zielsetzungen und Forderungen an die Statistik. Dadurch kommen in den verschiedenen Disziplinen unterschiedliche statistische Methoden zum Einsatz, und es haben sich auch verschiedene Empfehlungen und Leitlinien etabliert. Sie können also gerne ein allgemeines Buch über Statistik lesen und werden dabei viel lernen. Die spezifischen Anforderungen statistischer Methoden in der Medizin finden Sie dort aber vermutlich nicht. Aber das macht nichts - Sie haben ja jetzt dieses Buch in der Hand.
Dieses Buch trägt im Titel die Bezeichnung medizinische Statistik. Sie haben bereits erfahren, dass es durchaus sinnvoll ist, Statistik in der Medizin als einen eigenen Bereich in der Statistik anzusehen. Allerdings gibt es noch andere Bezeichnungen dafür. Im Deutschen ist der Begriff medizinische Biometrie gebräuchlich.
In dem Wort Biometrie stecken die altgriechischen Wörter »bíos«, zu Deutsch »Leben« und »métron« für »Maß«. Es geht also um die Lehre der Messung, Erfassung und Auswertung in den Lebenswissenschaften.
Die Lebenswissenschaften umfassen die Medizin, aber auch Biologie und Landwirtschaft. Daher sollten Sie den Zusatz medizinische Biometrie verwenden, wenn Sie von Statistik in der Medizin sprechen. Im Englischen gibt es zwar das entsprechende Wort »medical biometry«, weitaus gebräuchlicher ist aber der Begriff »biostatistics«. Der deutsche Begriff Biostatistik wird daher häufig als Synonym für medizinische Statistik oder medizinische Biometrie verwendet. Streng genommen ist dieser Begriff aber weniger aussagekräftig, da er sich wieder auf die gesamten Lebenswissenschaften und nicht nur auf die Medizin bezieht. Für Sie ist es erst einmal nur wichtig, dass Sie alle Begrifflichkeiten schon mal gehört haben und als Synonyme verwenden können.
Medizinische Statistik wird in der medizinischen Forschung gebraucht. Damit finden Sie medizinische Statistik überall da, wo medizinische Forschung stattfindet - nämlich
an Universitätskliniken und anderen Forschungseinrichtungen ((Fach-)Hochschulen, Bundesinstitute …) und
in pharmazeutischen Unternehmen und Auftragsforschungsunternehmen.
Tatsächlich hat fast jedes Universitätsklinikum ein eigenes Institut für medizinische Statistik. Oft sind diese Institute zusätzlich auch fächerübergreifend für die Bereiche medizinische Informatik und Epidemiologie zuständig. In großen pharmazeutischen Unternehmen gibt es meist eigene Statistik-Abteilungen. Kleinere Unternehmen kaufen sich die statistische Expertise oft als Dienstleistung ein.
Die medizinische Statistik hat ihre Daseinsberechtigung in der medizinischen Forschung. Damit ist die medizinische Statistik eine Hilfswissenschaft - medizinische Statistik hat keinen Selbstzweck. Auch wenn die medizinische Statistik eine Hilfswissenschaft ist, so sind Biostatistiker weit mehr als »Datendienstleister«. Biostatistiker sorgen nicht nur dafür, dass die statistischen Methoden korrekt angewandt werden, sondern entwickeln auch neue Methoden. Da Biostatistiker immer an der Schnittstelle zur Medizin arbeiten, müssen sie außerdem den forschenden Medizinern die verwendeten Methoden vermitteln können.
Die Aufgaben von medizinischen Statistikern gliedern sich daher in folgende Bereiche:
Anwendung statistischer Methoden
in Planung, Auswertung und Interpretation medizinischer Forschungsprojekte,
Vermittlung und Kommunikation
statistischer Sachverhalte an medizinische Anwender und
Optimierung und Entwicklung
neuer statistischer Methoden für eine effizientere, aussagekräftigere medizinische Forschung.
Diese drei Hauptaufgabenbereiche sind dabei nicht streng getrennt. So kann eine spezielle Studiensituation die Entwicklung neuer Methoden erfordern. Welche Methoden für ein Forschungsprojekt angewendet oder entwickelt werden müssen, kann wiederum nur im engen Austausch zwischen Statistikern und Medizinern herausgefunden werden.
Es gibt eine Vielzahl statistischer Methoden für die unterschiedlichsten Datensituationen. Meistens gibt es sogar für ein und dieselbe Datensituation mehrere Herangehensweisen. Die Anwendung existierender Methoden ist daher kein Selbstläufer. Gute Biostatistiker müssen viele Methoden und ihre Vor- und Nachteile kennen. Sie müssen außerdem wissen, wo und wie sie sich schnell über neuere Methoden informieren können, denn die medizinische Statistik entwickelt sich stetig weiter. Zwar gibt es Verfahren, wie zum Beispiel den t-Test, die seit Jahrzehnten etabliert sind und nichts an ihrer Aktualität eingebüßt haben. Aber auch lang etablierte Methoden können irgendwann durch wesentlich effizientere Verfahren abgelöst werden.
Nicht nur die medizinische Statistik entwickelt sich weiter. Auch die medizinische Forschung muss sich ständig neuen Herausforderungen stellen. So liefert etwa das zunehmend digitalisierte Gesundheitssystem immer neue Datenquellen für die Forschung. Diese Daten enthalten allerdings oft viele Fehlwerte und Verzerrungsquellen. Daraus resultiert der Bedarf an statistischen Methoden, solche Verzerrungen aufzudecken und damit adäquat umzugehen. Der begrüßenswerte Trend hin zur personalisierten Medizin erfordert, dass Patienten in immer spezifischere Subgruppen eingeteilt werden - es werden also statistische Methoden für kleine Fallzahlen erforderlich. Auch der angewandte Statistiker muss sich daher methodisch immer weiterbilden. Falsch angewandte statistische Methoden können im schlimmsten Fall dazu führen, dass die Ergebnisse fehlinterpretiert werden - mit negativen Konsequenzen für die Patienten und die Gesellschaft. Medizinische Statistiker haben hier also eine große Verantwortung zu tragen.
Mathematiker gelten oft als »Nerds«. Sie sitzen in dunklen Räumen vor Computerbildschirmen oder brüten den ganzen Tag über Formeln. Biostatistiker sind anders! Der Erfolg eines Biostatistikers hängt maßgeblich von seinen kommunikativen Fähigkeiten ab, wie Zapf et al. (2019) darlegen. Ein Statistiker, der jede Formel kennt, aber diese nicht vermitteln kann, hilft der medizinische Forschung nicht. Der medizinische Statistiker hat die Aufgabe, die Methoden so vereinfacht und dennoch richtig zu kommunizieren, dass der forschende Mediziner diese verstehen kann. Für Biostatistiker, die an Universitätskliniken angestellt sind, ist eine zentrale Form der Kommunikation die studentische Lehre. Aber auch klassische statistische Beratungsgespräche im kleinen Kreis erfordern diese kommunikativen Fähigkeiten.
Forschende Mediziner sind keine Statistiker und müssen es auch nicht werden. Der medizinische Statistiker ist kein Mediziner und muss es ebenfalls nicht werden. Damit sich beide Spezies miteinander unterhalten können, müssen einige Regeln beachtet werden. Viele Mediziner haben eine gewisse Scheu vor statistischen Inhalten. Nicht selten kommen Studierende mit einer gewissen Angst in statistische Vorlesungen oder in eine statistische Beratung. Aber vergessen Sie nicht: Der Statistiker hat Ihnen zwar bezüglich der Formeln etwas voraus, aber er kennt die medizinischen Zusammenhänge weit weniger gut als Sie. Mediziner und Statistiker müssen sich also auf ein gemeinsames Niveau begeben, wie Abbildung 1.1 zeigt. Nicht selten haben junge, angehende Biostatistiker deshalb in einer Beratungssituation ebenfalls Angst - nämlich davor, die medizinischen Inhalte nicht zu verstehen.
Da die medizinische Statistik eine Hilfswissenschaft ist, werden Statistiker leider manchmal zu Hilfswissenschaftlern degradiert - als Datendienstleister. Viele Biostatistiker sind aber selbst Forscher. Statistische Methodenforschung ist oft sehr anspruchsvoll, denn dabei geht es tatsächlich um Mathematik. Nicht alle Biostatistiker betreiben methodische Forschung, und das muss auch nicht sein. Aber die medizinische Statistik entwickelt sich weiter durch die Biostatistiker, die nicht nur Methoden anwenden, sondern auch welche entwickeln. Biostatistiker und medizinische Forscher sollten sich daher unbedingt auf Augenhöhe begegnen!
Abbildung 1.1: Kommunikation ist alles.
Zapf, A., Huebner, M., Rauch, G., Kieser, M. (2019). What Makes a Biostatistician?
Statistics in Medicine
38(4): 695–701.
Kapitel 2
IN DIESEM KAPITEL
Wo finde ich biometrische Beratung?
Wie kann eine Beratung helfen?
Ein Überblick über statistische Software
In diesem Kapitel erfahren Sie mehr über das Thema »biometrische Beratung«, wo Sie eine biometrische Beratung finden können, wie Ihnen dort geholfen werden kann und was Sie mitbringen können, um den maximalen Nutzen aus der Beratung zu ziehen. Wir haben Ihnen eine subjektive Auswahl an beratenden Instituten zusammengefasst, um Ihnen eine Orientierung zu geben. Wir bieten Ihnen auch einen kleinen Wegweiser durch das Buch, wenn es Ihnen nur um Fragen rund um die Beratung geht. Wo in diesem Buch finden Sie Informationen zu üblichen Fragen, die Statistiker Ihnen im Rahmen eines Beratungsgesprächs stellen könnten? Abgeschlossen wird dieses Kapitel mit einer kurzen Vorstellung gängiger statistischer Software, die Sie für die Auswertung Ihrer Daten nutzen können.
Sie haben ein wissenschaftliches Projekt vor sich, arbeiten an Ihrer Doktorarbeit oder sind mitten in einem Experiment? Abhängig von Ihrer Erfahrung haben Sie vielleicht schon die eine oder andere Datenauswertung gemacht oder aber Sie sind ganz neu in dem Feld der biometrischen Auswertung. Egal, ob Sie einen Ethikantrag oder einen Tierschutzantrag einreichen möchten, ob Sie einen Drittmittelantrag vorbereiten oder ob Sie sich schon in der Phase der Auswertung eines Projekts befinden - eine biometrische Beratung kann Ihnen dabei helfen. Die gute Nachricht ist: In der DACH-Region (Deutschland, Österreich und Schweiz) gibt es eine Vielzahl an Angeboten für biometrische Unterstützung. Das Beratungsangebot ist bezüglich der Organisation und der Leistungen teilweise sehr heterogen, Sie finden aber an fast jeder Universitätsklinik einen Ansprechpartner. Viele städtische Kliniken haben Kooperationsverträge mit Universitätskliniken abgeschlossen, sodass auch dort die Möglichkeit einer Beratung gegeben ist. Häufig ist die (Erst-)Beratung kostenlos! Biometriker sind dazu ausgebildet, forschende Mediziner zu unterstützen, und helfen gerne!
Eine Suche im Internet mit den Suchbegriffen »biometrische Beratung« oder »statistische Beratung« und dem jeweiligen Namen der Universität liefert meist den entsprechenden Ansprechpartner. Wir haben im Folgenden eine nicht repräsentative Liste von Beratungsangeboten in der DACH-Region für Sie zusammengestellt (geografisch sortiert). Die Kontaktaufnahme erfolgt meist über eine webbasierte Anmeldemaske oder per E-Mail. Viele Standorte haben auch eine »Statistikambulanz«, eingerichtet, bei der Ratsuchende an einem bestimmten Tag der Woche ohne Voranmeldung eine statistische Beratung bekommen können. Aus Erfahrung empfiehlt es sich aber, gerade bei komplexeren Forschungsvorhaben, dem Beratenden vor der Beratung schon einige Informationen zu dem Projekt zukommen zu lassen und ihm ein wenig Zeit zu geben, sich in die medizinische und daraus ergebende biometrische Fragestellung einzudenken.
Eine (nicht vollständige!) Auswahl an Instituten, die in Deutschland, Österreich und Schweiz (DACH-Region) biometrische Beratung anbieten:
Das Institut für Medizinische Biometrie und Epidemiologie am Universitätsklinikum Hamburg-Eppendorf (https://www.uke.de/kliniken-institute/institute/medizinische-biometrie-und-epidemiologie/wir-bieten-an/beratung.html)Das Institut für Biometrie und Klinische Epidemiologie der Charité – Universitätsmedizin Berlin (https://biometrie.charite.de/service_unit_biometrie/kostenloses_beratungsangebot/)Das Statistisches Beratungszentrum an der Technischen Universität Dortmund (https://www.statistik.tu-dortmund.de/beratung.html)Das Institut für Medizinische Biometrie und Informatik am Uniklinikum Heidelberg (https://www.klinikum.uni-heidelberg.de/medizinische-biometrie/biometrische-beratung/)Das Institut für Medizinische Biometrie und Statistik an der Albert-Ludwigs-Universität Freiburg (https://www.imbi.uni-freiburg.de/studien_beratung/statBeratung/studien_beratung/)Das Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie der Ludwig-Maximilians-Universität München (https://www.ibe.med.uni-muenchen.de/services/promotionsberatung/)Die Methodenberatung der Universität Zürich (https://www.methodenberatung.uzh.ch/de.html)Das Institut für Klinische Biometrie an der Medizinischen Universität Wien (https://cemsiis.meduniwien.ac.at/kb/services/statistische-beratung/)Auf geht's! Melden Sie sich zu einer biometrischen Beratung in Ihrer Nähe an und bringen Sie Ihr Projekt weiter auf dem Weg zu einer erfolgreichen Dissertation, Publikation oder einem Drittmittelantrag. Eine Beratung kann hierbei nur nützlich sein!
Nehmen Sie rechtzeitig Kontakt zu einer beratenden Institution auf und bedenken Sie, dass der Berater nicht gleich im ersten Gespräch die Fallzahl für Ihre Studie nennen oder den Drittmittelantrag guten Gewissens unterschreiben kann. Der Berater muss sich dazu erst einarbeiten und wird Rückfragen an Sie haben. Meist sind mehrere Beratungstermine erforderlich.
Sie haben einen statistischen Beratungstermin an der entsprechenden Institution Ihrer Hochschule vereinbart? Sie fragen sich jetzt, wie Sie sich für den Beratungstermin vorbereiten können? Dabei hilft Ihnen unsere Checkliste.
Checkliste zur Vorbereitung auf einen statistischen Beratungstermin:
Wenn mehrere Personen an dem Forschungsprojekt beteiligt sind, so ist es meist sinnvoll, auch zusammen zu dem statistischen Beratungstermin zu gehen. Viele Missverständnisse entstehen durch »Flüsterpost-Effekte«: Der Berater gibt Hinweise, der Ratsuchende gibt diese mündlich an andere Projektpartner weiter, etwa an den Doktorvater oder die Doktormutter, kann aber nicht alles inhaltlich korrekt wiedergeben. Der Projektpartner schreibt die verfälschten Ratschläge im Projektantrag nieder und verzerrt durch die Formulierung wieder etwas den eigentlichen Wortlaut des Ratschlags. Am Ende enthält das Schriftstück gravierende statistische Mängel, obwohl ein Rat eingeholt wurde. Dies kann verhindert werden, indem alle Projektpartner mit dem Statistiker sprechen und indem der Statistiker alle schriftlichen Dokumente vor der offiziellen Verwendung noch einmal überprüft.
Sie sollten Ihre medizinische(n) Forschungsfrage(n) (jeweils) in einer konkreten mit »Ja« oder »Nein« beantwortbaren Frage formulieren können. Es hilft, wenn Sie die Forschungsfragen schriftlich niederschreiben. Oft wird dann erst ersichtlich, was vielleicht noch nicht konkret genug ist. Näheres zur Formulierung der Fragestellung erfahren Sie in
Kapitel 6
.
Sie können die Zielgrößen Ihrer Studie, also den primären Endpunkt und die relevanten sekundären Endpunkte, klar benennen. Überlegen Sie sich, in welcher physikalischen Einheit die Zielgrößen gemessen werden und mit welchen Erhebungsinstrumenten diese gemessen werden. In
Kapitel 3
erfahren Sie alles rund um das Thema »Endpunkte«.
Sie kennen die relevante Literatur zu Ihrem Forschungsthema. Die zwei bis drei wichtigsten Literaturquellen können Sie in die Beratung mitbringen.
Sofern Ihre Daten schon vorliegen, sollte die Datentabelle geeignet formatiert sein, um für gängige Statistiksoftware einlesbar zu sein. Denken Sie daran, dass der Biometriker zu keiner Zeit Einsicht in personenidentifizierende Daten haben darf. Die Namen der Patienten sollten daher in der Tabelle nicht erscheinen. Wie Sie Ihre Daten am besten formatieren, erfahren Sie in
Kapitel 5
.
Machen Sie sich erste Gedanken, welche Software Sie für die Auswertung der Daten verwenden möchten. Einen Überblick über verschiedene Software-Lösungen finden Sie am Ende dieses Kapitels.
Sie haben das Gefühl, eigentlich nicht so richtig »was zu wissen«? Das ist kein Problem! In eine statistische Beratung können Sie auch dann gehen, wenn Sie fast kein statistisches Vorwissen haben. Besser ist es natürlich, wenn Sie selbst schon einmal anfangen, sich zu belesen, zum Beispiel mit diesem Buch!
Es gibt eine breite Palette an statistischen Software-Lösungen für die medizinische Forschung. Diese Programme haben unterschiedliche Vor- und Nachteile, die wir Ihnen im Folgenden aufzeigen. Viele der Programme kosten Lizenzgebühren, die im Preis sehr unterschiedlich sind. An vielen Universitätskliniken gibt es allerdings auch zentral nutzbare Lizenzen für solche Programme. Oft werden auch Lizenzen für die gesamte Universität abgeschlossen, sodass keine weiteren Kosten für den Endnutzer entstehen.
Das Statistikprogramm SPSS (https://www.ibm.com/de-de/analytics/spss-statistics-software), offizieller Name IBM SPSS Statistics, ist in der Medizin weit verbreitet. Ursprünglich kommt es aus den Sozialwissenschaften, was auch der Name »Statistical Package for the Social Sciences« (SPSS) nahelegt. SPSS orientiert sich in der Programmführung an Microsoft Excel. Das erleichtert den Einstieg in SPSS. Es gibt einen Reiter für die Datenansicht, der ähnlich aufgebaut ist wie ein Excel-Arbeitsblatt. Zusätzlich gibt es einen weiteren Reiter für die Variablenansicht, in dem Sie die Eigenschaften jeder Variablen definieren können. SPSS hat eine einfach bedienbare Benutzeroberfläche - Sie brauchen keine Programmiersprache zu können, um SPSS zu bedienen. Das birgt allerdings auch Gefahren. Durch ein paar einfache »Klicks«, gelangen Sie zu Ergebnissen. Das Programm spuckt auch dann etwas aus, wenn Sie die falschen Methoden auf die Daten anwenden. Kurz: Es ist einfach, sich eine Menge Mist zusammenzuklicken, wie in Abbildung 2.1 dargestellt. Wenn Sie möchten, können Sie auch ohne die Benutzeroberfläche Ihre Kommandos direkt in SPSS programmieren. Das ist zwar mehr Programmieraufwand, erfordert aber auch mehr Nachdenken über die angewandte Methodik. Eine weitere Möglichkeit ist, die durch Klicks entstandenen Befehle in einer Syntax-Datei abzuspeichern. Damit können Sie auch »zusammengeklickte« Methoden nachvollziehbar speichern.
Abbildung 2.1: Nicht alles, was eine Statistiksoftware ausspuckt, ergibt auch Sinn.
Die Methoden, die Sie mit SPSS anwenden, sollten Sie immer inhaltlich verstanden haben. Eine Software berechnet auch unsinnige Dinge, wenn Sie nicht die richtigen Befehle eingeben. Das gilt grundsätzlich für jede Software - durch die Nutzung grafischer Benutzeroberflächen ist die Versuchung besonders groß, den Kopf »auszuschalten«.
Fast alle gängigen statistischen Methoden stehen in SPSS zur Verfügung. Die Betonung liegt hier auf gängig. Wenn Sie komplexere Methoden anwenden wollen oder aber sehr aktuelle, neue Methoden nutzen möchten, ohne selbst Kommandos zu programmieren, dann müssen Sie auf andere Programme zurückgreifen. Es gibt eine große Fülle von Einführungsliteratur in SPSS - zum Beispiel von Brosius (2017) und Faik (2018) aus der »Dummie«-Serie.
Sie haben eine medizinische Fragestellung, die komplexe biometrische Verfahren benötigt? Wollen Sie etwa maschinelle Lernverfahren nutzen? Oder haben Sie in einer Veröffentlichung von einer neuen biometrischen Methode gelesen und wollen diese auch auf Ihre Daten anwenden? In diesem Fall können Sie die statistische Programmiersprache R (https://www.r-project.org/) nutzen. Da es sich bei R um eine konsolenbasierte Programmiersprache handelt, empfiehlt es sich, zusätzlich ein Bearbeitungsprogramm (Editor) zu nutzen, das Ihnen die Anwendung erleichtert. Wir empfehlen Ihnen hier RStudio (https://www.rstudio.com/). Beide Programme, R und RStudio, haben den entscheidenden Vorteil, dass sie kostenfrei erhältlich sind. Jeder Nutzer von R kann selbst neue Software-Komponenten entwickeln (sogenannte »Pakete«) und diese anderen Nutzern frei zur Verfügung stellen. Wenn Sie noch keine Programmiererfahrung haben, so ist die Nutzung von R jedoch am Anfang schwierig und bedarf einer gewissen Einarbeitungszeit. Diese Zeit lohnt sich jedoch, da mit R fast alles möglich ist. Es gibt im Internet (zum Beispiel bei YouTube) viele sehr gute Tutorien, die einen Einstieg in R ermöglichen und natürlich auch zahlreiche Bücher, zum Beispiel das von De Vries und Meys (2015) aus der »Dummie«-Serie. Auch gibt es an fast jeder Universität R-Kurse für Programmieranfänger. Grundsätzlich sollten Sie sich die Frage stellen, ob Sie in Ihrer zukünftigen Forscherkarriere immer wieder Datenanalysen selbst durchführen wollen. In diesem Fall lohnt und empfiehlt sich die Einarbeitung in R unbedingt. Wenn Sie nur für die Doktorarbeit eine Auswertung brauchen und danach ohnehin als niedergelassener Arzt arbeiten wollen, ist SPSS einfacher und völlig ausreichend.
Die Software R ist kostenlos und ein Alleskönner. Allerdings ist gerade die Tatsache, dass die Software kostenlos ist und sich ständig weiterentwickelt, auch ein Nachteil - die riesige Vielzahl an ständig wachsenden Programm-Paketen ist nämlich schwer zu validieren. Gerade für klinische Studien der Pharmaindustrie ist die Validierung der genutzten Software aber eine zentrale Notwendigkeit. Viele Firmen greifen deshalb auf kostenpflichtige und validierte Software zurück. Am weitesten verbreitet sind hier SAS (www.sas.com) und STATA (www.stata.com). STATA hat ebenfalls eine einfach bedienbare Benutzeroberfläche und die Möglichkeit, direkt über eine Konsole zu programmieren. Mit diesen Programmen werden Sie als Mediziner vermutlich aber eher selten in Berührung kommen. Wenn Sie dennoch an einer Einführung in die Programme interessiert sind, dann schauen Sie doch mal in die Bücher von Krämer et al. (2018), Kohler und Kreuter (2016) und Field (2013).
Tabelle 2.1 zeigt Ihnen im Überblick Vor- und Nachteile der verschiedenen Softwareprogramme.
Programm
Kostenfrei
Grafische Benutzeroberfläche
Validiert(für die Industrie)
Methoden-vielfalt
SPSS
R
SAS
STATA
Tabelle 2.1: Vor- und Nachteile verschiedener statistischer Softwareprogramme.
Brosius, F. (2017). SPSS 24 für Dummies. John Wiley & Sons.
De Vries, A., Meys, J. (2017). R für Dummies. John Wiley & Sons.
Faik, J. (2018). Statistik mit SPSS Alles in einem Band für Dummies. John Wiley & Sons.
Field, A. (2013). Discovering statistics using IBM SPSS statistics. Sage.
Kohler, U., Kreuter, F. (2016). Datenanalyse mit Stata: allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. Walter de Gruyter GmbH & Co KG.
Krämer, W., Schoffer, O., Tschiersch, L., Gerß, J. (2018). Datenanalyse mit SAS
®
: Statistische Verfahren und ihre grafischen Aspekte. Springer Gabler.
Teil II
IN DIESEM TEIL …
lernen Sie, was Sie brauchen, um endlich los zu forschen,erfahren Sie, welche Arten von Studien es gibt,zeigen wir Ihnen, was ein Studiendesign ist und wie Sie sich eins »schneidern« können,lernen Sie die wichtigsten Grundbegriffe der medizinischen Forschung kennen,legen wir ein paar mathematische Grundlagen fest,lernen Sie was ein statistisches Modell ist, was Verteilungen sind und natürlich, wie diese Konzepte helfen, Ihr Forschungsprojekt auf sichere Füße zu stellen.Kapitel 3
IN DIESEM KAPITEL
Stichprobe und Grundgesamtheit
Endpunkte und Einflussfaktoren
Konfirmatorisch versus explorativ
Studiendesigns und Studientypen
Ziel medizinischer Forschung ist eine verbesserte Patientenversorgung. Die medizinische Forschung hat in den letzten Jahrzehnten enorme Fortschritte gemacht, und vieles wurde bereits detailliert erforscht. Dennoch bleiben sehr viele medizinische Fragestellungen unbeantwortet, zum Beispiel im Bereich der seltenen Erkrankungen oder der Onkologie. In Zukunft werden sicher noch viele neue Fragen dazukommen. In der Medizin werden ständig Antworten auf offene Forschungsfragen generiert. Damit diese Forschungsergebnisse auch tatsächlich die richtige Antwort auf die Forschungsfrage liefern, ist eine sorgfältige Planung einer Studie vor deren eigentlichem Beginn sehr wichtig.
Denken Sie mal kurz an Ihren nächsten Urlaub. Wenn Sie nur einen knapp bemessenen zeitlichen und finanziellen Rahmen dafür haben, sollten Sie sich vorab folgende Fragen stellen: »Wohin möchte ich reisen?« »Wie komme ich dort hin?« »Was möchte ich dort machen?« All diese Fragen erlauben es Ihnen zu präzisieren, wie ein Urlaub sein muss, damit Sie ihn als gelungen empfinden. Viele Urlaubsanbieter bieten Suchmaschinen im Internet an - mit einer geeigneten Stichwortsuche kommen Sie Ihrem Traumziel so schnell näher. Ähnlich verhält es sich auch mit der empirischen Forschung in der Medizin - Sie sollten eine Studie gründlich planen und dafür die notwendigen Stichwörter kennen. In diesem Kapitel stellen wir Ihnen die grundlegenden Begriffe für empirische Studien in der Medizin vor. Sie lernen verschiedene Studientypen kennen und werden mit unterschiedlichen Studiendesigns vertraut gemacht.
Empirische Forschung in der Medizin beschreibt das systematische Erforschen von medizinischen Themen mittels beobachteter Zusammenhänge anhand erhobener Daten, um letztlich relevante Aussagen für die medizinische Praxis treffen zu können. Sie brauchen also Daten! Woher kommen die eigentlich?