24,99 €
Ihr praktischer Einstieg in die Statistik
Statistik ist nicht immer ganz einfach, aber sehr nützlich. Der Schlüssel zum Erfolg heißt: erst verstehen und dann üben, üben, üben. Deborah Rumsey erklärt Ihnen die notwendigen Grundbegriffe und erläutert die wichtigsten statistischen Konzepte. Dabei kommt sie fast ohne Formeln aus und schafft einen Bezug zwischen Theorie und Praxis. Sie lernen die verschiedenen grafischen Darstellungsmöglichkeiten von statistischem Material kennen und erfahren, wie Sie Ihre Ergebnisse richtig auswerten. Mit Übungen zu allen Themengebieten können Sie dann das erlernte Wissen festigen.
Sie erfahren
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 971
Statistik Lehr- und Übungsbuch für Dummies
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
1. Auflage 2024
© 2024 Wiley-VCH GmbH, Boschstraße 12, 69469 Weinheim, Germany
Original English language edition Statistics for Dummies © 2015 and Statistics Workbook for Dummies © 2005 by Wiley Publishing, Inc. All rights reserved including the right of reproduction in whole or in part in any form. This translation published by arrangement with John Wiley and Sons, Inc.
Copyright der englischsprachigen Originalausgabe Statistics for Dummies © 2015 und Statistics Workbook for Dummies © 2005 by Wiley Publishing, Inc. Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form. Diese Übersetzung wird mit Genehmigung von John Wiley and Sons, Inc. publiziert.
Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.
Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.
Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.
Coverfoto: peshkova — stock.adobe.comKorrektur: Claudia Lötschert
Print ISBN: 978-3-527-72174-0ePub ISBN: 978-3-527-84688-7
Deborah Rumsey erwarb einen Doktortitel in Statistik an der Ohio State University (1993). Nach ihrer Promotion wechselte sie zum Department of Statistics der Kansas State University, wo sie den renommierten Presidential Teaching Award gewann. Im Jahr 2000 kehrte sie an die Ohio State University zurück und ist heute Mitglied des Department of Statistics. Dr. Rumsey war Mitglied des Statistics Education Executive Committee der American Statistical Association und Lektorin der Teaching-Bits-Rubrik des Journal of Statistics Education.
Sie ist Autorin weiterer Bücher wie Statistik II für Dummies und Wahrscheinlichkeitsrechnung für Dummies (auch erschienen bei Wiley-VCH). Außerdem hat sie zahlreiche Aufsätze zur Statistik-Ausbildung veröffentlicht und viele einschlägige Vorträge gehalten. Ihre Forschungsinteressen liegen auf der Lehrplanentwicklung, der Weiterbildung und Unterstützung von Lehrern und auf immersiven Lernumgebungen. Ihre anderen Leidenschaften sind ihre Familie, das Angeln, die Beobachtung von Vögeln, das Fahren eines neuen Kubota-Traktors auf dem »Familienbauernhof« und Ohio State Buckeye Football (nicht unbedingt in dieser Reihenfolge).
Jürgen Faik studierte Volkswirtschaftslehre und Soziologie in Frankfurt am Main und promovierte ebenda; außerdem habilitierte er sich an der Universität Vechta. Er war Vertretungsprofessor an der Fachhochschule Darmstadt sowie Lehrbeauftragter an verschiedenen Universitäten beziehungsweise Hochschulen in Deutschland. Zurzeit lehrt er als Lehrkraft für besondere Aufgaben an der Hochschule Mainz vornehmlich Wirtschaftsmathematik und Statistik. Er ist Autor von Schnellkurs Volkswirtschaftslehre, Schnellkurs Wirtschaftsmathematik, Statistik für Wirtschafts- und Sozialwissenschaftler und von Statistik mit SPSS: Alles in einem Band für Dummies (inzwischen in der zweiten Auflage). Darüber hinaus fungierte er als Herausgeber (und Autor) von Mathematik für Wirtschaftswissenschaftler für Dummies.
Cover
Titelblatt
Impressum
Über die Autorin
Über den Überarbeiter
Inhaltsverzeichnis
Einleitung
Über dieses Buch
Konventionen in diesem Buch
Törichte Annahmen über die Leser
Wie dieses Buch aufgebaut ist
Die Symbole in diesem Buch
Wie geht es weiter?
Teil I: Mit Statistik den Alltag bewältigen
Kapitel 1: Statistik kurz und knapp
Statistiken verstehen und nutzen
Verteilungen bestimmen
Glaubwürdige Schlussfolgerungen ziehen
Übungsaufgaben
Kapitel 2: Fehler in Statistiken
Die Kontrolle übernehmen: so viele Zahlen und so wenig Zeit
Fehler, Übertreibungen und schlichte Lügen
Die Bedeutung irreführender Statistiken
Übungsaufgaben
Kapitel 3: Das Handwerkszeug des Statistikers
Statistik: mehr als nur Zahlen
Grundbegriffe der Statistik
Übungsaufgaben
Teil II: Zahlenknacken leicht gemacht
Kapitel 4: Grafiken und Diagramme
Statistik grafisch darstellen
Ein Stück vom Kuchen abbekommen
Säulendiagramme im Einsatz
Statistiken mithilfe von Tabellen darstellen
Das Liniendiagramm
Daten mit einem Histogramm veranschaulichen
Übungsaufgaben
Kapitel 5: Von Durchschnitten und Medianen
Daten mit statistischen Größen beschreiben
Qualitative Daten beschreiben
Quantitative Daten beschreiben
Übungsaufgaben
Teil III: Gewinnchancen realistisch einschätzen
Kapitel 6: Wie stehen die Chancen? Einführung in die Wahrscheinlichkeitsrechnung
Risiken basierend auf Wahrscheinlichkeiten eingehen
Grundlagen der Wahrscheinlichkeitsrechnung
Interpretation von Wahrscheinlichkeiten
Fehleinschätzungen vermeiden
Die Verbindung zwischen Wahrscheinlichkeitsrechnung und anderer Statistik
Übungsaufgaben
Kapitel 7: Auf Gewinn spielen
Warum Casinos Gewinne machen
Hilfreiche Kenntnisse
Übungsaufgaben
Teil IV: Mit Wahrscheinlichkeitsmodellen komplizierte Fragen schnell beantworten
Kapitel 8: Zufallsvariablen und die Binomialverteilung
Allgemeines zu Zufallsvariablen
Binomialverteilte Zufallsvariablen als Verteilungsmodell für diskrete Zufallsvariablen
Übungsaufgaben
Kapitel 9: Die Normalverteilung
Die Grundlagen der Normalverteilung
Die Standardnormalverteilung oder Z-Verteilung
Wahrscheinlichkeiten für eine Normalverteilung (mithilfe der Z-Verteilung) ermitteln
Approximation der Binomialverteilung durch die Normalverteilung
Übungsaufgaben
Kapitel 10: Die t-Verteilung
Vergleich der t-Verteilung mit der Standardnormalverteilung
Zur Variabilität der »t«-Verteilung
Mit der »t«-Tabelle arbeiten
Übungsaufgaben
Kapitel 11: Stichprobenverteilungen und der zentrale Grenzwertsatz
Definition einer Stichprobenverteilung
Der Mittelwert einer Stichprobenverteilung
Den Standardfehler messen und seine Eigenschaften
Die Form einer Stichprobenverteilung
Wahrscheinlichkeiten für den Stichprobenmittelwert ermitteln
Die Stichprobenverteilung von Stichprobenverhältnissen
Wahrscheinlichkeiten für das Stichprobenverhältnis ermitteln
Übungsaufgaben
Kapitel 12: Die Fehlergrenze berücksichtigen
Die Bedeutung des Vorzeichens
Die Fehlergrenze berechnen
Den Einfluss der Stichprobengröße ermitteln
Die Fehlergrenze beschränken
Übungsaufgaben
Teil V: Wichtige Dinge schätzen
Kapitel 13: Interpretation und Bewertung von Konfidenzintervallen
Statistiken mit Parametern in Verbindung bringen
Den bestmöglichen Schätzwert abgeben
Ergebnisse auf einem bestimmten Konfidenzniveau interpretieren
Irreführende Konfidenzintervalle ausfindig machen
Übungsaufgaben
Kapitel 14: Konkrete Konfidenzintervalle berechnen
Ein Konfidenzintervall berechnen
Die Wahl des Konfidenzniveaus
Zur Breite des Konfidenzintervalls
Die Stichprobengröße näher betrachtet
Die Streuung in der Grundgesamtheit
Übungsaufgaben
Kapitel 15: Häufig genutzte Konfidenzintervalle
Konfidenzintervall für den Mittelwert der Grundgesamtheit
Konfidenzintervall für den Anteil in der Grundgesamtheit
Konfidenzintervall für die Differenz zwischen zwei Mittelwerten
Konfidenzintervall für die Differenz zwischen zwei Anteilen in Grundgesamtheiten
Konfidenzintervalle richtig interpretieren (sodass auch Ihr Lehrer zufrieden ist)
Das Ergebnis eines Konfidenzintervalls auswerten: Was die Formeln nicht verraten
Übungsaufgaben
Teil VI: Mit Testen das kritische Denken fördern
Kapitel 16: Behauptungen, Tests und Schlussfolgerungen
Möglichkeiten, mit Behauptungen umzugehen
Einen Hypothesentest durchführen
Typische Fehler beim Hypothesentesten
Schritt für Schritt durch den Hypothesentest
Übungsaufgaben
Kapitel 17: Formeln und Beispiele für häufig genutzte Hypothesentests
Hypothesentest für den Mittelwert der Grundgesamtheit
Hypothesentest für den Anteil in der Grundgesamtheit
Hypothesentest für den Vergleich von zwei Mittelwerten
Hypothesentest für gepaarte Mittelwertdifferenzen
Vergleich der Anteile in zwei (unabhängigen) Grundgesamtheiten
Übungsaufgaben
Teil VII: Statistische Studien richtig ausschöpfen
Kapitel 18: Umfragen, Umfragen und noch mehr Umfragen
Den Einfluss von Meinungsumfragen erkennen
Hinter den Kulissen von Meinungsumfragen
Übungsaufgaben
Kapitel 19: Experimente: medizinischer Durchbruch oder irreführendes Ergebnis?
Experimente und Beobachtungsstudien
Gute Experimente planen und umsetzen
Experimente sachkundig beurteilen
Übungsaufgaben
Kapitel 20: Die Suche nach dem Zusammenhang: Korrelationen und andere Assoziationen
Beziehungen mit Plots und Diagrammen bildlich darstellen
Quantifizierung der Beziehung oder Korrelationen und andere Maße
Mit Wahrscheinlichkeiten Zusammenhänge fundieren
Assoziationen, Korrelationen und Kausalzusammenhänge
Übungsaufgaben
Kapitel 21: Qualitätskontrolle oder: Was Statistik mit Zahnpasta zu tun hat
Erwartungen erfüllen
Die Qualität aus der Zahnpastatube herausquetschen
Übungsaufgaben
Teil VIII: Der Top-Ten-Teil
Kapitel 22: Zehn Kriterien für eine gute Umfrage
Die Zielpopulation sollte klar definiert sein
Die Stichprobe sollte die Zielpopulation abbilden
Die Stichprobe sollte zufällig ausgewählt sein
Die Stichprobe sollte groß genug sein
Mit Anreizen Verweigerung minimieren
Eine angemessene Art von Umfrage wählen
Keine Suggestivfragen verwenden
Der Zeitpunkt sollte gut gewählt sein
Die Personen, die die Umfrage durchführen, sollten gut ausgebildet sein
Die Umfrage sollte die ursprüngliche Fragestellung beantworten
Kapitel 23: Zehn häufige Fehler
Irreführende Grafiken
Verzerrte Daten
Keine Fehlergrenze
Keine Zufallsstichproben
Stichprobengröße verschweigen
Falsch interpretierte Korrelationen
Störvariablen
Gepfuschte Zahlen
Selektive Darstellung von Ergebnissen
Die allmächtige Anekdote
Kapitel 24: Lösungen zu den Übungsaufgaben
Lösungen zu Kapitel 1
Lösungen zu Kapitel 2
Lösungen zu Kapitel 3
Lösungen zu Kapitel 4
Lösungen zu Kapitel 5
Lösungen zu Kapitel 6
Lösungen zu Kapitel 7
Lösungen zu Kapitel 8
Lösungen zu Kapitel 9
Lösungen zu Kapitel 10
Lösungen zu Kapitel 11
Lösungen zu Kapitel 12
Lösungen zu Kapitel 13
Lösungen zu Kapitel 14
Lösungen zu Kapitel 15
Lösungen zu Kapitel 16
Lösungen zu Kapitel 17
Lösungen zu Kapitel 18
Lösungen zu Kapitel 19
Lösungen zu Kapitel 20
Lösungen zu Kapitel 21
Anhang: Tabellen
Die t-Tabelle
Die Z-Tabelle
Die Binomialverteilungstabelle
Abbildungsverzeichnis
Stichwortverzeichnis
End User License Agreement
Kapitel 2
Abbildung 2.1: Diagramm zur Veranschaulichung der Häufigkeit, mit der jede einzel...
Abbildung 2.2: Das Balkendiagramm zeigt die prozentuale Häufigkeit, mit der jede ...
Kapitel 3
Abbildung 3.1: Die Normalverteilung
Kapitel 4
Abbildung 4.1: Ein Beispiel für ein Kreisdiagramm
Abbildung 4.2: Ausgaben privater Haushalte
Abbildung 4.3: Kreisdiagramm der Befragung nach dem Autobesitz
Abbildung 4.4: Kreisdiagramm der Lieblingsgenres von Kinogängern
Abbildung 4.5: Reduzierung der Umfrageergebnisse auf zwei Kategorien
Abbildung 4.6: Ein Kreis- und ein Balkendiagramm im Vergleich
Abbildung 4.7: Das Säulendiagramm zeigt die Ergebnisse einer Befragung von Kinogä...
Abbildung 4.8: Ein Beispiel für ein sortiertes Balkendiagramm
Abbildung 4.9: Veränderung der Interessen von Studenten während des Semesters
Abbildung 4.10: Darstellung der prozentualen Veränderung
Abbildung 4.11: Veränderung der Ergebnisse in Prozentpunkten
Abbildung 4.12: Liniendiagramm der Teilnehmerzahl beim Marathon
Abbildung 4.13: Übertriebene Skalierung der y-Achse
Abbildung 4.14: Liniendiagramm der prozentualen Veränderung
Abbildung 4.15: Stabdiagramm der prozentualen Anteilswerte der 30 Finisherzeiten
Abbildung 4.16: Histogramm der Finisherzeiten. Zusätzlich wird hier noch einmal a...
Abbildung 4.18: Typische Verteilungsformen in Histogrammen
Abbildung 4.17: Darstellung von drei Verteilungsformen der Daten durch Histogramm...
Abbildung 4.19: Krabbeldistanzen eines Babys
Kapitel 5
Abbildung 5.1: Beispiele für rechtsschiefe, linksschiefe und symmetrische Daten
Abbildung 5.2: Zur Anwendung der k-σ-Regel auf ein glockenförmiges ...
Kapitel 6
Abbildung 6.1: Die Flugrichtungen von Eddy Elfers Elfmetern
Kapitel 7
Abbildung 7.1: Gewinnklassen und Gewinnwahrscheinlichkeiten bei einer Spielvarian...
Kapitel 9
Abbildung 9.1: Drei Normalverteilungen mit Erwartungswerten und Standardabweichun...
Abbildung 9.2: Die Z-Verteilung hat einen Erwartungswert von 0 und eine Standarda...
Abbildung 9.3: Die Verteilung der Fischlängen in einem Teich
Abbildung 9.4: Standardisierung der Zahlen einer Normalverteilung (X) in Zahlen d...
Abbildung 9.5: Die an ihrer Länge gemessenen unteren 10 % der Fische in dem Teich
Kapitel 10
Abbildung 10.1: Vergleich der Standardnormalverteilung (Z-Verteilung) mit einer t...
Abbildung 10.2: t-Verteilungen für verschiedene Stichprobenumfänge...
Kapitel 11
Abbildung 11.1: Verteilungen von a) Einzelwürfen eines Würfels und b) Durchschnit...
Abbildung 11.2: Verteilungen der Zeiten von 1 Person, 10 Personen und 50 Personen
Abbildung 11.3: Verteilungen der Fischlängen a) in Teich 1, b) in Teich 2
Abbildung 11.4: Populationsprozentsätze für Antworten auf die Mathehilfe-Frage
Abbildung 11.5: Stichprobenverteilung des Anteils der Studenten, die die Frage na...
Kapitel 16
Abbildung 16.1: Prüfgrößen und die Entscheidungen, die Sie auf ihrer Basis treffe...
Kapitel 20
Abbildung 20.1: Streudiagramm für die Häufigkeit des Grillenzirpens im Verhältnis...
Abbildung 20.2: Kundenzufriedenheit vor und nach der Schulung
Abbildung 20.3: Kundenzufriedenheit in Kreisdiagrammen dargestellt
Abbildung 20.4: Streudiagramme für verschiedene Korrelationen
Kapitel 21
Abbildung 21.1: Qualitätsregelkarte für die Füllung von Bonbontüten
Abbildung 21.2: Verteilung der Zahnpastatubengewichte
Abbildung 21.3: Verteilung der Stichprobenmittel bei Stichproben von jeweils zehn...
Abbildung 21.4: Kontrollgrenzen für Stichprobenmittel von Stichproben mit jeweils...
Abbildung 21.5: Zahnpastatuben-Füllprozesse, die außer Kontrolle geraten sind
Kapitel 23
Abbildung 23.1: Vier Grundtypen von Grafiken
Cover
Titelblatt
Impressum
Über die Autorin
Inhaltsverzeichnis
Einleitung
Fangen Sie an zu lesen
Abbildungsverzeichnis
Stichwortverzeichnis
End User License Agreement
1
2
3
4
7
8
9
23
24
25
26
27
28
29
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
Mit diesem Buch halten Sie ein leicht verständliches Lehr- und Übungsbuch auf dem Gebiet der Statistik in Händen. Wenn Sie dieses Buch (zumindest teilweise) durchgearbeitet haben, haben Sie das nötige Rüstzeug auf den Weg mitbekommen, um die große Menge an alltäglichen statistischen Informationen
zu verarbeiten,
auszuwerten,
zu interpretieren und
als Fundament zu nutzen, um darauf aufbauend eigene Entscheidungen zu treffen.
Nach der Lektüre dieses Buchs werden Sie also Diagramme, Tabellen, die Darstellung von Umfrageergebnissen oder Experimenten sowie die Befunde wissenschaftlicher Studien sachkundig beurteilen können. Vor allem werden Sie dabei in der Lage sein, bewusste oder unbewusste Manipulationen bei entsprechenden Ergebnispräsentationen zu erkennen.
Damit die Lektüre dieses Buchs Ihnen Spaß bereitet, ist es in einem eher lockeren Stil verfasst worden, und die inhaltlichen Ausführungen wurden durch zahlreiche (Alltags-)Beispiele unterfüttert. Sie finden in diesem Zusammenhang in diesem Buch Beispiele von medizinischen Durchbrüchen über Kriminalstudien und Bevölkerungstrends bis zu Umfragen zum Internet-Dating, zur Benutzung von Mobiltelefonen und zu den schlechtesten Autos des Jahrhunderts. Auf diese Weise werden Sie in die Lage versetzt, zu erkennen, dass Statistik kein Selbstzweck ist, sondern Ihnen auch stets bei Ihrer Entscheidungsfindung – selbst bei Ihren Alltagsentscheidungen – hilft.
Vielleicht bereiten Sie sich aber auch gerade auf eine Prüfung oder Abschlussklausur in Statistik vor und wollen in erster Linie nur üben, üben und vor allem üben. Wenn das so ist, dann haben Sie Glück, denn Sie halten gerade genau das richtige Buch in der Hand, da sich am Ende jedes Kapitels eine Vielzahl von Übungsaufgaben befindet. Kleine Tipps und Tricks sollen Ihnen dabei helfen, Aufgabenstellungen richtig zu verstehen und schnell und effizient zu bearbeiten. Dabei beschränkt sich das Buch auf die wichtigsten Konzepte und legt entsprechend einen klaren Schwerpunkt auf Übungsaufgaben, wie sie typischerweise auch in Prüfungen und Klausuren gestellt werden. Wenn Sie die Aufgaben in diesem Buch beherrschen und den Kern der Fragestellungen verstanden haben, sollten Sie in einer Prüfung oder Klausur keine bösen Überraschungen erleben.
Während traditionelle statistische Lehrbücher mitunter doch etwas mathematisch-dröge daherkommen, wird Ihnen hier Statistik etwas anders präsentiert, und zwar:
in Form vieler interessanter Beispiele aus der Praxis
über leicht verständliche Darstellungen der grundlegenden statistischen Methoden (ohne langatmige, komplizierte Formelherleitungen)
anhand eingängiger Schritt-für-Schritt-Anleitungen zu den einzelnen Methoden, Formeln und dergleichen
mithilfe klar nachvollziehbarer Interpretationshilfen bei den einzelnen statistischen Konzepten – insbesondere um Fehlinterpretationen und damit auch falsche Schlussfolgerungen zu vermeiden (beziehungsweise auch um irreführende statistische Darlegungen in Publikationen zu erkennen)
um bei Ihnen den Drang, fundierte eigene statistische Analysen durchzuführen, durch die Art der Themenpräsentationen im vorliegenden Buch zu erzeugen beziehungsweise zu verstärken
mittels einer ganzen Menge an prüfungsrelevanten Aufgaben
In diesem Buch werden zwei Konventionen verwendet, mit denen Sie sich vertraut machen sollten:
Definition der Stichprobengröße (
n
):
Wenn ich mich auf die Stichprobengröße beziehe, meine ich in der Regel die Anzahl der Personen, die als Teilnehmer an einer Umfrage, einer Studie oder einem Experiment ausgewählt wurden. (Die übliche Schreibweise für die Stichprobengröße ist
n
.) Angenommen, es wären 100 Personen als Teilnehmer für eine Umfrage ausgewählt worden, und nur 80 Personen hätten an der Umfrage tatsächlich teilgenommen. Wie groß wäre dann
n
: 100 oder 80? Nach meiner Konvention 80. Ich verwende die Anzahl der Personen, die tatsächlich teilgenommen haben beziehungsweise von denen es Rückläufer gibt. Diese Zahl fällt in der Regel kleiner aus als die Anzahl der Personen, die um eine Teilnahme gebeten wurden. Wenn Sie also auf die Formulierung »Stichprobengröße« stoßen, wissen Sie, dass es sich um die Anzahl der Personen handelt, die an der Studie auch tatsächlich teilgenommen und Daten bereitgestellt haben.
Doppelbedeutung des Begriffs »Statistik«:
Der Begriff »Statistik« umfasst sowohl den Forschungsgegenstand als auch statistische Studien. Wenn es um einzelne Kennwerte geht, wie zum Beispiel den (arithmetischen) Mittelwert, verwende ich den Begriff »statistische Größe«.
Um dieses Buch ordentlich durcharbeiten und die Inhalte gut verstehen zu können, müssen Sie, liebe Leserinnen und Leser, gar nicht so viel Vorwissen mitbringen. Sie benötigen im Grunde genommen lediglich ein gewisses mathematisches Grundverständnis. Das heißt, dass Sie eigentlich nur die grundlegenden mathematischen Operationen (wie die Grundrechenarten: also ein bisschen Addieren, Subtrahieren, Multiplizieren und Dividieren) beherrschen müssen (oder gut mit Ihrem Taschenrechner umgehen können). Außerdem sollten Ihnen die grundlegenden Notationsweisen der Mathematik, wie zum Beispiel übliche Variablenbezeichnungen in der Form X oder Y beziehungsweise auch Summen-, Wurzelzeichen oder Ähnliches, zumindest ansatzweise bekannt beziehungsweise nicht zuwider sein. Sollten Sie an dieser Stelle noch gewisse Defizite haben, schauen Sie doch einfach mal in ein grundlegendes Mathe-Buch rein (es gibt da übrigens ganz hervorragende Dummies-Mathe-Bücher …).
Sie müssen nicht im Entferntesten mit Angst an die Lektüre dieses Buchs herangehen: Sie werden nämlich jeweils ganz langsam und sorgfältig durch die einzelnen Berechnungsschritte bei den verschiedenen statistischen Methoden geführt. Außerdem werden viele Beispiele und Aufgaben für Sie bereitgestellt, anhand derer Sie sich mit den gerade gefragten Berechnungen vertraut machen können. Schließlich ist es in der Statistik besonders wichtig, dass Sie sich die verschiedenen Verfahren durch »Learning by Doing« erschließen; das bringt zumindest einen höheren Mehrwert, als wenn Sie sich theoretisch-abstrakt mit den diversen Formeln und statistischen Ansätzen beschäftigen würden.
Sicherlich werden Sie schnell erkennen, dass weniger mathematische Fachkenntnisse zum Verständnis der Buchinhalte von Relevanz sind, sondern vielmehr die Fähigkeit, sich mit (scheinbaren) statistischen Rätseln durch logische Überlegungen auseinanderzusetzen. Üblicherweise hilft hierzu der berühmte »gesunde Menschenverstand« weiter, etwa wenn Sie – um ein kleines Beispiel zu geben – vor dem Problem stehen, ob im Rahmen der Wahrscheinlichkeitsrechnung das Eintreten eines bestimmten Ereignisses (wie beispielsweise der Diebstahl eines Autos) vom vorherigen Eintreten eines anderen Ereignisses oder mehrerer anderer Ereignisse (hier etwa, ob ein Auto über Nacht in einer Garage oder am Straßenrand abgestellt wurde) abhängen kann oder eher nicht.
Dieses Buch bietet sich vor allem für Studierende, aber durchaus auch für wissenschaftliche Mitarbeiter und dergleichen an Hochschulen (Universitäten, Fachhochschulen, Berufsakademien) oder in (Politik-)Beratungs- und Forschungsinstitutionen an. Darüber hinaus ist es aber auch für Praktiker geeignet. Schließlich werden wir alle tagtäglich mit vielfältigen Statistiken in Form von (absoluten) Zahlen, Prozentwerten, Diagrammen, Grafiken, »statistisch signifikanten« Ergebnissen, »wissenschaftlichen« Studien, Umfragen, Experimenten und so weiter konfrontiert. Alle genannten Personenkreise sollen durch dieses Buch mit den für Ihre Tätigkeiten wichtigen statistischen Zusatzkenntnissen ausgestattet werden.
Gerade durch die zahlreichen Übungsaufgaben (und deren ausführliche Lösungen) werden Sie sehr gut auf eine eventuell anstehende Statistik-Prüfung vorbereitet. Sie werden sehen, dass mit zunehmender Übung Ihr Interesse an Statistik wachsen wird! (Falls das ausnahmsweise nicht der Fall sein wird, sind Sie dann immerhin ordentlich in Bezug auf die Bearbeitung statistischer Fragestellungen in Ihrer beruflichen oder studentischen Praxis vorbereitet, was ja karrierefördernd sein kann.)
Dieses Buch ist in sieben Hauptteile gegliedert, die die Hauptthemen des Buchs ausführlich beschreiben, und in einen achten Teil, der als Kurzreferenz dient. Jeder Teil ist in einzelne Kapitel untergliedert, in denen die Themen in verständlichen Happen dargeboten werden.
Dieser Teil macht Sie mit der Quantität und der Qualität von Statistiken vertraut, denen Sie tagtäglich an Ihrem Arbeitsplatz und auch anderswo begegnen. Sie werden feststellen, dass ein Großteil der statistischen Daten durch Zufall oder aber aufgrund von Designfehlern inkorrekt ist. Sie bewegen sich außerdem einen ersten Schritt in Richtung Statistik-Genie, indem Sie die Werkzeuge der Branche kennenlernen und einen Überblick über Statistik im Sinne der Beschäftigung mit dem Sammeln und Interpretieren von Daten entwickeln. Außerdem lernen Sie schon mal ein paar Ausdrücke aus dem Statistik-Jargon.
Dieser Teil macht Sie vertraut mit der Darstellung von Daten, also mit Diagrammen, Tabellen und so weiter. Sie erhalten außerdem Tipps zur Interpretation der Diagramme und erfahren, woran Sie ein irreführendes Diagramm unmittelbar erkennen können. Sie lernen außerdem, wie Sie Daten mittels weitverbreiteter statistischer Methoden zusammenfassen.
Dieser Teil deckt die Grundlagen der Wahrscheinlichkeitsrechnung ab. Sie erfahren, wie die Wahrscheinlichkeitsrechnung eingesetzt wird, was Sie darüber wissen müssen und worauf Sie sich beim Glücksspiel einlassen. Und was können Sie daraus lernen? Dass Wahrscheinlichkeit und Intuition nicht immer übereinstimmen.
Das Kapitel zeigt, wie Wahrscheinlichkeiten Ihren Alltag beeinflussen, und Sie lernen die Grundregeln der Wahrscheinlichkeitsrechnung kennen. Sie erfahren außerdem die Wahrheit über Glücksspiele, also wie Spielcasinos funktionieren und warum die Bank immer davon ausgehen kann, dass sie auf die Dauer gewinnt.
In diesem Teil geht es um Verteilungen: Sie lernen die Binomialverteilung, die Normalverteilung und die t-Verteilung kennen sowie den zentralen Grenzwertsatz und Stichprobenverteilungen. Außerdem erfahren Sie, was eine Fehlergrenze ist.
Dieser Teil konzentriert sich darauf, wie Sie gute Schätzungen für einen Bevölkerungsdurchschnitt oder einen Anteil an der Bevölkerung abgeben können, wenn Sie die Population selbst nicht kennen (zum Beispiel die durchschnittliche Stundenanzahl, die Erwachsene pro Woche vor dem Fernseher verbringen, oder der Prozentsatz der Bundesbürger, die mindestens einen Autoaufkleber auf dem Auto haben). Sie erfahren außerdem, wie Sie einen guten Schätzwert anhand einer relativ kleinen Stichprobe (gemessen an der Gesamtbevölkerung) finden können. Sie erhalten einen Überblick über Konfidenzintervalle, finden heraus, wofür sie eingesetzt werden, verstehen, wie sie gebildet werden, und erfahren auch noch die Wahrheit über die Grundelemente des Konfidenzintervalls (ein Schätzwert plus beziehungsweise minus einer Fehlergrenze). Sie beschäftigen sich außerdem mit den Faktoren, die die Größe eines Konfidenzintervalls beeinflussen (wie zum Beispiel die Stichprobengröße), und erkunden Formeln, schrittweise Berechnungen und Beispiele für diejenigen Konfidenzintervalle, die in der Praxis am häufigsten eingesetzt werden.
In diesem Teil geht es um den Entscheidungsfindungsprozess und die große Rolle, die Statistik dabei spielt. Es wird gezeigt, wie Wissenschaftler ihre Thesen bilden und testen und wie Sie die Ergebnisse auswerten können, um sicherzugehen, dass die statistischen Daten korrekt sind und glaubwürdige Schlussfolgerungen zulassen. Sie gehen außerdem die einzelnen Berechnungsschritte durch, die üblicherweise eingesetzt werden, um Hypothesen zu testen und die Ergebnisse korrekt zu interpretieren.
Dieser Teil bietet Ihnen einen Überblick über Umfragen, Experimente, Verhaltensbeobachtungen und den Prozess der Qualitätskontrolle. Sie erfahren, wozu Studien dienen, wie sie durchgeführt werden, wo ihre Beschränkungen liegen und wie man sie so auswertet, dass die Ergebnisse überzeugend wirken. Daneben werden in diesem Teil auch noch bivariate Zusammenhänge, also die Zusammenhänge zwischen zwei Variablen, mittels der Methoden der Assoziations-/Korrelationsrechnung und der Regressionsanalyse näher behandelt.
Diese Schnellübersicht vermittelt Ihnen zehn Kriterien für gute Umfragen und zehn Möglichkeiten, die Wissenschaftler, Medien beziehungsweise Öffentlichkeit einsetzen, um Statistiken zu missbrauchen.
Im Anhang finden Sie drei ganz wichtige Tabellen: die t-Verteilung, die Z-Verteilung und die Binomialverteilung.
Außerdem enthält das vorliegende Buch die Lösungen zu allen Übungsaufgaben der einzelnen Kapitel. Der Lösungsteil wurde bewusst an das Ende des Buchs gestellt, damit Sie bei der Beantwortung der einzelnen Übungsaufgaben eines Kapitels nicht zum schnellen »Spicken« bei den ansonsten nur ein paar Seiten hinter den Aufgaben stehenden Lösungen verleitet werden und sich somit besser (»ehrlicher«) auf eine Prüfung vorbereiten können.
In diesem Buch werden Symbole verwendet, um Ihre Aufmerksamkeit auf bestimmte Dinge zu lenken, die regelmäßig vorkommen:
Dieses Symbol kennzeichnet hilfreiche Informationen, Konzepte und Abkürzungen, mit denen Sie Zeit sparen können. Es werden außerdem Alternativen zu bestimmten Konzepten hervorgehoben.
Dieses Symbol ist für besonders wichtige Konzepte reserviert, die Sie sich hoffentlich noch lange merken, nachdem Sie dieses Buch gelesen haben.
Dieses Symbol bezieht sich auf spezielle Möglichkeiten, die Wissenschaftler oder die Medien nutzen, um Sie mit Statistiken irrezuführen, und Sie erfahren, was Sie dagegen tun können.
Dieses Symbol ist ein sicherer Tipp, wenn Sie spezielle Interessen an den eher technischen Aspekten der Statistik haben. Sie können dieses Symbol übergehen, falls Sie nicht tiefer in die Details einsteigen möchten.
Dieses Symbol kennzeichnet Beispiele, die der näheren Erläuterung des Stoffs dienen – über die zahlreichen Übungsaufgaben dieses Buchs hinaus.
Viele (Statistik-)Lehrbücher sind so geschrieben, dass Sie sich von der ersten bis zur letzten Seite durchquälen und dabei auch einige eher nicht so interessante Themen durcharbeiten müssen. Das ist bei diesem Buch ganz anders: Hier können Sie an jeder beliebigen Stelle einsteigen, und Sie sind sofort in der jeweiligen Thematik drin. Werfen Sie also einen Blick auf das Inhaltsverzeichnis oder den Index, suchen Sie nach Themen, die Sie interessieren, und gehen Sie zur entsprechenden Seite.
Falls Sie nicht genau wissen, wo Sie loslegen sollen, können Sie natürlich aber auch bei Kapitel 1 beginnen und das Buch von vorn bis hinten durchlesen (was bei Büchern ja generell keine schlechte Idee ist).
Das nun folgende Kapitel 1 zeigt Ihnen kurz und knapp, worum es bei statistischen Verfahren grundsätzlich geht und wie Sie erfolgreich im Alltag, im Beruf, im Studium und so weiter mit Statistik umgehen.
Teil I
IN DIESEM TEIL …
Wie Statistik Ihren Alltag und Ihr Berufsleben beeinflusstWie mangelhaft die Daten häufig sindWas Sie gegen mangelhafte Daten unternehmen könnenWerden Sie mit nützlichem Fachjargon aus der Statistik vertraut gemachtKapitel 1
IN DIESEM KAPITEL
Worum es bei statistischen Verfahren überhaupt gehtErfolgreich mit Statistik umgehen – im Alltag, im Beruf oder im StudiumDie heutige Welt ist so mit Zahlen überfrachtet, dass wir (auch ich!) davon geradezu überwältigt werden. Wenn Sie gegenüber den Statistiken, die Ihnen in den Medien begegnen, eine zynische Grundhaltung entwickelt haben, kann ich Ihnen keinen Vorwurf machen – manchmal geht es mir da auch nicht anders. Aber auch wenn da draußen jede Menge irreführende und falsche Informationen auf Sie warten, gibt es doch jede Menge statistische Arbeiten, die zu kennen sich lohnt. Viele Studien und Verfahren, die mit Daten umgehen, tragen zur Verbesserung unser aller Lebensqualität bei. Ihre Aufgabe besteht nun darin, die verlässlichen von den irreführenden Methoden und Ergebnissen zu unterscheiden – und zwar im Vertrauen auf Ihre eigenen Fähigkeiten. Wenn Sie Statistik und statistische Verfahren wirklich verstehen, verschaffen Sie sich die nötige Sicherheit, die Sie für den gewinnbringenden Umgang mit Zahlen in Alltag, Beruf und Studium brauchen. Genau darum geht es in diesem Buch.
In diesem Kapitel zeige ich auf, welche Rolle die Statistik in unserer heutigen datenlastigen Gesellschaft spielt und was Sie tun können, um in dieser Datenflut nicht nur nicht unterzugehen, sondern sie sogar für sich zu nutzen. Ich nehme Sie mit in die Welt der wissenschaftlichen Anwendung der Statistik und zeige Ihnen, wie man sinnvolle Studien konzipiert, verlässliche Daten erhebt, Informationen analysiert, Ergebnisse interpretiert und daraus eigene Schlüsse zieht. (Und Sie dachten schon, Statistik wäre ein reines Zahlenwerk!)
Unser Alltag wird geradezu überflutet von Statistiken der unterschiedlichsten Art, die wir gar nicht immer als solche wahrnehmen. Das fängt schon an, wenn Sie morgens das Radio einschalten (oder die Zeitung aufschlagen oder sich im Internet informieren) und dort die Wettervorhersage hören (oder lesen) – denn die beruht auf der statistischen Analyse früherer (meteorologischer) Daten und der aktuellen Wetterbedingungen. Am Frühstückstisch lesen Sie vielleicht auf der Müslipackung, welche Anteile von Kohlehydraten, Proteinen und Fett Ihr Morgenmahl hat. Im Büro schlagen Sie Zahlen in Diagrammen und Tabellen nach, tragen Daten in eine Tabellenkalkulation ein, führen eine Diagnose oder Messungen durch, berechnen Werte, schätzen Kosten, treffen Entscheidungen auf der Grundlage statistischer Werte oder arrangieren Ihr Inventar anhand der Verkaufszahlen des Vormonats.
Wenn Sie Glück haben, nehmen Sie Ihr Mittagessen in einem Restaurant ein, das von 500 befragten Personen zur Nr. 1 erkoren wurde. Was Sie dort für Ihr Essen bezahlen, hängt von Marktdaten ab. Nachmittags haben Sie einen Arzttermin, bei dem Ihr Blutdruck gemessen, Körpergewicht und Körpergröße festgestellt und Blutuntersuchungen durchgeführt werden. Wenn alle Informationen beisammen sind, erhalten Sie einen Bericht, der Ihre Werte mit denen der statistischen Norm vergleicht.
Sie fahren nach Hause in einem Auto, bei dessen Wartung heutzutage in der Regel ein Computer für eine statistische Diagnostik zum Einsatz kam. Zu Hause schalten Sie noch mal die Nachrichten ein, hören die neuesten Statistiken zu Wohnungseinbrüchen und Autodiebstählen, verfolgen die Entwicklung der Börsenkurse und erfahren, wie viele Menschen bei einem bestimmten DFB-Pokalspiel im Stadion waren.
Abends putzen Sie sich die Zähne mit einer Zahnpasta, die statistisch erwiesenermaßen gegen Karies wirkt, lesen noch ein paar Seiten in einem Spiegel-Beststeller (der aufgrund von statistischen Verkaufszahlen auf der Liste gelandet ist), schlafen ein – und am nächsten Morgen geht alles wieder von vorne los. Aber wie können Sie sicher sein, dass alle diese Statistiken, auf die Sie sich täglich verlassen, auch korrekt sind? In Kapitel 2 befasse ich mich ausführlicher mit einigen Beispielen dafür, welche Rolle Statistik in unserem Alltag und am Arbeitsplatz spielt, welche Auswirkungen sie hat und wie Sie Ihre Wahrnehmung für Statistik schärfen können.
Manche Statistiken sind vage, ungeeignet oder schlicht und einfach falsch. Deshalb müssen Sie Ihre Wahrnehmung für Statistik im Alltag schärfen. Sie können üben, Statistiken bewusster wahrzunehmen und sich die Informationen genauer anzusehen, Fragen zu stellen und eine gesunde Skepsis zu entwickeln. In Kapitel 3 erfahren Sie, wie schlechte Statistiken Sie in die Irre führen können und wie Sie sich die nötigen Fähigkeiten aneignen, um kritisch zu denken und Probleme zu erkennen, anstatt einfach die Ergebnisse für bare Münze zu nehmen.
Wie alle anderen Fachgebiete hat auch die Statistik eine eigene Fachsprache (manchmal auch etwas lieblos Jargon genannt). In Kapitel 4 erkläre ich kurz einige der am häufigsten gebrauchten statistischen Fachbegriffe. Wenn Sie sich mit dieser Fachsprache vertraut machen, anstatt sich von ihr einschüchtern zu lassen, können Sie Statistik auf einem höheren Niveau verstehen und darüber sprechen. Sie gewinnen an Glaubwürdigkeit, wenn Sie die richtigen Ausdrücke verwenden, um zu beschreiben, warum genau ein bestimmtes statistisches Ergebnis falsch ist. Wenn Sie in Ihren Präsentationen statistische Tabellen, Diagramme und Analysen einsetzen, werden diese durch die richtige Fachsprache effektiver und informativer. (Und wenn Sie das alles nicht überzeugt: Sie müssen die Fachausdrücke schon deshalb lernen, weil ich sie im ganzen Buch verwende, auch wenn ich sie mehrfach erkläre.)
In den nächsten Abschnitten erfahren Sie, in welcher Form Statistik an den einzelnen Phasen der wissenschaftlichen Methodik beteiligt ist.
Fragen haben alle – pharmazeutische Unternehmen und Biologen genauso wie Marktforscher, Politiker allgemein oder speziell die Regierung. Zur Beantwortung dieser Fragen brauchen all diese Personengruppen am Ende die Statistik. Insbesondere viele medizinische und psychologische Studien werden durchgeführt, weil bestimmte Menschen auf der Suche nach einer Antwort auf drängende Fragen sind. Beispiele gefällig?
Kann dieser Impfstoff den Ausbruch der Grippe verhindern?
Wie schätzen die Bundesbürger die aktuelle wirtschaftliche Lage des Landes ein?
Führt eine intensive Nutzung sozialer Netze im Internet bei Jugendlichen zu Depressionen?
Wenn eine Forschungsfrage formuliert wurde, besteht der erste Schritt zu ihrer Beantwortung darin, eine aussagekräftige Studie zu planen, um die benötigten Daten zu erheben. Das bedeutet, dass man sich überlegen muss, mit welchen Verfahren man diese Daten gewinnen kann. In diesem Abschnitt gebe ich Ihnen einen kleinen Überblick über die beiden wesentlichen Grundformen von Studien, nämlich Umfragen (auch als Befragungen bezeichnet) und Experimente (auch als Versuche bezeichnet). Außerdem erkläre ich, warum es wichtig ist, die Anlage (das heißt: die Konzeption) einer Studie zu prüfen, bevor man deren Ergebnissen traut.
Eine Beobachtungsstudie ist eine Studie, in der Daten von Individuen erhoben werden, ohne Einfluss auf diese zu nehmen. Die häufigste Beobachtungsstudie ist die Umfrage. Bei einer Umfrage (oder Befragung) werden Personen, die aus einer interessierenden Grundgesamtheit ausgewählt wurden, mittels eines Fragebogens befragt. Diese Befragung kann auf vielfältige Weise erfolgen: Sie können gedruckte Fragebögen verwenden, die per Post verschickt werden, Umfragen ins Internet stellen, über das Fernsehen die Zuschauer zur telefonischen Beantwortung einer Frage aufrufen, Personen gezielt telefonisch ansprechen und vieles Weitere mehr.
Eine korrekt durchgeführte Umfrage kann ein sehr nützliches Instrument dafür sein, an Informationen zu kommen. Werden Umfragen jedoch nicht ordentlich durchgeführt, kann dabei auch einfach nur Quatsch herauskommen. Mögliche Probleme liegen in den Formulierungen der Fragen, die irreführend sein können, in der Verweigerung der Teilnahme ausgewählter Personen oder im Übersehen ganzer Gruppen der Grundgesamtheit bei der Auswahl der zu Befragenden. Aufgrund solcher möglichen Fehlerquellen muss eine Umfrage immer sehr sorgfältig geplant werden.
Viele Wissenschaftler betreiben einen enormen Aufwand, auch finanzieller Art, um gute Umfragen durchzuführen. Das können Sie merken (anhand von Kriterien, die ich Ihnen noch vorstelle). Da Ihnen aber in den Medien, am Arbeitsplatz und auch im Studium so viele verschiedene Arten von Umfragen begegnen, müssen Sie in der Lage sein, schnell prüfen beziehungsweise beurteilen zu können, wie eine Studie konzipiert und durchgeführt wurde, damit Sie sachkundig auf mögliche Probleme hinweisen können. Die Instrumente, die Sie brauchen, um Befragungen zu beurteilen, finden Sie in Kapitel 16.
Bei einem Experiment werden die beobachteten Individuen einer oder mehrerer Untersuchungen (»Behandlungen«) unterzogen, die eindeutige Vergleiche zwischen den Personen(gruppen) erlauben. Dabei werden die jeweiligen Ergebnisse aufgezeichnet. Wenn man beispielsweise prüfen möchte, ob ein Medikament sich auf den Blutdruck auswirkt, lässt man vielleicht eine Gruppe 10 mg des Medikaments nehmen und eine weitere Gruppe 20 mg. Häufig wird auch eine Kontrollgruppe eingesetzt, in der die teilnehmenden Personen ein Scheinmedikament (als Placebo bezeichnet) erhalten oder ein bereits zugelassenes Medikament gegen dieselbe Krankheit.
Gute und glaubwürdige Experimente sind so angelegt, dass mögliche Verzerrungen (auch als systematischer Fehler oder Bias bezeichnet) minimiert werden, dass viele verlässliche Daten erhoben und geeignete Vergleiche (von Behandlungs- und Kontrollgruppe) angestellt werden können. Mögliche Probleme bei Experimenten ergeben sich, wenn Wissenschaftler oder teilnehmende Personen wissen, welche Behandlung angewendet wurde beziehungsweise welche Behandlung sie erhalten haben, wenn Faktoren, die sich auf das Ergebnis auswirken, nicht berücksichtigt werden (beispielsweise das Körpergewicht bei Untersuchungen zur Medikamentendosierung) oder wenn eine Kontrollgruppe fehlt (sodass man die Ergebnisse nicht mit einem Ausgangswert ohne Behandlung vergleichen kann).
Gut aufgebaute Experimente können jedoch dazu beitragen, eine Ursache-Wirkung-Beziehung zu erkennen, wenn der Unterschied in den Ergebnissen zwischen der Behandlungsgruppe und der Kontrollgruppe statistisch signifikant ist (also mit einer gewissen Wahrscheinlichkeit nicht nur zufällig beobachtet wurde).
Experimente können zur Entwicklung und Prüfung von Arzneimitteln herangezogen oder verwendet werden, um herauszufinden, wie man Nahrungsmittel am besten herstellt und zubereitet, und auch, um festzustellen, ob eine neue Behandlung eine Krankheit heilen oder lindern kann. Zweifellos hat sich unsere Lebensqualität durch gut geplante und durchgeführte Experimente verbessert. Aber nicht alle Experimente sind gut geplant, und es ist wichtig, dass Sie lernen zu erkennen, welche Ergebnisse glaubwürdig sind und welche nicht. Das gilt besonders für Fragen, die Ihnen wichtig sind. Was Sie über Experimente wissen müssen und wie Sie sie beurteilen können, lernen Sie in Kapitel 17.
Nachdem eine Studie, also eine Umfrage oder ein Experiment, geplant wurde, müssen die teilnehmenden Personen ausgewählt und ein Verfahren entwickelt werden, um die Daten zu erheben. Diese Phase ist ganz entscheidend dafür, ob am Ende glaubwürdige, brauchbare Daten vorliegen. In diesem Abschnitt erkläre ich, worauf es besonders ankommt.
In der Statistik gilt ganz besonders, was Sie auch aus anderen Bereichen kennen: Ein Ergebnis kann nur so gut sein, wie es die Ausgangsbedingungen erlauben. Wenn Sie schon bei der Auswahl Ihrer Teilnehmer eine Verzerrung einführen, also bestimmte Personen oder Gruppen bevorzugen, dann werden auch Ihre Ergebnisse verzerrt sein. So einfach ist das.
Angenommen, Adrian möchte wissen, was die Menschen in seiner Heimatstadt über die Eröffnung einer Spielbank denken. Er geht ins größte Einkaufszentrum oder Kaufhaus der Stadt, nimmt sein Klemmbrett für Notizen mit und fragt die Leute, die an ihm vorbeikommen, nach ihrer Meinung dazu. Was macht er falsch? Adrian wird auf diese Weise nur die Meinung von Menschen erfahren, die a) in diesem Einkaufszentrum oder Kaufhaus einkaufen, und zwar b) nur an diesem einen Tag und c) nur zu der Zeit, zu der er dort ist, und die d) auch noch Lust haben, ihm zu antworten.
Das sind sehr viele Einschränkungen, die dazu führen, dass die Befragten nicht repräsentativ für alle Menschen in der Stadt sind. Adrian könnte auch eine Webseite ins Netz stellen und dort Menschen auffordern, über die neue Spielbank abzustimmen. Dann stützt sich aber sein Ergebnis nur auf Menschen, die von seiner Webseite wissen, Internetzugang haben und bereit sind, zu antworten. Erfahrungsgemäß sind das nur Personen, die ein ausgeprägtes Interesse an der Frage haben. Am Ende hat Adrian dann eine Menge verzerrter Daten von Personen, die nicht stellvertretend für die ganze Stadt sind.
Das Schlüsselwort für die Vermeidung von Verzerrungen ist »zufällig«. Sie müssen Ihre Stichprobe von Personen zufällig auswählen – also so, als ob Sie Namen aus einem Hut ziehen (ohne in den Hut hineinzuschauen, am besten mit verbundenen Augen). In der Wissenschaft gibt es verschiedene Methoden, um Personen zufällig auszuwählen, die Sie in Kapitel 16 kennenlernen werden.
Wenn Sie ein Experiment planen, ist die zufällige Auswahl von Teilnehmern oft ethisch nicht vertretbar, da bei einem Experiment die teilnehmenden Personen in der Regel einer Behandlung unterzogen werden. Daher geht man anders vor: Man sucht sich Freiwillige für die Teilnahme, die repräsentativ für die zu untersuchende Grundgesamtheit sind, und sorgt dafür, dass die Daten so erhoben werden, dass sich die Ergebnisse auf eine größere Gruppe übertragen lassen. Wie das geht, erfahren Sie in Kapitel 17.
Wenn Sie die Kapitel 16 und 17 durchgearbeitet haben, wissen Sie, wie Sie die von anderen angewandten Methoden zur Auswahl der jeweiligen Stichproben genau prüfen können, und Sie können sogar Ihren eigenen Plan für eine Stichprobenziehung erstellen. Sie wissen dann, ob vorliegende Ergebnisse unbrauchbar sind, weil die Studie einfach nicht gut geplant und durchgeführt wurde.
Als Verzerrung, systematischen Fehler oder auf Neudeutsch Bias (sprich Bei-ess) bezeichnet man die systematische Bevorzugung bestimmter Personen oder Antworten. Die Verzerrung ist der Erzfeind aller Statistikerinnen und Statistiker, und diese werden alles tun, um sie zu vermeiden. Sie brauchen ein Beispiel? Angenommen, Sie führen eine telefonische Umfrage zur Zufriedenheit am Arbeitsplatz durch. Wenn Sie dafür Menschen zu Hause anrufen, und zwar zwischen 9 und 17 Uhr, bekommen Sie keine Antworten von Personen, die tagsüber arbeiten (oder nur von solchen, die in Heimarbeit tätig sind). Es ist aber denkbar, dass Menschen, die tagsüber auf der Arbeit sind, zufriedener sind als Menschen, die in Nachtschichten arbeiten.
Auch bei der eigentlichen Erhebung von Daten mittels Umfragen müssen Sie auf Verzerrungen achten. Ein Beispiel: Manche Fragebögen sind einfach zu lang. Was passiert, wenn jemand die Befragung nach der Hälfte abbricht? Oder wie gehen Sie damit um, wenn Ihnen jemand falsche Auskünfte erteilt, also beispielsweise angibt, 5.000 Euro im Monat zu verdienen, obwohl es in Wirklichkeit nur 2.500 Euro sind? Und was machen Sie, wenn Sie eine Antwort bekommen, die in Ihrer Liste möglicher Antworten gar nicht enthalten ist? Bei der Erhebung von Daten mittels Befragungen können jede Menge Probleme auftreten, die Sie erkennen müssen.
Hinsichtlich möglicher Verzerrungen und der Datenerhebung sind Experimente manchmal noch schwieriger durchzuführen als Befragungen. Angenommen, Sie möchten den Blutdruck untersuchen. Was tun Sie, wenn mitten in Ihrer Studie Ihr Blutdruckmessgerät kaputt geht? Was passiert, wenn jemand die Messung vorzeitig abbrechen möchte? Wie gehen Sie damit um, wenn während des Experiments die teilnehmenden oder die untersuchenden Personen abgelenkt werden? Oder wenn eine Blutuntersuchung genau eine Stunde nach der Einnahme eines Medikaments erfolgen muss, aber keine Vene für die Blutentnahme zugänglich ist? Das sind nur ein paar Beispiele dafür, was alles schiefgehen kann, wenn Sie Daten für Experimente erheben. Auf so etwas müssen Sie sich einstellen, und wenn solche Probleme auftreten, müssen Sie sie erkennen.
Nachdem Sie Kapitel 16 (zu Stichproben und Umfragen) und Kapitel 17 (zu Experimenten) durchgearbeitet haben, sollten Sie in der Lage sein, unverzerrte Stichproben auszuwählen und Daten ohne Verzerrung zu erheben, sowie ein Gespür dafür entwickeln, wie sich vermeintliche Kleinigkeiten nachhaltig auf Ergebnisse auswirken können. Außerdem können Sie dann die Glaubwürdigkeit statistischer Ergebnisse beurteilen und sich überzeugend dazu äußern, da Sie wissen, wovon Sie reden.
Nachdem verlässliche Daten erhoben wurden, besteht der nächste Schritt darin, diese sinnvoll zusammenzufassen, um sich einen Überblick zu verschaffen. In der Statistik gibt es dazu zwei wichtige Verfahren: Zahlen und Bilder (also Diagramme und Schaubilder).
Als beschreibende Statistik bezeichnet man in erster Linie Zahlen, die einen Datensatz oder eine Menge von Daten mit deren wichtigen Merkmalen beschreiben:
Wenn es sich um kategoriale Daten handelt (für die Personen in Gruppen eingeteilt werden, beispielsweise nach Geschlecht oder Parteizugehörigkeit), werden diese üblicherweise mit der Anzahl der Individuen pro Gruppe (als
Häufigkeit
bezeichnet) oder dem prozentualen Anteil der Individuen pro Gruppe (als
relative Häufigkeit
bezeichnet) zusammengefasst.
Numerische Daten stehen für Messungen oder Zählwerte, bei denen die Zahlen eine numerische Bedeutung haben (wie Körpergröße und Körpergewicht). Bei numerischen Daten kann mehr als die Anzahl oder der prozentuale Anteil zusammengefasst werden. Dazu gehören unter anderem:
Maße für die Mitte (die angeben, wo sich der »Mittelpunkt« der Daten befindet)
Maße für die Streuung (die angeben, wie unterschiedlich die Daten sind oder wie nah sie am Mittelwert liegen)
gegebenenfalls auch Zahlen, die die Beziehung zwischen zwei Variablen angeben (wie Körpergröße und Körpergewicht)
Manche Größen der beschreibenden Statistik sind in bestimmten Situationen geeigneter als andere. Häufig ist das arithmetische Mittel nicht das beste Maß für die Mitte eines Datensatzes, sondern eher der Median. Auch ist die Standardabweichung nicht das einzige Maß für Variabilität, der Interquartilsabstand hat ebenfalls seine guten Seiten. Sie müssen die verschiedenen Kenngrößen der beschreibenden Statistik kennen sowie sie interpretieren und bewerten können, die Ihnen täglich begegnen, und auch wissen, in welchen Fällen (beziehungsweise bei welchen Fragestellungen) eine andere als die angegebene Größe besser wäre.
Die häufigsten Größen der beschreibenden Statistik werden in Kapitel 5 berechnet, interpretiert, verglichen und bewertet. Dazu zählen für kategoriale Daten absolute Häufigkeiten und relative Häufigkeiten (Anzahlen und Prozente) sowie Durchschnittswert (arithmetisches Mittel), Median, Standardabweichung, Perzentile für numerische Daten.
Mit einem lateinischen Fremdwort bezeichnet man die beschreibende Statistik auch manchmal als deskriptive Statistik. Von ihr unterscheidet man üblicherweise die schließende Statistik, die auch induktive Statistik genannt wird. Bei der induktiven Statistik geht es um den Schluss von Stichprobenergebnissen auf die Gesamtpopulation, die Grundgesamtheit, mithilfe der Methoden der Wahrscheinlichkeitsrechnung.
In Diagrammen und Schaubildern werden Daten grafisch zusammengefasst. Sie sind so organisiert, dass sie Ihnen entweder blitzschnell einen groben Überblick über die Daten vermitteln oder ein bestimmtes Ergebnis genauer darstellen. In unserer Welt mit ihren schnellen Infos und superkurzen O-Tönen sind Diagramme und Schaubilder sehr beliebt. Die meisten davon stellen deutlich, fair und sinnvoll dar, was ausgesagt werden soll. Allerdings gibt es auch Beispiele, in denen etwas zu viel künstlerische Freiheit am Werk ist, was dann zu irreführenden oder einfach falschen Diagrammen und Schaubildern führt.
In Kapitel 4 stelle ich die wichtigsten Arten von Diagrammen und Schaubildern für die Zusammenfassung von kategorialen oder numerischen Daten vor. Sie erfahren dort, wie man diese Grafiken erstellt, welchem Zweck sie dienen und wie man sie interpretiert. Außerdem zeige ich Ihnen, in welch vielfältiger Weise Diagramme und Schaubilder irreführend sein können und wie Sie mögliche Probleme schnell erkennen. Sie sollten in diesen Problemfällen stutzig werden und auch benennen können, was Ihr Misstrauen erregt hat. Ein paar Beispiele:
Einige der einfacheren Darstellungen für kategoriale Daten sind Tortendiagramme und Balkendiagramme, die eine Variable in ihre Bestandteile aufteilen, beispielsweise das Geschlecht oder die Apps, die Jugendliche auf ihren Smartphones haben. So kann ein Balkendiagramm beispielsweise Meinungen in Gestalt von fünf Balken abbilden, die von »stimme überhaupt nicht zu« bis »stimme vollkommen zu« reichen. In Kapitel 6 finden Sie alle wichtigen Infos dazu, wie Sie diese Diagramme erstellen, interpretieren und, noch wichtiger, prüfen, ob sie der dargestellten Sache gerecht werden. Sie werden sich wahrscheinlich wundern, was man bei einem einfachen Balkendiagramm alles falsch machen kann.Für numerische Daten wie Größe, Gewicht, Zeit oder Mengen braucht man andere Arten von Diagrammen. Zu ihrer Zusammenfassung werden Histogramme und Box-Plots verwendet, die sehr informativ sein und Datenmengen wunderbar zutreffend abbilden können. Aber natürlich können auch diese Darstellungen irreführend sein – aus Unkenntnis oder sogar mit Absicht. (Die Hintergründe dazu finden Sie in Kapitel 7.)Diagramme und Schaubilder begegnen Ihnen tagtäglich – schlagen Sie einfach eine Zeitung auf, und Sie werden mühelos mehrere davon finden. Schauen Sie mit Ihren Statistikkenntnissen im Hinterkopf genau hin, um irreführende Darstellungen zu erkennen, bevor Sie sich zu vorschnell zu Meinungen oder Handlungen hinreißen lassen.
Eine Variable ist ein Merkmal, das gezählt, gemessen oder kategorisiert wird. Beispiele für Variablen sind Geschlecht, Alter, Körpergröße, Körpergewicht und die Zahl der Haustiere, die jemand sich hält. Eine Verteilung ist eine Auflistung der möglichen Werte einer Variablen (oder Intervalle von Werten) zusammen mit der Angabe, wie häufig (oder mit welcher Dichte) diese auftreten. Das Geschlecht unter Neugeborenen in Deutschland verteilte sich beispielsweise 2018 auf 51,3 % männliche und 48,7 % weibliche Kinder.
Für verschiedene Arten von Variablen gibt es auch verschiedene Verteilungen. In Einführungskursen in die Statistik werden die folgenden drei am häufigsten behandelt, die auch im wahren Leben viele Anwendungen haben:
Eine Variable, die die Anzahl der Erfolge bei einer bestimmten Zahl von Versuchen misst (beispielsweise die Anzahl der Menschen, die nach Einnahme eines bestimmten Medikaments gesund wurden), hat eine Binomialverteilung.Eine Variable, die Werte annimmt, die sich anhand einer sogenannten Glockenkurve verteilen, wie die Noten in Klassenarbeiten, hat eine Normalverteilung.Eine Variable, die auf den Mittelwerten von Stichproben beruht und für die Sie nur wenige Daten haben, wie beispielsweise zehn Teilnehmer in einer Studie zu einem Gewichtsabnahme-Programm, sollten Sie sinnvollerweise mit einer t-Verteilung beschreiben.Grundsätzlich kann man Variablen in qualitative (kategoriale) und in quantitative (numerische) Variablen unterscheiden, je nachdem, ob es sich um kategoriale oder um numerische Daten handelt. Bei einer qualitativen Variablen sind sozusagen Wörter die Ausprägungen, zum Beispiel bei der Variablen »Geschlecht« die Wörter »Weiblich«, »Männlich« und »Divers«. Demgegenüber sind bei quantitativen Variablen Zahlen die jeweiligen Ausprägungen. Hierbei können die Ausprägungen ganzzahlig sein (wie zum Beispiel bei der Anzahl der Autos, die in einem Fuhrpark stehen); dann spricht man von einer diskreten Variablen. Können hingegen bei einer quantitativen Variablen auch Nachkommastellen bei den Variablenausprägungen vorkommen – streng genommen: sind die betreffenden Ausprägungen grundsätzlich beliebig unterteilbar –, spricht man präzisierend davon, dass diese Variable stetig (kontinuierlich) sei (Beispiel: das Körpergewicht eines Menschen, etwa 80,256789987… kg).
In Bezug auf Verteilungen müssen Sie herausfinden, welche Verteilung eine bestimmte Variable hat, wie Sie – über die Häufigkeitsfragestellung hinausgehend – Wahrscheinlichkeiten bestimmen und wie Sie feststellen, was der (arithmetische) Mittelwert und die Standardabweichung der Ergebnisse über einen langen Zeitraum wären. (Wenn im Übrigen im Buch verkürzend nur von »Mittelwert« die Rede ist, ist damit das arithmetische Mittel, also der Durchschnittswert, gemeint.) Damit Sie sich diese Kenntnisse erarbeiten können, habe ich gleich drei Kapitel für Sie geschrieben, nämlich eines pro genannte Verteilung: Kapitel 8 widmet sich der Binomialverteilung, Kapitel 9 der Normalverteilung und Kapitel 10 der t-Verteilung.
Falls Sie gerade einen Einführungskurs in Statistik besuchen (oder überhaupt einen Statistikkurs), wissen Sie schon, dass zu den schwierigsten Inhalten die Stichprobenverteilung und der zentrale Grenzwertsatz gehören (zwischen denen ein enger Zusammenhang besteht). Kapitel 11 führt Sie Schritt für Schritt durch diese Themen. Sie verstehen dann, was eine Stichprobenverteilung ist, wofür man sie braucht und wie sie die Grundlage für Datenanalysen in Gestalt von Hypothesentests und Konfidenzintervallen bildet (mit der Datenanalyse befasst sich der nächste Abschnitt noch genauer). Wenn Sie den zentralen Grenzwertsatz verstehen, können Sie auch schwierige Aufgaben wesentlich einfacher lösen. Die Grundlagen für dieses Verständnis liefert Ihnen, wie erwähnt, Kapitel 11.