Statistik Lehr- und Übungsbuch für Dummies - Deborah J. Rumsey - E-Book

Statistik Lehr- und Übungsbuch für Dummies E-Book

Deborah J. Rumsey

0,0
24,99 €

-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.
Mehr erfahren.
Beschreibung

Ihr praktischer Einstieg in die Statistik

Statistik ist nicht immer ganz einfach, aber sehr nützlich. Der Schlüssel zum Erfolg heißt: erst verstehen und dann üben, üben, üben. Deborah Rumsey erklärt Ihnen die notwendigen Grundbegriffe und erläutert die wichtigsten statistischen Konzepte. Dabei kommt sie fast ohne Formeln aus und schafft einen Bezug zwischen Theorie und Praxis. Sie lernen die verschiedenen grafischen Darstellungsmöglichkeiten von statistischem Material kennen und erfahren, wie Sie Ihre Ergebnisse richtig auswerten. Mit Übungen zu allen Themengebieten können Sie dann das erlernte Wissen festigen.

Sie erfahren

  • Wie Sie brauchbare Daten erheben
  • Wie Sie Diagramme erstellen und interpretieren
  • Wie Sie mit Wahrscheinlichkeitsmodellen komplizierte Fragen schnell beantworten
  • Wie Sie einen Hypothesentest aufstellen und durchführen

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern

Seitenzahl: 971

Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



 

Statistik Lehr- und Übungsbuch für Dummies

Bibliografische Information der Deutschen Nationalbibliothek

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

1. Auflage 2024

© 2024 Wiley-VCH GmbH, Boschstraße 12, 69469 Weinheim, Germany

Original English language edition Statistics for Dummies © 2015 and Statistics Workbook for Dummies © 2005 by Wiley Publishing, Inc. All rights reserved including the right of reproduction in whole or in part in any form. This translation published by arrangement with John Wiley and Sons, Inc.

Copyright der englischsprachigen Originalausgabe Statistics for Dummies © 2015 und Statistics Workbook for Dummies © 2005 by Wiley Publishing, Inc. Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form. Diese Übersetzung wird mit Genehmigung von John Wiley and Sons, Inc. publiziert.

Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.

Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.

Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.

Coverfoto: peshkova — stock.adobe.comKorrektur: Claudia Lötschert

Print ISBN: 978-3-527-72174-0ePub ISBN: 978-3-527-84688-7

Über die Autorin

Deborah Rumsey erwarb einen Doktortitel in Statistik an der Ohio State University (1993). Nach ihrer Promotion wechselte sie zum Department of Statistics der Kansas State University, wo sie den renommierten Presidential Teaching Award gewann. Im Jahr 2000 kehrte sie an die Ohio State University zurück und ist heute Mitglied des Department of Statistics. Dr. Rumsey war Mitglied des Statistics Education Executive Committee der American Statistical Association und Lektorin der Teaching-Bits-Rubrik des Journal of Statistics Education.

Sie ist Autorin weiterer Bücher wie Statistik II für Dummies und Wahrscheinlichkeitsrechnung für Dummies (auch erschienen bei Wiley-VCH). Außerdem hat sie zahlreiche Aufsätze zur Statistik-Ausbildung veröffentlicht und viele einschlägige Vorträge gehalten. Ihre Forschungsinteressen liegen auf der Lehrplanentwicklung, der Weiterbildung und Unterstützung von Lehrern und auf immersiven Lernumgebungen. Ihre anderen Leidenschaften sind ihre Familie, das Angeln, die Beobachtung von Vögeln, das Fahren eines neuen Kubota-Traktors auf dem »Familienbauernhof« und Ohio State Buckeye Football (nicht unbedingt in dieser Reihenfolge).

Über den Überarbeiter

Jürgen Faik studierte Volkswirtschaftslehre und Soziologie in Frankfurt am Main und promovierte ebenda; außerdem habilitierte er sich an der Universität Vechta. Er war Vertretungsprofessor an der Fachhochschule Darmstadt sowie Lehrbeauftragter an verschiedenen Universitäten beziehungsweise Hochschulen in Deutschland. Zurzeit lehrt er als Lehrkraft für besondere Aufgaben an der Hochschule Mainz vornehmlich Wirtschaftsmathematik und Statistik. Er ist Autor von Schnellkurs Volkswirtschaftslehre, Schnellkurs Wirtschaftsmathematik, Statistik für Wirtschafts- und Sozialwissenschaftler und von Statistik mit SPSS: Alles in einem Band für Dummies (inzwischen in der zweiten Auflage). Darüber hinaus fungierte er als Herausgeber (und Autor) von Mathematik für Wirtschaftswissenschaftler für Dummies.

Inhaltsverzeichnis

Cover

Titelblatt

Impressum

Über die Autorin

Über den Überarbeiter

Inhaltsverzeichnis

Einleitung

Über dieses Buch

Konventionen in diesem Buch

Törichte Annahmen über die Leser

Wie dieses Buch aufgebaut ist

Die Symbole in diesem Buch

Wie geht es weiter?

Teil I: Mit Statistik den Alltag bewältigen

Kapitel 1: Statistik kurz und knapp

Statistiken verstehen und nutzen

Verteilungen bestimmen

Glaubwürdige Schlussfolgerungen ziehen

Übungsaufgaben

Kapitel 2: Fehler in Statistiken

Die Kontrolle übernehmen: so viele Zahlen und so wenig Zeit

Fehler, Übertreibungen und schlichte Lügen

Die Bedeutung irreführender Statistiken

Übungsaufgaben

Kapitel 3: Das Handwerkszeug des Statistikers

Statistik: mehr als nur Zahlen

Grundbegriffe der Statistik

Übungsaufgaben

Teil II: Zahlenknacken leicht gemacht

Kapitel 4: Grafiken und Diagramme

Statistik grafisch darstellen

Ein Stück vom Kuchen abbekommen

Säulendiagramme im Einsatz

Statistiken mithilfe von Tabellen darstellen

Das Liniendiagramm

Daten mit einem Histogramm veranschaulichen

Übungsaufgaben

Kapitel 5: Von Durchschnitten und Medianen

Daten mit statistischen Größen beschreiben

Qualitative Daten beschreiben

Quantitative Daten beschreiben

Übungsaufgaben

Teil III: Gewinnchancen realistisch einschätzen

Kapitel 6: Wie stehen die Chancen? Einführung in die Wahrscheinlichkeitsrechnung

Risiken basierend auf Wahrscheinlichkeiten eingehen

Grundlagen der Wahrscheinlichkeitsrechnung

Interpretation von Wahrscheinlichkeiten

Fehleinschätzungen vermeiden

Die Verbindung zwischen Wahrscheinlichkeitsrechnung und anderer Statistik

Übungsaufgaben

Kapitel 7: Auf Gewinn spielen

Warum Casinos Gewinne machen

Hilfreiche Kenntnisse

Übungsaufgaben

Teil IV: Mit Wahrscheinlichkeitsmodellen komplizierte Fragen schnell beantworten

Kapitel 8: Zufallsvariablen und die Binomialverteilung

Allgemeines zu Zufallsvariablen

Binomialverteilte Zufallsvariablen als Verteilungsmodell für diskrete Zufallsvariablen

Übungsaufgaben

Kapitel 9: Die Normalverteilung

Die Grundlagen der Normalverteilung

Die Standardnormalverteilung oder Z-Verteilung

Wahrscheinlichkeiten für eine Normalverteilung (mithilfe der Z-Verteilung) ermitteln

Approximation der Binomialverteilung durch die Normalverteilung

Übungsaufgaben

Kapitel 10: Die t-Verteilung

Vergleich der t-Verteilung mit der Standardnormalverteilung

Zur Variabilität der »t«-Verteilung

Mit der »t«-Tabelle arbeiten

Übungsaufgaben

Kapitel 11: Stichprobenverteilungen und der zentrale Grenzwertsatz

Definition einer Stichprobenverteilung

Der Mittelwert einer Stichprobenverteilung

Den Standardfehler messen und seine Eigenschaften

Die Form einer Stichprobenverteilung

Wahrscheinlichkeiten für den Stichprobenmittelwert ermitteln

Die Stichprobenverteilung von Stichprobenverhältnissen

Wahrscheinlichkeiten für das Stichprobenverhältnis ermitteln

Übungsaufgaben

Kapitel 12: Die Fehlergrenze berücksichtigen

Die Bedeutung des Vorzeichens

Die Fehlergrenze berechnen

Den Einfluss der Stichprobengröße ermitteln

Die Fehlergrenze beschränken

Übungsaufgaben

Teil V: Wichtige Dinge schätzen

Kapitel 13: Interpretation und Bewertung von Konfidenzintervallen

Statistiken mit Parametern in Verbindung bringen

Den bestmöglichen Schätzwert abgeben

Ergebnisse auf einem bestimmten Konfidenzniveau interpretieren

Irreführende Konfidenzintervalle ausfindig machen

Übungsaufgaben

Kapitel 14: Konkrete Konfidenzintervalle berechnen

Ein Konfidenzintervall berechnen

Die Wahl des Konfidenzniveaus

Zur Breite des Konfidenzintervalls

Die Stichprobengröße näher betrachtet

Die Streuung in der Grundgesamtheit

Übungsaufgaben

Kapitel 15: Häufig genutzte Konfidenzintervalle

Konfidenzintervall für den Mittelwert der Grundgesamtheit

Konfidenzintervall für den Anteil in der Grundgesamtheit

Konfidenzintervall für die Differenz zwischen zwei Mittelwerten

Konfidenzintervall für die Differenz zwischen zwei Anteilen in Grundgesamtheiten

Konfidenzintervalle richtig interpretieren (sodass auch Ihr Lehrer zufrieden ist)

Das Ergebnis eines Konfidenzintervalls auswerten: Was die Formeln nicht verraten

Übungsaufgaben

Teil VI: Mit Testen das kritische Denken fördern

Kapitel 16: Behauptungen, Tests und Schlussfolgerungen

Möglichkeiten, mit Behauptungen umzugehen

Einen Hypothesentest durchführen

Typische Fehler beim Hypothesentesten

Schritt für Schritt durch den Hypothesentest

Übungsaufgaben

Kapitel 17: Formeln und Beispiele für häufig genutzte Hypothesentests

Hypothesentest für den Mittelwert der Grundgesamtheit

Hypothesentest für den Anteil in der Grundgesamtheit

Hypothesentest für den Vergleich von zwei Mittelwerten

Hypothesentest für gepaarte Mittelwertdifferenzen

Vergleich der Anteile in zwei (unabhängigen) Grundgesamtheiten

Übungsaufgaben

Teil VII: Statistische Studien richtig ausschöpfen

Kapitel 18: Umfragen, Umfragen und noch mehr Umfragen

Den Einfluss von Meinungsumfragen erkennen

Hinter den Kulissen von Meinungsumfragen

Übungsaufgaben

Kapitel 19: Experimente: medizinischer Durchbruch oder irreführendes Ergebnis?

Experimente und Beobachtungsstudien

Gute Experimente planen und umsetzen

Experimente sachkundig beurteilen

Übungsaufgaben

Kapitel 20: Die Suche nach dem Zusammenhang: Korrelationen und andere Assoziationen

Beziehungen mit Plots und Diagrammen bildlich darstellen

Quantifizierung der Beziehung oder Korrelationen und andere Maße

Mit Wahrscheinlichkeiten Zusammenhänge fundieren

Assoziationen, Korrelationen und Kausalzusammenhänge

Übungsaufgaben

Kapitel 21: Qualitätskontrolle oder: Was Statistik mit Zahnpasta zu tun hat

Erwartungen erfüllen

Die Qualität aus der Zahnpastatube herausquetschen

Übungsaufgaben

Teil VIII: Der Top-Ten-Teil

Kapitel 22: Zehn Kriterien für eine gute Umfrage

Die Zielpopulation sollte klar definiert sein

Die Stichprobe sollte die Zielpopulation abbilden

Die Stichprobe sollte zufällig ausgewählt sein

Die Stichprobe sollte groß genug sein

Mit Anreizen Verweigerung minimieren

Eine angemessene Art von Umfrage wählen

Keine Suggestivfragen verwenden

Der Zeitpunkt sollte gut gewählt sein

Die Personen, die die Umfrage durchführen, sollten gut ausgebildet sein

Die Umfrage sollte die ursprüngliche Fragestellung beantworten

Kapitel 23: Zehn häufige Fehler

Irreführende Grafiken

Verzerrte Daten

Keine Fehlergrenze

Keine Zufallsstichproben

Stichprobengröße verschweigen

Falsch interpretierte Korrelationen

Störvariablen

Gepfuschte Zahlen

Selektive Darstellung von Ergebnissen

Die allmächtige Anekdote

Kapitel 24: Lösungen zu den Übungsaufgaben

Lösungen zu Kapitel 1

Lösungen zu Kapitel 2

Lösungen zu Kapitel 3

Lösungen zu Kapitel 4

Lösungen zu Kapitel 5

Lösungen zu Kapitel 6

Lösungen zu Kapitel 7

Lösungen zu Kapitel 8

Lösungen zu Kapitel 9

Lösungen zu Kapitel 10

Lösungen zu Kapitel 11

Lösungen zu Kapitel 12

Lösungen zu Kapitel 13

Lösungen zu Kapitel 14

Lösungen zu Kapitel 15

Lösungen zu Kapitel 16

Lösungen zu Kapitel 17

Lösungen zu Kapitel 18

Lösungen zu Kapitel 19

Lösungen zu Kapitel 20

Lösungen zu Kapitel 21

Anhang: Tabellen

Die t-Tabelle

Die Z-Tabelle

Die Binomialverteilungstabelle

Abbildungsverzeichnis

Stichwortverzeichnis

End User License Agreement

Illustrationsverzeichnis

Kapitel 2

Abbildung 2.1: Diagramm zur Veranschaulichung der Häufigkeit, mit der jede einzel...

Abbildung 2.2: Das Balkendiagramm zeigt die prozentuale Häufigkeit, mit der jede ...

Kapitel 3

Abbildung 3.1: Die Normalverteilung

Kapitel 4

Abbildung 4.1: Ein Beispiel für ein Kreisdiagramm

Abbildung 4.2: Ausgaben privater Haushalte

Abbildung 4.3: Kreisdiagramm der Befragung nach dem Autobesitz

Abbildung 4.4: Kreisdiagramm der Lieblingsgenres von Kinogängern

Abbildung 4.5: Reduzierung der Umfrageergebnisse auf zwei Kategorien

Abbildung 4.6: Ein Kreis- und ein Balkendiagramm im Vergleich

Abbildung 4.7: Das Säulendiagramm zeigt die Ergebnisse einer Befragung von Kinogä...

Abbildung 4.8: Ein Beispiel für ein sortiertes Balkendiagramm

Abbildung 4.9: Veränderung der Interessen von Studenten während des Semesters

Abbildung 4.10: Darstellung der prozentualen Veränderung

Abbildung 4.11: Veränderung der Ergebnisse in Prozentpunkten

Abbildung 4.12: Liniendiagramm der Teilnehmerzahl beim Marathon

Abbildung 4.13: Übertriebene Skalierung der y-Achse

Abbildung 4.14: Liniendiagramm der prozentualen Veränderung

Abbildung 4.15: Stabdiagramm der prozentualen Anteilswerte der 30 Finisherzeiten

Abbildung 4.16: Histogramm der Finisherzeiten. Zusätzlich wird hier noch einmal a...

Abbildung 4.18: Typische Verteilungsformen in Histogrammen

Abbildung 4.17: Darstellung von drei Verteilungsformen der Daten durch Histogramm...

Abbildung 4.19: Krabbeldistanzen eines Babys

Kapitel 5

Abbildung 5.1: Beispiele für rechtsschiefe, linksschiefe und symmetrische Daten

Abbildung 5.2: Zur Anwendung der k-σ-Regel auf ein glockenförmiges ...

Kapitel 6

Abbildung 6.1: Die Flugrichtungen von Eddy Elfers Elfmetern

Kapitel 7

Abbildung 7.1: Gewinnklassen und Gewinnwahrscheinlichkeiten bei einer Spielvarian...

Kapitel 9

Abbildung 9.1: Drei Normalverteilungen mit Erwartungswerten und Standardabweichun...

Abbildung 9.2: Die Z-Verteilung hat einen Erwartungswert von 0 und eine Standarda...

Abbildung 9.3: Die Verteilung der Fischlängen in einem Teich

Abbildung 9.4: Standardisierung der Zahlen einer Normalverteilung (X) in Zahlen d...

Abbildung 9.5: Die an ihrer Länge gemessenen unteren 10 % der Fische in dem Teich

Kapitel 10

Abbildung 10.1: Vergleich der Standardnormalverteilung (Z-Verteilung) mit einer t...

Abbildung 10.2: t-Verteilungen für verschiedene Stichprobenumfänge...

Kapitel 11

Abbildung 11.1: Verteilungen von a) Einzelwürfen eines Würfels und b) Durchschnit...

Abbildung 11.2: Verteilungen der Zeiten von 1 Person, 10 Personen und 50 Personen

Abbildung 11.3: Verteilungen der Fischlängen a) in Teich 1, b) in Teich 2

Abbildung 11.4: Populationsprozentsätze für Antworten auf die Mathehilfe-Frage

Abbildung 11.5: Stichprobenverteilung des Anteils der Studenten, die die Frage na...

Kapitel 16

Abbildung 16.1: Prüfgrößen und die Entscheidungen, die Sie auf ihrer Basis treffe...

Kapitel 20

Abbildung 20.1: Streudiagramm für die Häufigkeit des Grillenzirpens im Verhältnis...

Abbildung 20.2: Kundenzufriedenheit vor und nach der Schulung

Abbildung 20.3: Kundenzufriedenheit in Kreisdiagrammen dargestellt

Abbildung 20.4: Streudiagramme für verschiedene Korrelationen

Kapitel 21

Abbildung 21.1: Qualitätsregelkarte für die Füllung von Bonbontüten

Abbildung 21.2: Verteilung der Zahnpastatubengewichte

Abbildung 21.3: Verteilung der Stichprobenmittel bei Stichproben von jeweils zehn...

Abbildung 21.4: Kontrollgrenzen für Stichprobenmittel von Stichproben mit jeweils...

Abbildung 21.5: Zahnpastatuben-Füllprozesse, die außer Kontrolle geraten sind

Kapitel 23

Abbildung 23.1: Vier Grundtypen von Grafiken

Orientierungspunkte

Cover

Titelblatt

Impressum

Über die Autorin

Inhaltsverzeichnis

Einleitung

Fangen Sie an zu lesen

Abbildungsverzeichnis

Stichwortverzeichnis

End User License Agreement

Seitenliste

1

2

3

4

7

8

9

23

24

25

26

27

28

29

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

383

384

385

386

387

388

389

390

391

392

393

394

395

396

397

398

399

400

401

402

403

404

405

406

407

408

409

410

411

412

413

414

415

416

417

418

419

420

421

422

423

424

425

426

427

428

429

430

431

432

433

434

435

436

437

438

439

440

441

442

443

444

445

446

447

448

449

451

452

453

454

455

456

457

458

459

460

461

462

463

464

465

466

467

468

469

470

471

472

473

474

475

476

477

478

479

480

481

482

483

484

485

486

487

488

489

490

491

492

493

494

495

496

497

498

499

500

501

502

503

504

505

506

507

508

509

510

511

512

513

514

515

516

517

518

519

520

521

522

523

524

525

526

527

528

529

530

531

532

533

534

535

536

537

538

539

540

541

542

543

544

545

546

547

548

549

550

551

552

553

554

555

556

557

558

559

560

561

562

563

564

565

566

567

568

569

570

571

572

573

574

575

576

577

578

579

580

581

582

583

584

585

587

588

589

590

591

592

593

594

595

596

597

598

599

600

601

602

603

Einleitung

Mit diesem Buch halten Sie ein leicht verständliches Lehr- und Übungsbuch auf dem Gebiet der Statistik in Händen. Wenn Sie dieses Buch (zumindest teilweise) durchgearbeitet haben, haben Sie das nötige Rüstzeug auf den Weg mitbekommen, um die große Menge an alltäglichen statistischen Informationen

zu verarbeiten,

auszuwerten,

zu interpretieren und

als Fundament zu nutzen, um darauf aufbauend eigene Entscheidungen zu treffen.

Nach der Lektüre dieses Buchs werden Sie also Diagramme, Tabellen, die Darstellung von Umfrageergebnissen oder Experimenten sowie die Befunde wissenschaftlicher Studien sachkundig beurteilen können. Vor allem werden Sie dabei in der Lage sein, bewusste oder unbewusste Manipulationen bei entsprechenden Ergebnispräsentationen zu erkennen.

Damit die Lektüre dieses Buchs Ihnen Spaß bereitet, ist es in einem eher lockeren Stil verfasst worden, und die inhaltlichen Ausführungen wurden durch zahlreiche (Alltags-)Beispiele unterfüttert. Sie finden in diesem Zusammenhang in diesem Buch Beispiele von medizinischen Durchbrüchen über Kriminalstudien und Bevölkerungstrends bis zu Umfragen zum Internet-Dating, zur Benutzung von Mobiltelefonen und zu den schlechtesten Autos des Jahrhunderts. Auf diese Weise werden Sie in die Lage versetzt, zu erkennen, dass Statistik kein Selbstzweck ist, sondern Ihnen auch stets bei Ihrer Entscheidungsfindung – selbst bei Ihren Alltagsentscheidungen – hilft.

Vielleicht bereiten Sie sich aber auch gerade auf eine Prüfung oder Abschlussklausur in Statistik vor und wollen in erster Linie nur üben, üben und vor allem üben. Wenn das so ist, dann haben Sie Glück, denn Sie halten gerade genau das richtige Buch in der Hand, da sich am Ende jedes Kapitels eine Vielzahl von Übungsaufgaben befindet. Kleine Tipps und Tricks sollen Ihnen dabei helfen, Aufgabenstellungen richtig zu verstehen und schnell und effizient zu bearbeiten. Dabei beschränkt sich das Buch auf die wichtigsten Konzepte und legt entsprechend einen klaren Schwerpunkt auf Übungsaufgaben, wie sie typischerweise auch in Prüfungen und Klausuren gestellt werden. Wenn Sie die Aufgaben in diesem Buch beherrschen und den Kern der Fragestellungen verstanden haben, sollten Sie in einer Prüfung oder Klausur keine bösen Überraschungen erleben.

Über dieses Buch

Während traditionelle statistische Lehrbücher mitunter doch etwas mathematisch-dröge daherkommen, wird Ihnen hier Statistik etwas anders präsentiert, und zwar:

in Form vieler interessanter Beispiele aus der Praxis

über leicht verständliche Darstellungen der grundlegenden statistischen Methoden (ohne langatmige, komplizierte Formelherleitungen)

anhand eingängiger Schritt-für-Schritt-Anleitungen zu den einzelnen Methoden, Formeln und dergleichen

mithilfe klar nachvollziehbarer Interpretationshilfen bei den einzelnen statistischen Konzepten – insbesondere um Fehlinterpretationen und damit auch falsche Schlussfolgerungen zu vermeiden (beziehungsweise auch um irreführende statistische Darlegungen in Publikationen zu erkennen)

um bei Ihnen den Drang, fundierte eigene statistische Analysen durchzuführen, durch die Art der Themenpräsentationen im vorliegenden Buch zu erzeugen beziehungsweise zu verstärken

mittels einer ganzen Menge an prüfungsrelevanten Aufgaben

Konventionen in diesem Buch

In diesem Buch werden zwei Konventionen verwendet, mit denen Sie sich vertraut machen sollten:

Definition der Stichprobengröße (

n

):

Wenn ich mich auf die Stichprobengröße beziehe, meine ich in der Regel die Anzahl der Personen, die als Teilnehmer an einer Umfrage, einer Studie oder einem Experiment ausgewählt wurden. (Die übliche Schreibweise für die Stichprobengröße ist

n

.) Angenommen, es wären 100 Personen als Teilnehmer für eine Umfrage ausgewählt worden, und nur 80 Personen hätten an der Umfrage tatsächlich teilgenommen. Wie groß wäre dann

n

: 100 oder 80? Nach meiner Konvention 80. Ich verwende die Anzahl der Personen, die tatsächlich teilgenommen haben beziehungsweise von denen es Rückläufer gibt. Diese Zahl fällt in der Regel kleiner aus als die Anzahl der Personen, die um eine Teilnahme gebeten wurden. Wenn Sie also auf die Formulierung »Stichprobengröße« stoßen, wissen Sie, dass es sich um die Anzahl der Personen handelt, die an der Studie auch tatsächlich teilgenommen und Daten bereitgestellt haben.

Doppelbedeutung des Begriffs »Statistik«:

Der Begriff »Statistik« umfasst sowohl den Forschungsgegenstand als auch statistische Studien. Wenn es um einzelne Kennwerte geht, wie zum Beispiel den (arithmetischen) Mittelwert, verwende ich den Begriff »statistische Größe«.

Törichte Annahmen über die Leser

Um dieses Buch ordentlich durcharbeiten und die Inhalte gut verstehen zu können, müssen Sie, liebe Leserinnen und Leser, gar nicht so viel Vorwissen mitbringen. Sie benötigen im Grunde genommen lediglich ein gewisses mathematisches Grundverständnis. Das heißt, dass Sie eigentlich nur die grundlegenden mathematischen Operationen (wie die Grundrechenarten: also ein bisschen Addieren, Subtrahieren, Multiplizieren und Dividieren) beherrschen müssen (oder gut mit Ihrem Taschenrechner umgehen können). Außerdem sollten Ihnen die grundlegenden Notationsweisen der Mathematik, wie zum Beispiel übliche Variablenbezeichnungen in der Form X oder Y beziehungsweise auch Summen-, Wurzelzeichen oder Ähnliches, zumindest ansatzweise bekannt beziehungsweise nicht zuwider sein. Sollten Sie an dieser Stelle noch gewisse Defizite haben, schauen Sie doch einfach mal in ein grundlegendes Mathe-Buch rein (es gibt da übrigens ganz hervorragende Dummies-Mathe-Bücher …).

Sie müssen nicht im Entferntesten mit Angst an die Lektüre dieses Buchs herangehen: Sie werden nämlich jeweils ganz langsam und sorgfältig durch die einzelnen Berechnungsschritte bei den verschiedenen statistischen Methoden geführt. Außerdem werden viele Beispiele und Aufgaben für Sie bereitgestellt, anhand derer Sie sich mit den gerade gefragten Berechnungen vertraut machen können. Schließlich ist es in der Statistik besonders wichtig, dass Sie sich die verschiedenen Verfahren durch »Learning by Doing« erschließen; das bringt zumindest einen höheren Mehrwert, als wenn Sie sich theoretisch-abstrakt mit den diversen Formeln und statistischen Ansätzen beschäftigen würden.

Sicherlich werden Sie schnell erkennen, dass weniger mathematische Fachkenntnisse zum Verständnis der Buchinhalte von Relevanz sind, sondern vielmehr die Fähigkeit, sich mit (scheinbaren) statistischen Rätseln durch logische Überlegungen auseinanderzusetzen. Üblicherweise hilft hierzu der berühmte »gesunde Menschenverstand« weiter, etwa wenn Sie – um ein kleines Beispiel zu geben – vor dem Problem stehen, ob im Rahmen der Wahrscheinlichkeitsrechnung das Eintreten eines bestimmten Ereignisses (wie beispielsweise der Diebstahl eines Autos) vom vorherigen Eintreten eines anderen Ereignisses oder mehrerer anderer Ereignisse (hier etwa, ob ein Auto über Nacht in einer Garage oder am Straßenrand abgestellt wurde) abhängen kann oder eher nicht.

Dieses Buch bietet sich vor allem für Studierende, aber durchaus auch für wissenschaftliche Mitarbeiter und dergleichen an Hochschulen (Universitäten, Fachhochschulen, Berufsakademien) oder in (Politik-)Beratungs- und Forschungsinstitutionen an. Darüber hinaus ist es aber auch für Praktiker geeignet. Schließlich werden wir alle tagtäglich mit vielfältigen Statistiken in Form von (absoluten) Zahlen, Prozentwerten, Diagrammen, Grafiken, »statistisch signifikanten« Ergebnissen, »wissenschaftlichen« Studien, Umfragen, Experimenten und so weiter konfrontiert. Alle genannten Personenkreise sollen durch dieses Buch mit den für Ihre Tätigkeiten wichtigen statistischen Zusatzkenntnissen ausgestattet werden.

Gerade durch die zahlreichen Übungsaufgaben (und deren ausführliche Lösungen) werden Sie sehr gut auf eine eventuell anstehende Statistik-Prüfung vorbereitet. Sie werden sehen, dass mit zunehmender Übung Ihr Interesse an Statistik wachsen wird! (Falls das ausnahmsweise nicht der Fall sein wird, sind Sie dann immerhin ordentlich in Bezug auf die Bearbeitung statistischer Fragestellungen in Ihrer beruflichen oder studentischen Praxis vorbereitet, was ja karrierefördernd sein kann.)

Wie dieses Buch aufgebaut ist

Dieses Buch ist in sieben Hauptteile gegliedert, die die Hauptthemen des Buchs ausführlich beschreiben, und in einen achten Teil, der als Kurzreferenz dient. Jeder Teil ist in einzelne Kapitel untergliedert, in denen die Themen in verständlichen Happen dargeboten werden.

Teil I: Mit Statistik den Alltag bewältigen

Dieser Teil macht Sie mit der Quantität und der Qualität von Statistiken vertraut, denen Sie tagtäglich an Ihrem Arbeitsplatz und auch anderswo begegnen. Sie werden feststellen, dass ein Großteil der statistischen Daten durch Zufall oder aber aufgrund von Designfehlern inkorrekt ist. Sie bewegen sich außerdem einen ersten Schritt in Richtung Statistik-Genie, indem Sie die Werkzeuge der Branche kennenlernen und einen Überblick über Statistik im Sinne der Beschäftigung mit dem Sammeln und Interpretieren von Daten entwickeln. Außerdem lernen Sie schon mal ein paar Ausdrücke aus dem Statistik-Jargon.

Teil II: Zahlenknacken leicht gemacht

Dieser Teil macht Sie vertraut mit der Darstellung von Daten, also mit Diagrammen, Tabellen und so weiter. Sie erhalten außerdem Tipps zur Interpretation der Diagramme und erfahren, woran Sie ein irreführendes Diagramm unmittelbar erkennen können. Sie lernen außerdem, wie Sie Daten mittels weitverbreiteter statistischer Methoden zusammenfassen.

Teil III: Gewinnchancen realistisch einschätzen

Dieser Teil deckt die Grundlagen der Wahrscheinlichkeitsrechnung ab. Sie erfahren, wie die Wahrscheinlichkeitsrechnung eingesetzt wird, was Sie darüber wissen müssen und worauf Sie sich beim Glücksspiel einlassen. Und was können Sie daraus lernen? Dass Wahrscheinlichkeit und Intuition nicht immer übereinstimmen.

Das Kapitel zeigt, wie Wahrscheinlichkeiten Ihren Alltag beeinflussen, und Sie lernen die Grundregeln der Wahrscheinlichkeitsrechnung kennen. Sie erfahren außerdem die Wahrheit über Glücksspiele, also wie Spielcasinos funktionieren und warum die Bank immer davon ausgehen kann, dass sie auf die Dauer gewinnt.

Teil IV: Mit Wahrscheinlichkeitsmodellen komplizierte Fragen schnell beantworten

In diesem Teil geht es um Verteilungen: Sie lernen die Binomialverteilung, die Normalverteilung und die t-Verteilung kennen sowie den zentralen Grenzwertsatz und Stichprobenverteilungen. Außerdem erfahren Sie, was eine Fehlergrenze ist.

Teil V: Wichtige Dinge schätzen

Dieser Teil konzentriert sich darauf, wie Sie gute Schätzungen für einen Bevölkerungsdurchschnitt oder einen Anteil an der Bevölkerung abgeben können, wenn Sie die Population selbst nicht kennen (zum Beispiel die durchschnittliche Stundenanzahl, die Erwachsene pro Woche vor dem Fernseher verbringen, oder der Prozentsatz der Bundesbürger, die mindestens einen Autoaufkleber auf dem Auto haben). Sie erfahren außerdem, wie Sie einen guten Schätzwert anhand einer relativ kleinen Stichprobe (gemessen an der Gesamtbevölkerung) finden können. Sie erhalten einen Überblick über Konfidenzintervalle, finden heraus, wofür sie eingesetzt werden, verstehen, wie sie gebildet werden, und erfahren auch noch die Wahrheit über die Grundelemente des Konfidenzintervalls (ein Schätzwert plus beziehungsweise minus einer Fehlergrenze). Sie beschäftigen sich außerdem mit den Faktoren, die die Größe eines Konfidenzintervalls beeinflussen (wie zum Beispiel die Stichprobengröße), und erkunden Formeln, schrittweise Berechnungen und Beispiele für diejenigen Konfidenzintervalle, die in der Praxis am häufigsten eingesetzt werden.

Teil VI: Mit Testen das kritische Denken fördern

In diesem Teil geht es um den Entscheidungsfindungsprozess und die große Rolle, die Statistik dabei spielt. Es wird gezeigt, wie Wissenschaftler ihre Thesen bilden und testen und wie Sie die Ergebnisse auswerten können, um sicherzugehen, dass die statistischen Daten korrekt sind und glaubwürdige Schlussfolgerungen zulassen. Sie gehen außerdem die einzelnen Berechnungsschritte durch, die üblicherweise eingesetzt werden, um Hypothesen zu testen und die Ergebnisse korrekt zu interpretieren.

Teil VII: Statistische Studien richtig ausschöpfen

Dieser Teil bietet Ihnen einen Überblick über Umfragen, Experimente, Verhaltensbeobachtungen und den Prozess der Qualitätskontrolle. Sie erfahren, wozu Studien dienen, wie sie durchgeführt werden, wo ihre Beschränkungen liegen und wie man sie so auswertet, dass die Ergebnisse überzeugend wirken. Daneben werden in diesem Teil auch noch bivariate Zusammenhänge, also die Zusammenhänge zwischen zwei Variablen, mittels der Methoden der Assoziations-/Korrelationsrechnung und der Regressionsanalyse näher behandelt.

Teil VIII: Der Top-Ten-Teil

Diese Schnellübersicht vermittelt Ihnen zehn Kriterien für gute Umfragen und zehn Möglichkeiten, die Wissenschaftler, Medien beziehungsweise Öffentlichkeit einsetzen, um Statistiken zu missbrauchen.

Anhang

Im Anhang finden Sie drei ganz wichtige Tabellen: die t-Verteilung, die Z-Verteilung und die Binomialverteilung.

Lösungen zu den Übungsaufgaben

Außerdem enthält das vorliegende Buch die Lösungen zu allen Übungsaufgaben der einzelnen Kapitel. Der Lösungsteil wurde bewusst an das Ende des Buchs gestellt, damit Sie bei der Beantwortung der einzelnen Übungsaufgaben eines Kapitels nicht zum schnellen »Spicken« bei den ansonsten nur ein paar Seiten hinter den Aufgaben stehenden Lösungen verleitet werden und sich somit besser (»ehrlicher«) auf eine Prüfung vorbereiten können.

Die Symbole in diesem Buch

In diesem Buch werden Symbole verwendet, um Ihre Aufmerksamkeit auf bestimmte Dinge zu lenken, die regelmäßig vorkommen:

Dieses Symbol kennzeichnet hilfreiche Informationen, Konzepte und Abkürzungen, mit denen Sie Zeit sparen können. Es werden außerdem Alternativen zu bestimmten Konzepten hervorgehoben.

Dieses Symbol ist für besonders wichtige Konzepte reserviert, die Sie sich hoffentlich noch lange merken, nachdem Sie dieses Buch gelesen haben.

Dieses Symbol bezieht sich auf spezielle Möglichkeiten, die Wissenschaftler oder die Medien nutzen, um Sie mit Statistiken irrezuführen, und Sie erfahren, was Sie dagegen tun können.

Dieses Symbol ist ein sicherer Tipp, wenn Sie spezielle Interessen an den eher technischen Aspekten der Statistik haben. Sie können dieses Symbol übergehen, falls Sie nicht tiefer in die Details einsteigen möchten.

Dieses Symbol kennzeichnet Beispiele, die der näheren Erläuterung des Stoffs dienen – über die zahlreichen Übungsaufgaben dieses Buchs hinaus.

Wie geht es weiter?

Viele (Statistik-)Lehrbücher sind so geschrieben, dass Sie sich von der ersten bis zur letzten Seite durchquälen und dabei auch einige eher nicht so interessante Themen durcharbeiten müssen. Das ist bei diesem Buch ganz anders: Hier können Sie an jeder beliebigen Stelle einsteigen, und Sie sind sofort in der jeweiligen Thematik drin. Werfen Sie also einen Blick auf das Inhaltsverzeichnis oder den Index, suchen Sie nach Themen, die Sie interessieren, und gehen Sie zur entsprechenden Seite.

Falls Sie nicht genau wissen, wo Sie loslegen sollen, können Sie natürlich aber auch bei Kapitel 1 beginnen und das Buch von vorn bis hinten durchlesen (was bei Büchern ja generell keine schlechte Idee ist).

Das nun folgende Kapitel 1 zeigt Ihnen kurz und knapp, worum es bei statistischen Verfahren grundsätzlich geht und wie Sie erfolgreich im Alltag, im Beruf, im Studium und so weiter mit Statistik umgehen.

Teil I

Mit Statistik den Alltag bewältigen

IN DIESEM TEIL …

Wie Statistik Ihren Alltag und Ihr Berufsleben beeinflusstWie mangelhaft die Daten häufig sindWas Sie gegen mangelhafte Daten unternehmen könnenWerden Sie mit nützlichem Fachjargon aus der Statistik vertraut gemacht

Kapitel 1

Statistik kurz und knapp

IN DIESEM KAPITEL

Worum es bei statistischen Verfahren überhaupt gehtErfolgreich mit Statistik umgehen – im Alltag, im Beruf oder im Studium

Die heutige Welt ist so mit Zahlen überfrachtet, dass wir (auch ich!) davon geradezu überwältigt werden. Wenn Sie gegenüber den Statistiken, die Ihnen in den Medien begegnen, eine zynische Grundhaltung entwickelt haben, kann ich Ihnen keinen Vorwurf machen – manchmal geht es mir da auch nicht anders. Aber auch wenn da draußen jede Menge irreführende und falsche Informationen auf Sie warten, gibt es doch jede Menge statistische Arbeiten, die zu kennen sich lohnt. Viele Studien und Verfahren, die mit Daten umgehen, tragen zur Verbesserung unser aller Lebensqualität bei. Ihre Aufgabe besteht nun darin, die verlässlichen von den irreführenden Methoden und Ergebnissen zu unterscheiden – und zwar im Vertrauen auf Ihre eigenen Fähigkeiten. Wenn Sie Statistik und statistische Verfahren wirklich verstehen, verschaffen Sie sich die nötige Sicherheit, die Sie für den gewinnbringenden Umgang mit Zahlen in Alltag, Beruf und Studium brauchen. Genau darum geht es in diesem Buch.

In diesem Kapitel zeige ich auf, welche Rolle die Statistik in unserer heutigen datenlastigen Gesellschaft spielt und was Sie tun können, um in dieser Datenflut nicht nur nicht unterzugehen, sondern sie sogar für sich zu nutzen. Ich nehme Sie mit in die Welt der wissenschaftlichen Anwendung der Statistik und zeige Ihnen, wie man sinnvolle Studien konzipiert, verlässliche Daten erhebt, Informationen analysiert, Ergebnisse interpretiert und daraus eigene Schlüsse zieht. (Und Sie dachten schon, Statistik wäre ein reines Zahlenwerk!)

Statistiken verstehen und nutzen

Unser Alltag wird geradezu überflutet von Statistiken der unterschiedlichsten Art, die wir gar nicht immer als solche wahrnehmen. Das fängt schon an, wenn Sie morgens das Radio einschalten (oder die Zeitung aufschlagen oder sich im Internet informieren) und dort die Wettervorhersage hören (oder lesen) – denn die beruht auf der statistischen Analyse früherer (meteorologischer) Daten und der aktuellen Wetterbedingungen. Am Frühstückstisch lesen Sie vielleicht auf der Müslipackung, welche Anteile von Kohlehydraten, Proteinen und Fett Ihr Morgenmahl hat. Im Büro schlagen Sie Zahlen in Diagrammen und Tabellen nach, tragen Daten in eine Tabellenkalkulation ein, führen eine Diagnose oder Messungen durch, berechnen Werte, schätzen Kosten, treffen Entscheidungen auf der Grundlage statistischer Werte oder arrangieren Ihr Inventar anhand der Verkaufszahlen des Vormonats.

Wenn Sie Glück haben, nehmen Sie Ihr Mittagessen in einem Restaurant ein, das von 500 befragten Personen zur Nr. 1 erkoren wurde. Was Sie dort für Ihr Essen bezahlen, hängt von Marktdaten ab. Nachmittags haben Sie einen Arzttermin, bei dem Ihr Blutdruck gemessen, Körpergewicht und Körpergröße festgestellt und Blutuntersuchungen durchgeführt werden. Wenn alle Informationen beisammen sind, erhalten Sie einen Bericht, der Ihre Werte mit denen der statistischen Norm vergleicht.

Sie fahren nach Hause in einem Auto, bei dessen Wartung heutzutage in der Regel ein Computer für eine statistische Diagnostik zum Einsatz kam. Zu Hause schalten Sie noch mal die Nachrichten ein, hören die neuesten Statistiken zu Wohnungseinbrüchen und Autodiebstählen, verfolgen die Entwicklung der Börsenkurse und erfahren, wie viele Menschen bei einem bestimmten DFB-Pokalspiel im Stadion waren.

Abends putzen Sie sich die Zähne mit einer Zahnpasta, die statistisch erwiesenermaßen gegen Karies wirkt, lesen noch ein paar Seiten in einem Spiegel-Beststeller (der aufgrund von statistischen Verkaufszahlen auf der Liste gelandet ist), schlafen ein – und am nächsten Morgen geht alles wieder von vorne los. Aber wie können Sie sicher sein, dass alle diese Statistiken, auf die Sie sich täglich verlassen, auch korrekt sind? In Kapitel 2 befasse ich mich ausführlicher mit einigen Beispielen dafür, welche Rolle Statistik in unserem Alltag und am Arbeitsplatz spielt, welche Auswirkungen sie hat und wie Sie Ihre Wahrnehmung für Statistik schärfen können.

Manche Statistiken sind vage, ungeeignet oder schlicht und einfach falsch. Deshalb müssen Sie Ihre Wahrnehmung für Statistik im Alltag schärfen. Sie können üben, Statistiken bewusster wahrzunehmen und sich die Informationen genauer anzusehen, Fragen zu stellen und eine gesunde Skepsis zu entwickeln. In Kapitel 3 erfahren Sie, wie schlechte Statistiken Sie in die Irre führen können und wie Sie sich die nötigen Fähigkeiten aneignen, um kritisch zu denken und Probleme zu erkennen, anstatt einfach die Ergebnisse für bare Münze zu nehmen.

Wie alle anderen Fachgebiete hat auch die Statistik eine eigene Fachsprache (manchmal auch etwas lieblos Jargon genannt). In Kapitel 4 erkläre ich kurz einige der am häufigsten gebrauchten statistischen Fachbegriffe. Wenn Sie sich mit dieser Fachsprache vertraut machen, anstatt sich von ihr einschüchtern zu lassen, können Sie Statistik auf einem höheren Niveau verstehen und darüber sprechen. Sie gewinnen an Glaubwürdigkeit, wenn Sie die richtigen Ausdrücke verwenden, um zu beschreiben, warum genau ein bestimmtes statistisches Ergebnis falsch ist. Wenn Sie in Ihren Präsentationen statistische Tabellen, Diagramme und Analysen einsetzen, werden diese durch die richtige Fachsprache effektiver und informativer. (Und wenn Sie das alles nicht überzeugt: Sie müssen die Fachausdrücke schon deshalb lernen, weil ich sie im ganzen Buch verwende, auch wenn ich sie mehrfach erkläre.)

In den nächsten Abschnitten erfahren Sie, in welcher Form Statistik an den einzelnen Phasen der wissenschaftlichen Methodik beteiligt ist.

Aussagekräftige Studien konzipieren

Fragen haben alle – pharmazeutische Unternehmen und Biologen genauso wie Marktforscher, Politiker allgemein oder speziell die Regierung. Zur Beantwortung dieser Fragen brauchen all diese Personengruppen am Ende die Statistik. Insbesondere viele medizinische und psychologische Studien werden durchgeführt, weil bestimmte Menschen auf der Suche nach einer Antwort auf drängende Fragen sind. Beispiele gefällig?

Kann dieser Impfstoff den Ausbruch der Grippe verhindern?

Wie schätzen die Bundesbürger die aktuelle wirtschaftliche Lage des Landes ein?

Führt eine intensive Nutzung sozialer Netze im Internet bei Jugendlichen zu Depressionen?

Wenn eine Forschungsfrage formuliert wurde, besteht der erste Schritt zu ihrer Beantwortung darin, eine aussagekräftige Studie zu planen, um die benötigten Daten zu erheben. Das bedeutet, dass man sich überlegen muss, mit welchen Verfahren man diese Daten gewinnen kann. In diesem Abschnitt gebe ich Ihnen einen kleinen Überblick über die beiden wesentlichen Grundformen von Studien, nämlich Umfragen (auch als Befragungen bezeichnet) und Experimente (auch als Versuche bezeichnet). Außerdem erkläre ich, warum es wichtig ist, die Anlage (das heißt: die Konzeption) einer Studie zu prüfen, bevor man deren Ergebnissen traut.

Umfragen

Eine Beobachtungsstudie ist eine Studie, in der Daten von Individuen erhoben werden, ohne Einfluss auf diese zu nehmen. Die häufigste Beobachtungsstudie ist die Umfrage. Bei einer Umfrage (oder Befragung) werden Personen, die aus einer interessierenden Grundgesamtheit ausgewählt wurden, mittels eines Fragebogens befragt. Diese Befragung kann auf vielfältige Weise erfolgen: Sie können gedruckte Fragebögen verwenden, die per Post verschickt werden, Umfragen ins Internet stellen, über das Fernsehen die Zuschauer zur telefonischen Beantwortung einer Frage aufrufen, Personen gezielt telefonisch ansprechen und vieles Weitere mehr.

Eine korrekt durchgeführte Umfrage kann ein sehr nützliches Instrument dafür sein, an Informationen zu kommen. Werden Umfragen jedoch nicht ordentlich durchgeführt, kann dabei auch einfach nur Quatsch herauskommen. Mögliche Probleme liegen in den Formulierungen der Fragen, die irreführend sein können, in der Verweigerung der Teilnahme ausgewählter Personen oder im Übersehen ganzer Gruppen der Grundgesamtheit bei der Auswahl der zu Befragenden. Aufgrund solcher möglichen Fehlerquellen muss eine Umfrage immer sehr sorgfältig geplant werden.

Viele Wissenschaftler betreiben einen enormen Aufwand, auch finanzieller Art, um gute Umfragen durchzuführen. Das können Sie merken (anhand von Kriterien, die ich Ihnen noch vorstelle). Da Ihnen aber in den Medien, am Arbeitsplatz und auch im Studium so viele verschiedene Arten von Umfragen begegnen, müssen Sie in der Lage sein, schnell prüfen beziehungsweise beurteilen zu können, wie eine Studie konzipiert und durchgeführt wurde, damit Sie sachkundig auf mögliche Probleme hinweisen können. Die Instrumente, die Sie brauchen, um Befragungen zu beurteilen, finden Sie in Kapitel 16.

Experimente

Bei einem Experiment werden die beobachteten Individuen einer oder mehrerer Untersuchungen (»Behandlungen«) unterzogen, die eindeutige Vergleiche zwischen den Personen(gruppen) erlauben. Dabei werden die jeweiligen Ergebnisse aufgezeichnet. Wenn man beispielsweise prüfen möchte, ob ein Medikament sich auf den Blutdruck auswirkt, lässt man vielleicht eine Gruppe 10 mg des Medikaments nehmen und eine weitere Gruppe 20 mg. Häufig wird auch eine Kontrollgruppe eingesetzt, in der die teilnehmenden Personen ein Scheinmedikament (als Placebo bezeichnet) erhalten oder ein bereits zugelassenes Medikament gegen dieselbe Krankheit.

Gute und glaubwürdige Experimente sind so angelegt, dass mögliche Verzerrungen (auch als systematischer Fehler oder Bias bezeichnet) minimiert werden, dass viele verlässliche Daten erhoben und geeignete Vergleiche (von Behandlungs- und Kontrollgruppe) angestellt werden können. Mögliche Probleme bei Experimenten ergeben sich, wenn Wissenschaftler oder teilnehmende Personen wissen, welche Behandlung angewendet wurde beziehungsweise welche Behandlung sie erhalten haben, wenn Faktoren, die sich auf das Ergebnis auswirken, nicht berücksichtigt werden (beispielsweise das Körpergewicht bei Untersuchungen zur Medikamentendosierung) oder wenn eine Kontrollgruppe fehlt (sodass man die Ergebnisse nicht mit einem Ausgangswert ohne Behandlung vergleichen kann).

Gut aufgebaute Experimente können jedoch dazu beitragen, eine Ursache-Wirkung-Beziehung zu erkennen, wenn der Unterschied in den Ergebnissen zwischen der Behandlungsgruppe und der Kontrollgruppe statistisch signifikant ist (also mit einer gewissen Wahrscheinlichkeit nicht nur zufällig beobachtet wurde).

Experimente können zur Entwicklung und Prüfung von Arzneimitteln herangezogen oder verwendet werden, um herauszufinden, wie man Nahrungsmittel am besten herstellt und zubereitet, und auch, um festzustellen, ob eine neue Behandlung eine Krankheit heilen oder lindern kann. Zweifellos hat sich unsere Lebensqualität durch gut geplante und durchgeführte Experimente verbessert. Aber nicht alle Experimente sind gut geplant, und es ist wichtig, dass Sie lernen zu erkennen, welche Ergebnisse glaubwürdig sind und welche nicht. Das gilt besonders für Fragen, die Ihnen wichtig sind. Was Sie über Experimente wissen müssen und wie Sie sie beurteilen können, lernen Sie in Kapitel 17.

Erheben von brauchbaren Daten

Nachdem eine Studie, also eine Umfrage oder ein Experiment, geplant wurde, müssen die teilnehmenden Personen ausgewählt und ein Verfahren entwickelt werden, um die Daten zu erheben. Diese Phase ist ganz entscheidend dafür, ob am Ende glaubwürdige, brauchbare Daten vorliegen. In diesem Abschnitt erkläre ich, worauf es besonders ankommt.

Auswahl einer guten Stichprobe

In der Statistik gilt ganz besonders, was Sie auch aus anderen Bereichen kennen: Ein Ergebnis kann nur so gut sein, wie es die Ausgangsbedingungen erlauben. Wenn Sie schon bei der Auswahl Ihrer Teilnehmer eine Verzerrung einführen, also bestimmte Personen oder Gruppen bevorzugen, dann werden auch Ihre Ergebnisse verzerrt sein. So einfach ist das.

Angenommen, Adrian möchte wissen, was die Menschen in seiner Heimatstadt über die Eröffnung einer Spielbank denken. Er geht ins größte Einkaufszentrum oder Kaufhaus der Stadt, nimmt sein Klemmbrett für Notizen mit und fragt die Leute, die an ihm vorbeikommen, nach ihrer Meinung dazu. Was macht er falsch? Adrian wird auf diese Weise nur die Meinung von Menschen erfahren, die a) in diesem Einkaufszentrum oder Kaufhaus einkaufen, und zwar b) nur an diesem einen Tag und c) nur zu der Zeit, zu der er dort ist, und die d) auch noch Lust haben, ihm zu antworten.

Das sind sehr viele Einschränkungen, die dazu führen, dass die Befragten nicht repräsentativ für alle Menschen in der Stadt sind. Adrian könnte auch eine Webseite ins Netz stellen und dort Menschen auffordern, über die neue Spielbank abzustimmen. Dann stützt sich aber sein Ergebnis nur auf Menschen, die von seiner Webseite wissen, Internetzugang haben und bereit sind, zu antworten. Erfahrungsgemäß sind das nur Personen, die ein ausgeprägtes Interesse an der Frage haben. Am Ende hat Adrian dann eine Menge verzerrter Daten von Personen, die nicht stellvertretend für die ganze Stadt sind.

Das Schlüsselwort für die Vermeidung von Verzerrungen ist »zufällig«. Sie müssen Ihre Stichprobe von Personen zufällig auswählen – also so, als ob Sie Namen aus einem Hut ziehen (ohne in den Hut hineinzuschauen, am besten mit verbundenen Augen). In der Wissenschaft gibt es verschiedene Methoden, um Personen zufällig auszuwählen, die Sie in Kapitel 16 kennenlernen werden.

Wenn Sie ein Experiment planen, ist die zufällige Auswahl von Teilnehmern oft ethisch nicht vertretbar, da bei einem Experiment die teilnehmenden Personen in der Regel einer Behandlung unterzogen werden. Daher geht man anders vor: Man sucht sich Freiwillige für die Teilnahme, die repräsentativ für die zu untersuchende Grundgesamtheit sind, und sorgt dafür, dass die Daten so erhoben werden, dass sich die Ergebnisse auf eine größere Gruppe übertragen lassen. Wie das geht, erfahren Sie in Kapitel 17.

Wenn Sie die Kapitel 16 und 17 durchgearbeitet haben, wissen Sie, wie Sie die von anderen angewandten Methoden zur Auswahl der jeweiligen Stichproben genau prüfen können, und Sie können sogar Ihren eigenen Plan für eine Stichprobenziehung erstellen. Sie wissen dann, ob vorliegende Ergebnisse unbrauchbar sind, weil die Studie einfach nicht gut geplant und durchgeführt wurde.

Verzerrungen in den Daten vermeiden

Als Verzerrung, systematischen Fehler oder auf Neudeutsch Bias (sprich Bei-ess) bezeichnet man die systematische Bevorzugung bestimmter Personen oder Antworten. Die Verzerrung ist der Erzfeind aller Statistikerinnen und Statistiker, und diese werden alles tun, um sie zu vermeiden. Sie brauchen ein Beispiel? Angenommen, Sie führen eine telefonische Umfrage zur Zufriedenheit am Arbeitsplatz durch. Wenn Sie dafür Menschen zu Hause anrufen, und zwar zwischen 9 und 17 Uhr, bekommen Sie keine Antworten von Personen, die tagsüber arbeiten (oder nur von solchen, die in Heimarbeit tätig sind). Es ist aber denkbar, dass Menschen, die tagsüber auf der Arbeit sind, zufriedener sind als Menschen, die in Nachtschichten arbeiten.

Auch bei der eigentlichen Erhebung von Daten mittels Umfragen müssen Sie auf Verzerrungen achten. Ein Beispiel: Manche Fragebögen sind einfach zu lang. Was passiert, wenn jemand die Befragung nach der Hälfte abbricht? Oder wie gehen Sie damit um, wenn Ihnen jemand falsche Auskünfte erteilt, also beispielsweise angibt, 5.000 Euro im Monat zu verdienen, obwohl es in Wirklichkeit nur 2.500 Euro sind? Und was machen Sie, wenn Sie eine Antwort bekommen, die in Ihrer Liste möglicher Antworten gar nicht enthalten ist? Bei der Erhebung von Daten mittels Befragungen können jede Menge Probleme auftreten, die Sie erkennen müssen.

Hinsichtlich möglicher Verzerrungen und der Datenerhebung sind Experimente manchmal noch schwieriger durchzuführen als Befragungen. Angenommen, Sie möchten den Blutdruck untersuchen. Was tun Sie, wenn mitten in Ihrer Studie Ihr Blutdruckmessgerät kaputt geht? Was passiert, wenn jemand die Messung vorzeitig abbrechen möchte? Wie gehen Sie damit um, wenn während des Experiments die teilnehmenden oder die untersuchenden Personen abgelenkt werden? Oder wenn eine Blutuntersuchung genau eine Stunde nach der Einnahme eines Medikaments erfolgen muss, aber keine Vene für die Blutentnahme zugänglich ist? Das sind nur ein paar Beispiele dafür, was alles schiefgehen kann, wenn Sie Daten für Experimente erheben. Auf so etwas müssen Sie sich einstellen, und wenn solche Probleme auftreten, müssen Sie sie erkennen.

Nachdem Sie Kapitel 16 (zu Stichproben und Umfragen) und Kapitel 17 (zu Experimenten) durchgearbeitet haben, sollten Sie in der Lage sein, unverzerrte Stichproben auszuwählen und Daten ohne Verzerrung zu erheben, sowie ein Gespür dafür entwickeln, wie sich vermeintliche Kleinigkeiten nachhaltig auf Ergebnisse auswirken können. Außerdem können Sie dann die Glaubwürdigkeit statistischer Ergebnisse beurteilen und sich überzeugend dazu äußern, da Sie wissen, wovon Sie reden.

Sinnvolle Zusammenfassungen erstellen

Nachdem verlässliche Daten erhoben wurden, besteht der nächste Schritt darin, diese sinnvoll zusammenzufassen, um sich einen Überblick zu verschaffen. In der Statistik gibt es dazu zwei wichtige Verfahren: Zahlen und Bilder (also Diagramme und Schaubilder).

Beschreibende Statistik

Als beschreibende Statistik bezeichnet man in erster Linie Zahlen, die einen Datensatz oder eine Menge von Daten mit deren wichtigen Merkmalen beschreiben:

Wenn es sich um kategoriale Daten handelt (für die Personen in Gruppen eingeteilt werden, beispielsweise nach Geschlecht oder Parteizugehörigkeit), werden diese üblicherweise mit der Anzahl der Individuen pro Gruppe (als

Häufigkeit

bezeichnet) oder dem prozentualen Anteil der Individuen pro Gruppe (als

relative Häufigkeit

bezeichnet) zusammengefasst.

Numerische Daten stehen für Messungen oder Zählwerte, bei denen die Zahlen eine numerische Bedeutung haben (wie Körpergröße und Körpergewicht). Bei numerischen Daten kann mehr als die Anzahl oder der prozentuale Anteil zusammengefasst werden. Dazu gehören unter anderem:

Maße für die Mitte (die angeben, wo sich der »Mittelpunkt« der Daten befindet)

Maße für die Streuung (die angeben, wie unterschiedlich die Daten sind oder wie nah sie am Mittelwert liegen)

gegebenenfalls auch Zahlen, die die Beziehung zwischen zwei Variablen angeben (wie Körpergröße und Körpergewicht)

Manche Größen der beschreibenden Statistik sind in bestimmten Situationen geeigneter als andere. Häufig ist das arithmetische Mittel nicht das beste Maß für die Mitte eines Datensatzes, sondern eher der Median. Auch ist die Standardabweichung nicht das einzige Maß für Variabilität, der Interquartilsabstand hat ebenfalls seine guten Seiten. Sie müssen die verschiedenen Kenngrößen der beschreibenden Statistik kennen sowie sie interpretieren und bewerten können, die Ihnen täglich begegnen, und auch wissen, in welchen Fällen (beziehungsweise bei welchen Fragestellungen) eine andere als die angegebene Größe besser wäre.

Die häufigsten Größen der beschreibenden Statistik werden in Kapitel 5 berechnet, interpretiert, verglichen und bewertet. Dazu zählen für kategoriale Daten absolute Häufigkeiten und relative Häufigkeiten (Anzahlen und Prozente) sowie Durchschnittswert (arithmetisches Mittel), Median, Standardabweichung, Perzentile für numerische Daten.

Mit einem lateinischen Fremdwort bezeichnet man die beschreibende Statistik auch manchmal als deskriptive Statistik. Von ihr unterscheidet man üblicherweise die schließende Statistik, die auch induktive Statistik genannt wird. Bei der induktiven Statistik geht es um den Schluss von Stichprobenergebnissen auf die Gesamtpopulation, die Grundgesamtheit, mithilfe der Methoden der Wahrscheinlichkeitsrechnung.

Diagramme und Schaubilder

In Diagrammen und Schaubildern werden Daten grafisch zusammengefasst. Sie sind so organisiert, dass sie Ihnen entweder blitzschnell einen groben Überblick über die Daten vermitteln oder ein bestimmtes Ergebnis genauer darstellen. In unserer Welt mit ihren schnellen Infos und superkurzen O-Tönen sind Diagramme und Schaubilder sehr beliebt. Die meisten davon stellen deutlich, fair und sinnvoll dar, was ausgesagt werden soll. Allerdings gibt es auch Beispiele, in denen etwas zu viel künstlerische Freiheit am Werk ist, was dann zu irreführenden oder einfach falschen Diagrammen und Schaubildern führt.

In Kapitel 4 stelle ich die wichtigsten Arten von Diagrammen und Schaubildern für die Zusammenfassung von kategorialen oder numerischen Daten vor. Sie erfahren dort, wie man diese Grafiken erstellt, welchem Zweck sie dienen und wie man sie interpretiert. Außerdem zeige ich Ihnen, in welch vielfältiger Weise Diagramme und Schaubilder irreführend sein können und wie Sie mögliche Probleme schnell erkennen. Sie sollten in diesen Problemfällen stutzig werden und auch benennen können, was Ihr Misstrauen erregt hat. Ein paar Beispiele:

Einige der einfacheren Darstellungen für kategoriale Daten sind Tortendiagramme und Balkendiagramme, die eine Variable in ihre Bestandteile aufteilen, beispielsweise das Geschlecht oder die Apps, die Jugendliche auf ihren Smartphones haben. So kann ein Balkendiagramm beispielsweise Meinungen in Gestalt von fünf Balken abbilden, die von »stimme überhaupt nicht zu« bis »stimme vollkommen zu« reichen. In Kapitel 6 finden Sie alle wichtigen Infos dazu, wie Sie diese Diagramme erstellen, interpretieren und, noch wichtiger, prüfen, ob sie der dargestellten Sache gerecht werden. Sie werden sich wahrscheinlich wundern, was man bei einem einfachen Balkendiagramm alles falsch machen kann.Für numerische Daten wie Größe, Gewicht, Zeit oder Mengen braucht man andere Arten von Diagrammen. Zu ihrer Zusammenfassung werden Histogramme und Box-Plots verwendet, die sehr informativ sein und Datenmengen wunderbar zutreffend abbilden können. Aber natürlich können auch diese Darstellungen irreführend sein – aus Unkenntnis oder sogar mit Absicht. (Die Hintergründe dazu finden Sie in Kapitel 7.)

Diagramme und Schaubilder begegnen Ihnen tagtäglich – schlagen Sie einfach eine Zeitung auf, und Sie werden mühelos mehrere davon finden. Schauen Sie mit Ihren Statistikkenntnissen im Hinterkopf genau hin, um irreführende Darstellungen zu erkennen, bevor Sie sich zu vorschnell zu Meinungen oder Handlungen hinreißen lassen.

Verteilungen bestimmen

Eine Variable ist ein Merkmal, das gezählt, gemessen oder kategorisiert wird. Beispiele für Variablen sind Geschlecht, Alter, Körpergröße, Körpergewicht und die Zahl der Haustiere, die jemand sich hält. Eine Verteilung ist eine Auflistung der möglichen Werte einer Variablen (oder Intervalle von Werten) zusammen mit der Angabe, wie häufig (oder mit welcher Dichte) diese auftreten. Das Geschlecht unter Neugeborenen in Deutschland verteilte sich beispielsweise 2018 auf 51,3 % männliche und 48,7 % weibliche Kinder.

Für verschiedene Arten von Variablen gibt es auch verschiedene Verteilungen. In Einführungskursen in die Statistik werden die folgenden drei am häufigsten behandelt, die auch im wahren Leben viele Anwendungen haben:

Eine Variable, die die Anzahl der Erfolge bei einer bestimmten Zahl von Versuchen misst (beispielsweise die Anzahl der Menschen, die nach Einnahme eines bestimmten Medikaments gesund wurden), hat eine Binomialverteilung.Eine Variable, die Werte annimmt, die sich anhand einer sogenannten Glockenkurve verteilen, wie die Noten in Klassenarbeiten, hat eine Normalverteilung.Eine Variable, die auf den Mittelwerten von Stichproben beruht und für die Sie nur wenige Daten haben, wie beispielsweise zehn Teilnehmer in einer Studie zu einem Gewichtsabnahme-Programm, sollten Sie sinnvollerweise mit einer t-Verteilung beschreiben.

Grundsätzlich kann man Variablen in qualitative (kategoriale) und in quantitative (numerische) Variablen unterscheiden, je nachdem, ob es sich um kategoriale oder um numerische Daten handelt. Bei einer qualitativen Variablen sind sozusagen Wörter die Ausprägungen, zum Beispiel bei der Variablen »Geschlecht« die Wörter »Weiblich«, »Männlich« und »Divers«. Demgegenüber sind bei quantitativen Variablen Zahlen die jeweiligen Ausprägungen. Hierbei können die Ausprägungen ganzzahlig sein (wie zum Beispiel bei der Anzahl der Autos, die in einem Fuhrpark stehen); dann spricht man von einer diskreten Variablen. Können hingegen bei einer quantitativen Variablen auch Nachkommastellen bei den Variablenausprägungen vorkommen – streng genommen: sind die betreffenden Ausprägungen grundsätzlich beliebig unterteilbar –, spricht man präzisierend davon, dass diese Variable stetig (kontinuierlich) sei (Beispiel: das Körpergewicht eines Menschen, etwa 80,256789987… kg).

In Bezug auf Verteilungen müssen Sie herausfinden, welche Verteilung eine bestimmte Variable hat, wie Sie – über die Häufigkeitsfragestellung hinausgehend – Wahrscheinlichkeiten bestimmen und wie Sie feststellen, was der (arithmetische) Mittelwert und die Standardabweichung der Ergebnisse über einen langen Zeitraum wären. (Wenn im Übrigen im Buch verkürzend nur von »Mittelwert« die Rede ist, ist damit das arithmetische Mittel, also der Durchschnittswert, gemeint.) Damit Sie sich diese Kenntnisse erarbeiten können, habe ich gleich drei Kapitel für Sie geschrieben, nämlich eines pro genannte Verteilung: Kapitel 8 widmet sich der Binomialverteilung, Kapitel 9 der Normalverteilung und Kapitel 10 der t-Verteilung.

Falls Sie gerade einen Einführungskurs in Statistik besuchen (oder überhaupt einen Statistikkurs), wissen Sie schon, dass zu den schwierigsten Inhalten die Stichprobenverteilung und der zentrale Grenzwertsatz gehören (zwischen denen ein enger Zusammenhang besteht). Kapitel 11 führt Sie Schritt für Schritt durch diese Themen. Sie verstehen dann, was eine Stichprobenverteilung ist, wofür man sie braucht und wie sie die Grundlage für Datenanalysen in Gestalt von Hypothesentests und Konfidenzintervallen bildet (mit der Datenanalyse befasst sich der nächste Abschnitt noch genauer). Wenn Sie den zentralen Grenzwertsatz verstehen, können Sie auch schwierige Aufgaben wesentlich einfacher lösen. Die Grundlagen für dieses Verständnis liefert Ihnen, wie erwähnt, Kapitel 11.