Übungsbuch Statistik für Dummies - Deborah J. Rumsey - E-Book

Übungsbuch Statistik für Dummies E-Book

Deborah J. Rumsey

0,0
17,99 €

-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.
Mehr erfahren.
Beschreibung

Übung macht den Statistiker

Haben Sie Probleme mit Statistik und sehen weder Anfang noch Ende? Da hilft nur üben, üben, üben. Aber keine Sorge! Dieses Buch zeigt Ihnen mit vielen Beispielen und Schritt-für-Schritt-Lösungswegen, wie Sie verschiedene Aufgabenstellungen richtig angehen. Von arithmetischem Mittel über Normalverteilung bis Konfidenzintervall und Wahrscheinlichkeitsrechnung sind alle wichtigen Themengebiete vertreten. Dank einer kurzen Wiederholung der Grundlagen und Hunderten Übungen können Sie der Statistik schon bald furchtlos gegenübertreten. Viel Spaß beim Üben!

Sie erfahren

  • Wie Sie Daten gekonnt analysieren und interpretieren
  • Was die Fehlergrenze ist und wie Sie sie berechnen
  • Wie Hypothesentests funktionieren und was der p-Wert eigentlich misst
  • Was Korrelation und Regression bedeuten

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern

Seitenzahl: 569

Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Übungsbuch Statistik für Dummies

Schummelseite

STANDARDWERTE UND PERZENTILE DER STANDARDNORMALVERTEILUNG (Z-VERTEILUNG)

Standardwert

Perzentil

Standardwert

Perzentil

Standardwert

Perzentil

−3,4

 0,03%

−1,1

13,57%

1,2

88,49%

−3,3

 0,05%

−1,0

15,87%

1,3

90,32%

−3,2

 0,07%

−0,9

18,41%

1,4

91,92%

−3,1

 0,10%

−0,8

21,19%

1,5

93,32%

−3,0

 0,13%

−0,7

24,20%

1,6

94,52%

−2,9

 0,19%

−0,6

27,42%

1,7

95,54%

−2,8

 0,26%

−0,5

30,85%

1,8

96,41%

−2,7

 0,35%

−0,4

34,46%

1,9

97,13%

−2,6

 0,47%

−0,3

38,21%

2,0

97,73%

−2,5

 0,62%

−0,2

42,07%

2,1

98,21%

−2,4

 0,82%

−0,1

46,02%

2,2

98,61%

−2,3

 1,07%

 0,0

50,00%

2,3

98,93%

−2,2

 1,39%

 0,1

53,98%

2,4

99,18%

−2,1

 1,79%

 0,2

57,93%

2,5

99,38%

−2,0

 2,27%

 0,3

61,79%

2,6

99,53%

−1,9

 2,87%

 0,4

65,54%

2,7

99,65%

−1,8

 3,59%

 0,5

69,15%

2,8

99,74%

−1,7

 4,46%

 0,6

72,58%

2,9

99,81%

−1,6

 5,48%

 0,7

75,80%

3,0

99,87%

−1,5

 6,68%

 0,8

78,81%

3,1

99,90%

−1,4

 8,08%

 0,9

81,59%

3,2

99,93%

−1,3

 9,68%

 1,0

84,13%

3,3

99,95%

−1,2

11,51%

 1,1

86,43%

3,4

99,97%

TIPPS FÜR DIE LÖSUNG VON STATISTIK-AUFGABEN

Die Aufgaben in einer Statistik-Klausur können einen auch nach der besten Vorbereitung leicht aus dem Konzept bringen – insbesondere wenn der Prüfer den Kern der Aufgabenstellung hinter ungewohnten, ausschweifenden Formulierungen versteckt. Sie sollten ganz ruhig bleiben, die Aufgabenstellung analysieren und einen Lösungsweg erarbeiten:

Lesen Sie die Aufgabenstellung sorgfältig durch.Überlegen Sie, mit welchem statistischen Testansatz die Aufgabenstellung zu lösen ist.Schreiben Sie sich die Formel auf, mit der Sie den statistischen Test durchführen, und erstellen Sie eine Liste der Werte, die Sie in die Formel einsetzen müssen.Prüfen Sie, ob Ihnen alle Werte, die Sie für die Formel benötigen, bereits aus der Aufgabenstellung vorliegen.Dokumentieren Sie bei der Lösung der Aufgabe die einzelnen Schritte.Wenn Sie ein Ergebnis berechnet haben, prüfen Sie, ob die Werte plausibel sind.Interpretieren Sie Ihr Ergebnis. Achten Sie dabei auf die in den Ohren von Statistikern korrekte Formulierung und versuchen Sie, das Ergebnis zu bewerten.

DIE T-VERTEILUNG

Freiheitsgrade

90%-Perzentil (α = 0,10)

95%-Perzentil (α = 0,05)

97,5%-Perzentil (α = 0,025)

99%-Perzentil (α = 0,02)

99,5%-Perzentil (α = 0,01)

 1

3,078

6,314

12,706

31,821

63,657

 2

1,886

2,920

4,303

6,965

9,925

 3

1,638

2,353

3,182

4,541

5,841

 4

1,333

2,132

2,776

3,747

4,604

 5

1,476

2,015

2,571

3,365

4,032

 6

1,440

1,943

2,447

3,143

3,707

 7

1,415

1,895

2,365

2,998

3,499

 8

1,397

1,860

2,306

2,896

3,355

 9

1,383

1,833

2,262

2,821

3,250

10

1,372

1,812

2,228

2,764

3,169

11

1,363

1,796

2,201

2,718

3,106

12

1,356

1,782

2,179

2,681

3,055

13

1,350

1,771

2,160

2,650

3,012

14

1,345

1,761

2,145

2,624

2,977

15

1,341

1,753

2,131

2,602

2,947

16

1,337

1,746

2,120

2,583

2,921

17

1,333

1,740

2,110

2,567

2,989

18

1,330

1,734

2,101

2,552

2,878

19

1,328

1,729

2,093

2,539

2,861

20

1,325

1,725

2,086

2,528

2,845

21

1,323

1,721

2,080

2,518

2,831

22

1,321

1,717

2,074

2,508

2,819

23

1,319

1,714

2,069

2,500

2,807

24

1,318

1,711

2,064

2,492

2,797

25

1,316

1,708

2,060

2,485

2,787

26

1,315

1,706

2,056

2,479

2,779

27

1,314

1,703

2,052

2,473

2,771

28

1,313

1,701

2,048

2,467

2,763

29

1,311

1,699

2,045

2,462

2,756

30

1,310

1,697

2,045

2,457

2,750

40

1,303

1,684

2,021

2,423

2,704

60

1,296

1,671

2,000

2,390

2,660

Z-Werte

1,282

1,645

1,960

2,326

2,576

 

Übungsbuch Statistik für Dummies

Bibliografische Information der Deutschen Nationalbibliothek

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

3. Auflage 2025

© 2025 Wiley-VCH GmbH, Boschstraße 12, 69469 Weinheim, Germany

Original English language edition © 2005 by Wiley Publishing, IncAll rights reserved including the right of reproduction in whole or in part in any form. This translation published by arrangement with John Wiley and Sons, Inc.

Copyright der englischsprachigen Originalausgabe © 2005 by Wiley Publishing, Inc.Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form. Diese Übersetzung wird mit Genehmigung von John Wiley and Sons, Inc. publiziert.

Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.

Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.

Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.

Coverfoto: DESIGN ARTS - stock.adobe.comKorrektur: Petra Heubach-Erdmann

Print ISBN: 978-3-527-72265-5ePub ISBN: 978-3-527-85055-6

Über die Autorin

Deborah Rumsey erwarb einen Doktortitel in Statistik an der Ohio State University (1993). Nach ihrer Promotion wechselte sie zum Department of Statistics der Kansas State University, wo sie den renommierten Presidential Teaching Award gewann. Im Jahr 2000 kehrte sie an die Ohio State University zurück und ist heute Mitglied des Department of Statistics. Dr. Rumsey war Mitglied des Statistics Education Executive Committee der American Statistical Association und Lektorin der Teaching-Bits-Rubrik des Journal of Statistics Education.

Sie ist Autorin der Bücher Statistik für Dummies und Wahrscheinlichkeitsrechnung für Dummies (erschienen bei Wiley-VCH). Außerdem hat sie zahlreiche Aufsätze zur Statistik-Ausbildung veröffentlicht und viele einschlägige Vorträge gehalten. Ihre Forschungsinteressen liegen auf der Lehrplanentwicklung, der Weiterbildung und Unterstützung von Lehrern und auf immersiven Lernumgebungen. Ihre anderen Leidenschaften sind ihre Familie, das Angeln, die Beobachtung von Vögeln, das Fahren eines neuen Kubota-Traktors auf dem »Familienbauernhof« und Ohio State Buckeye Football (nicht unbedingt in dieser Reihenfolge).

Über den Übersetzer

Felix Brosius hat an der Universität Hamburg als Mitarbeiter am Institut für Finanzwissenschaft über die Spieltheoretische Analyse des Internationalen Steuerwettbewerbs promoviert (2002). Anschließend war er zunächst als Spezialist für Database Marketing und später als Vorstandsassistent im Buchclub der Bertelsmann AG tätig. Seit 2005 ist er bei Kabel Deutschland im Marketing für das CRM, Database Marketing, Onlinemarketing und Kooperationsmarketing verantwortlich. Felix Brosius ist Autor zahlreicher Lehrbücher insbesondere zur Programmierung und statistischen Datenanalyse mit SPSS (unter anderem hat er SPSS für Dummies geschrieben) und hat mehrere Artikel zum Customer Relationship Management veröffentlicht.

Inhaltsverzeichnis

Cover

Titelblatt

Impressum

Über die Autorin

Über den Übersetzer

Inhaltsverzeichnis

Einführung

Über dieses Buch

Törichte Annahmen über den Leser

Wie dieses Buch aufgebaut ist

Symbole, die in diesem Buch verwendet werden

Wie es weitergeht

Teil I: Kopfüber eintauchen in die Statistik

Kapitel 1: Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente

Auf die Häufigkeit zählen

Kategorien vergleichen mit Prozentwerten

Vorsicht bei der Interpretation von absoluten und relativen Häufigkeiten

Lösungen für die Aufgaben zum Thema Zusammenfassen von kategorialen Daten

Kapitel 2: Kategoriale Daten darstellen: Grafiken und Diagramme

Kreisdiagramme erstellen, interpretieren und auswerten

Balkendiagramme erstellen, interpretieren und auswerten

Lösungen für die Aufgaben zum Thema Darstellen von kategorialen Daten

Kapitel 3: Quantitative Daten darstellen: Grafiken und Diagramme

Histogramme erstellen

Histogramme richtig verwenden

Irreführende Histogramme erkennen

Der richtige Umgang mit Liniendiagrammen

Lösungen für die Aufgaben zum Thema Darstellen von quantitativen Daten

Kapitel 4: Quantitative Daten zusammenfassen: Mittelwert, Median und mehr

Mit Histogrammen die Verteilung der Daten zeigen

Maße für das Zentrum berechnen und interpretieren

Maße für die Streuung berechnen und interpretieren

Schiefe Daten richtig erkennen

Die 68-95-99,7-Prozent-Regel (auch bekannt als k-σ-Regel)

Lösungen für die Aufgaben zum Thema Zusammenfassen von quantitativen Daten

Teil II: Von Wahrscheinlichkeiten, der Normalverteilung und dem zentralen Grenzwertsatz

Kapitel 5: Die Grundlagen der Wahrscheinlichkeitsrechnung verstehen

Die häufigsten Irrtümer über Wahrscheinlichkeiten – und wie man sie vermeidet

Vorhersagen treffen mithilfe von Wahrscheinlichkeit

Lösungen für die Aufgaben zum Thema Wahrscheinlichkeitsrechnung

Kapitel 6: Die Normalverteilung verstehen und richtig nutzen

Was hat uns die Normalverteilung zu sagen?

Zur Standardnormalverteilung konvertieren: Z-Werte berechnen und interpretieren

Die Lage mithilfe von Perzentilen bestimmen

Wahrscheinlichkeiten für normalverteilte Daten berechnen

Rückwärts zur Normalverteilung: Aus dem Perzentil auf den Messwert schließen

Lösungen für die Aufgaben zum Thema Normalverteilung

Kapitel 7: Geheimnisse der Statistik: Die Stichprobenverteilung und der zentrale Grenzwertsatz

Was genau ist eine Stichprobenverteilung?

Die Geheimnisse des zentralen Grenzwertsatzes

Mittelwert und Anteilswerte in der Grundgesamtheit bestimmen

Wenn die Stichprobe für den zentralen Grenzwertsatz zu klein ist: Die t-Verteilung

Lösungen für die Aufgaben zu den Themen Stichprobenverteilung und Grenzwertsatz

Teil III: Schätzungen und Konfidenzintervalle

Kapitel 8: Die Fehlergrenze und ihre Bedeutung

Was ist die Fehlergrenze?

Die Fehlergrenze für Mittelwerte und Anteilswerte berechnen

Faktoren, die die Fehlergrenze beeinflussen

Die Fehlergrenze richtig interpretieren

Lösungen für die Aufgaben zum Thema Fehlergrenze

Kapitel 9: Konfidenzintervalle berechnen

Die wichtigsten Eigenschaften von Konfidenzintervallen

Ein Konfidenzintervall für den Mittelwert der Grundgesamtheit berechnen

Ein Konfidenzintervall für einen Anteilswert in der Grundgesamtheit berechnen

Ein Konfidenzintervall für die Differenz zwischen zwei Mittelwerten berechnen

Ein Konfidenzintervall für die Differenz zwischen zwei Anteilswerten berechnen

Lösungen für die Aufgaben zum Thema Konfidenzintervall

Kapitel 10: Konfidenzintervalle entschlüsseln

Konfidenzintervalle richtig interpretieren (sodass auch Ihr Lehrer zufrieden ist)

Das Ergebnis eines Konfidenzintervalls auswerten: Was die Formeln nicht verraten

Lösungen für die Aufgaben zum Thema Entschlüsseln von Konfidenzintervallen

Teil IV: Hypothesen testen

Kapitel 11: Hypothesentests

Schritt für Schritt durch einen Hypothesentest

Hypothesen über den Mittelwert in der Grundgesamtheit testen

Hypothesentests für einen Anteilswert in der Grundgesamtheit durchführen

Hypothesentests für die Differenz zwischen zwei Mittelwerten in der Grundgesamtheit

Test auf eine Mittelwertdifferenz bei gepaarten Stichproben

Hypothesentests für die Differenz zwischen zwei Anteilswerten in der Grundgesamtheit

Lösungen für die Aufgaben zum Thema Hypothesentests

Kapitel 12: Der p-Wert und die Fehler erster und zweiter Art

Endlich verstehen, was ein p-Wert genau misst

Einen p-Wert ermitteln

p-Werte richtig interpretieren

Was sind Fehler erster Art?

Was sind Fehler zweiter Art?

Lösungen für die Aufgaben zum Thema Fehler erster und zweiter Art

Teil V: Hinter die Kulissen von Umfragen und Experimenten schauen

Kapitel 13: Meinungsumfragen durchführen und auswerten

Planung und Design einer Umfrage

Die Ziehung einer Zufallsstichprobe

Eine Umfrage richtig durchführen

Befragungsergebnisse auswerten

Lösungen für die Aufgaben zum Thema Meinungsumfragen

Kapitel 14: Experimente auswerten

Der Unterschied zwischen einem Experiment und einer Beobachtungsstudie

Der richtige Aufbau eines Experiments

Die Suche nach Ursache und Wirkung: Ergebnisse eines Experiments interpretieren

Lösungen für die Aufgaben zum Thema Experimente

Teil VI: Zusammenhänge zwischen zwei Variablen aufspüren und beschreiben

Kapitel 15: Kreuztabellen: Zusammenhänge zwischen kategorialen Variablen

Kreuz und quer durch Kreuztabellen

Schnittmengen, Vereinigungsmengen und die Additionsregel

Randwahrscheinlichkeiten berechnen

Bedingte Wahrscheinlichkeiten und die Multiplikationsregel

Unabhängigkeit von kategorialen Variablen untersuchen

Lösungen für die Aufgaben zum Thema Kreuztabellen

Kapitel 16: Korrelation und Regression: Zusammenhänge zwischen quantitativen Daten

x und y in einem Streudiagramm

Den Korrelationskoeffizienten bestimmen

Welche Regressionsgerade passt am besten in die Punktwolke?

Eine Regressionsgerade interpretieren und Vorhersagen treffen

Die Anpassungsgüte der Regressionsgeraden

Lösungen für die Aufgaben zu den Themen Korrelation und Regression

Teil VII: Der Top-Ten-Teil

Kapitel 17: Mathe-Schnellkurs: Zehn wichtige Zusammenhänge aus der Mathematik

Elementare Symbole aus der Mathematik

Wurzeln und Potenzen

Vorsicht bei Brüchen

Formeln in der richtigen Reihenfolge auflösen

Rundungsfehler vermeiden

Keine Angst vor Formeln

Auch bei wilden Formeln die Ruhe bewahren

Sich mit Funktionen anfreunden

Dem Bauchgefühl vertrauen: Falsche Ergebnisse erkennen

Den Lösungsweg beschreiben

Kapitel 18: Die Top Ten aus der Formel 1

Mittelwert (Durchschnitt)

Median

Standardabweichung der Stichprobe

Korrelation

Fehlergrenze für den Mittelwert der Stichprobe

Benötigte Stichprobengröße für ein bestimmtes Konfidenzintervall des Mittelwerts

Prüfgröße für den Mittelwert

Fehlergrenze für einen Anteilswert in der Stichprobe

Benötigte Stichprobengröße für das Konfidenzintervall eines Anteilswerts

Prüfgröße für einen Anteilswert in der Stichprobe

Kapitel 19: Zehn Wege, typische Fehler in der Statistik zu erkennen

Grafiken überprüfen

Verzerrungen erkennen und beschreiben

Die Fehlergrenze aufzeigen

Stichprobengröße überprüfen

Stichprobenziehung prüfen (War die Auswahl zufällig?)

Einfluss von Störgrößen erkennen

Korrelationen richtig bewerten

Nachrechnen

Selektive Berichterstattungen erkennen

Anekdotische Evidenz ist keine Evidenz

Abbildungsverzeichnis

Stichwortverzeichnis

End User License Agreement

Tabellenverzeichnis

Kapitel 9

Tabelle 9.1: Häufige Konfidenzintervalle und die zugehörigen Z*-Werte

Kapitel 11

Tabelle 11.1: Kritische Werte für Hypothesentests auf Basis der Z-Vertei...

Kapitel 15

Tabelle 15.1: Geschlecht und politische Parteienpräferenz von 200 Befrag...

Illustrationsverzeichnis

Kapitel 3

Abbildung 3.1: Typische Verteilungsformen in Histogrammen

Kapitel 6

Abbildung 6.1: Laien nennen dies eine Glockenkurve – Sie nennen e...

Abbildung 6.2: Die Standardnormalverteilung hat einen Mittelwert ...

Kapitel 7

Abbildung 7.1: Bedeutung der Angaben in der t-Tabelle

Orientierungspunkte

Cover

Titelblatt

Impressum

Über die Autorin

Inhaltsverzeichnis

Einführung

Fangen Sie an zu lesen

Abbildungsverzeichnis

Stichwortverzeichnis

End User License Agreement

Seitenliste

1

2

3

7

8

9

19

20

21

22

23

25

26

27

28

29

30

31

32

33

34

35

36

37

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

103

104

105

106

107

108

109

110

111

112

113

114

115

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

326

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

367

368

369

370

371

372

373

374

375

376

377

381

382

383

384

Einführung

Vielleicht besuchen Sie gerade eine Statistik-Vorlesung an der Uni oder haben dies demnächst vor. Möglicherweise haben Sie auch schon ein Grundverständnis von den wesentlichen Konzepten der Statistik und möchten nur noch einige Lücken schließen oder mehr Sicherheit im Umgang mit statistischen Fragestellungen gewinnen. Oder Sie bereiten sich gerade auf eine Prüfung oder Abschlussklausur in Statistik vor und wollen einfach nur üben, üben und vor allem üben. Wenn das so ist, dann haben Sie Glück, denn Sie halten gerade genau das richtige Buch in der Hand, das Übungsbuch Statistik für Dummies.

Ziel dieses Übungsbuches ist es in erster Linie, Sie im Umgang mit der Statistik vertraut und sicher zu machen. Anhand einer Vielzahl von Übungsaufgaben zu den unterschiedlichsten Themengebieten und Fragestellungen der einführenden Statistik werden Sie die Ihnen bereits bekannten Konzepte wiederholen und in den unterschiedlichsten Varianten und Ausprägungen in praktischen Übungen anwenden. Kleine Tipps und Tricks sollen Ihnen dabei helfen, Aufgabenstellungen richtig zu verstehen und schnell und effizient zu bearbeiten. Dabei beschränkt sich das Buch auf die wichtigsten Konzepte und legt einen klaren Schwerpunkt auf Übungsaufgaben, wie sie typisch auch in Prüfungen und Klausuren gestellt werden. Wenn Sie die Aufgaben in diesem Buch beherrschen und den Kern der Fragestellungen verstanden haben, sollten Sie in einer Prüfung oder Klausur keine bösen Überraschungen erleben.

Über dieses Buch

Wie sagen doch unsere altklugen Eltern so schön? »Probieren geht über Studieren.« Und auch wenn wir es nicht gerne zugeben: Sie haben recht – zumindest manchmal. Deshalb soll Ihnen dieses Arbeitsbuch die Gelegenheit geben, die Ärmel hochzukrempeln und richtig tief in die Statistik einzutauchen. An einer Vielzahl von praktischen Übungen können Sie sich hoffentlich bis zur Erschöpfung austoben. Die Zielsetzung ist es dabei, das Verständnis für die Zusammenhänge in der Statistik zu schärfen und deren Anwendung in ganz konkreten Aufgaben zu schulen. Die inhaltlich und formal korrekte Lösung von statistischen Aufgaben soll Ihnen dabei in Fleisch und Blut übergehen. Der Umgang mit einfachen Wahrscheinlichkeiten wird anschließend ein Kinderspiel für Sie sein; aber auch anspruchsvollere statistische Konzepte wie den zentralen Grenzwertsatz und p-Werte werden Sie beherrschen wie das kleine Einmaleins. Dabei sollen die Übungen auch verdeutlichen, welches statistische Konzept für welche Fragestellung heranzuziehen ist (zum Beispiel welche Art von Konfidenzintervall Sie für die Lösung einer bestimmten Aufgabe berechnen sollten) und wie wissenschaftliche Studien, Umfragen und Experimente richtig einzuschätzen und auszuwerten sind.

Dieses Übungsbuch ist entstanden als Ergänzung zu dem Buch Statistik für Dummies. Dies bedeutet aber nicht, dass Sie Statistik für Dummies gelesen haben müssen, um dieses Übungsbuch sinnvoll verwenden zu können. Vielmehr sollte dieses Buch vollkommen unabhängig davon, wie und wo Sie Ihre ersten Erkenntnisse in Statistik erworben haben, ein begleitendes Einführungs- und Übungsbuch eines typischen Statistik-Grundkurses sein.

Was Sie von diesem Buch erwarten können, ist grob zusammengefasst nicht mehr und nicht weniger als:

Jede Menge Probleme:

Und zwar typische Probleme und Aufgabenstellungen, wie sie in der wissenschaftlichen Praxis und vor allem auch in Prüfungen und Klausuren von Statistik-Kursen vorkommen. Zu jeder Aufgabenstellung finden Sie natürlich auch eine Lösung.

Keine einfachen Antworten:

Die Lösungen zu den Übungsaufgaben beschränken sich nicht auf einfache Antworten, sondern versuchen stets zu erläutern, warum gerade dieser und nicht ein anderer Lösungsweg richtig ist, damit Sie auch, wenn Ihnen künftig leicht anders geartete Aufgabenstellungen begegnen, auf Anhieb den richtigen Lösungsweg finden werden.

Ein Blick in die Trickkiste:

Häufig besteht die größte Schwierigkeit bei der Lösung von Statistik-Aufgaben darin, die Aufgabenstellung richtig zu verstehen. Dabei arbeiten manche Prüfer auch noch mit fiesen Tricks, weshalb man ganz genau auf die Formulierung der Fragestellungen achten muss. Die häufigsten Tricks und gemeinsten Fallstricke finden Sie auch in den Übungen in diesem Buch. Wenn Sie darüber stolpern, sollten Sie mit einem Lächeln wieder aufstehen und sich freuen, dass es Ihnen bei der Übung und nicht im Ernstfall passiert ist.

Ein Beispiel für jedes Thema:

Jedes Thema in diesem Buch wird mit einem Übungsbeispiel und einer Musterlösung abgeschlossen. Dies soll die Herangehensweise verdeutlichen, an der Sie sich orientieren können, wenn Sie sich selbst an den Übungsaufgaben versuchen.

Strategien zur Problemlösung:

Nähere Erläuterungen zu den Übungen und Hintergründen sollen Ihnen zeigen, wie Sie vorgehen können, um den richtigen Lösungsweg zu finden, wenn dieser nicht auf den ersten Blick offensichtlich ist.

Modularer Aufbau:

Jedes Thema in diesem Buch wird als geschlossene Einheit behandelt. Wenn Sie ein bestimmtes Kapitel lesen, wird nicht vorausgesetzt, dass Sie die vorhergehenden Kapitel bereits kennen. Sie können daher in dem Buch hin und her springen, wie Sie möchten, und direkt mit dem für Sie relevantesten Thema einsteigen.

Eine verständliche Sprache:

Eine leicht verständliche Sprache soll dabei helfen, auch komplexe statistische Konzepte so zu beschreiben, dass ein »gesunder Menschenverstand« genügt, um sie zu verstehen.

Einfache und klare Schritt-für-Schritt-Anleitungen:

Die Vorgehensweise zur Lösung von statistischen Aufgabenstellungen folgt häufig einem klaren und fest vorgegebenen Lösungsweg. Es spricht also nichts dagegen, diesen Lösungsweg in einfachen Schritt-für-Schritt-Anleitungen darzustellen, damit er für jeden verständlich und nachvollziehbar ist. Genau solche Schritt-für-Schritt-Anleitungen finden Sie in diesem Buch in großer Zahl.

Törichte Annahmen über den Leser

Dieses Buch ist genau für Leute wie Sie geschrieben, die bereits erste Gehversuche auf dem Gebiet der Statistik absolviert haben – zum Beispiel den ersten Grundkurs Statistik abgeschlossen oder zumindest die erste Vorlesungsstunde besucht haben – und es jetzt kaum erwarten können, tiefer in die Statistik einzusteigen und sich an jeder Menge praktischen Übungen zu messen – sei es, weil die Statistik für Sie das spannendste Fach ist, das Sie sich überhaupt vorstellen können, oder weil Sie dieses verdammte Pflichtfach nun einmal absolvieren müssen und am Ende eine Prüfung ansteht, die Sie mit Anstand bestehen möchten. Vielleicht haben Sie aber auch gar keine Prüfung vor sich, sondern einfach nur den persönlichen Ehrgeiz, endlich zu verstehen, was es mit dem zentralen Grenzwertsatz und diesen ominösen p-Werten auf sich hat. In allen diesen Fällen halten Sie gerade genau das richtige Buch in der Hand.

Wie dieses Buch aufgebaut ist

Dieses Buch ist in sechs Hauptteile untergliedert, die jeweils einem der großen Themenbereiche aus der einführenden Statistik gewidmet sind. In einem siebten Teil werden noch einmal grundlegende Konzepte der Statistik in einem groben Überblick dargestellt, damit Sie dort Ihr Wissen überprüfen und einzelne Formeln nachschlagen können.

Teil I: Kopfüber eintauchen in die Statistik

Im ersten Teil werden Sie gleich ins kalte Wasser geschubst – und zwar mit Anlauf, sodass Sie möglichst tief in die Abgründe der Statistik eintauchen. Dabei lernen Sie Grafiken zu erstellen und richtig zu interpretieren sowie die gebräuchlichsten statistischen Kennzahlen zu berechnen.

Teil II: Von Wahrscheinlichkeiten, der Normalverteilung und dem zentralen Grenzwertsatz

In diesem Teil begegnen Ihnen die »John, Paul, George und Ringo« der Statistik: Wahrscheinlichkeiten, die Normalverteilung und der zentrale Grenzwertsatz bilden die Basis der modernen Statistik (so wie die Beatles unverzichtbares Fundament der modernen Musik sind). In diesem Teil werden Sie den Umgang mit diesen zentralen Konzepten der Statistik üben und anschließend spielend damit jonglieren.

Teil III: Schätzungen und Konfidenzintervalle

Ein großer Teil der Statistik beschäftigt sich damit, auf Basis einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen. Dazu wird die Lage von bestimmten Parametern wie die des Mittelwertes in der Grundgesamtheit geschätzt und Konfidenzintervalle werden berechnet. Das ist kein Hexenwerk, sondern sehr einfach zu erlernen, wie Sie in diesem Teil sehen.

Teil IV: Hypothesen testen

In den beiden Kapiteln dieses Teils lernen Sie alles, was Sie brauchen, um Hypothesen über einen Mittelwert oder Anteilswert in der Grundgesamtheit zu formulieren, einen Hypothesentest zu entwerfen, durchzuführen und das Ergebnis richtig zu interpretieren.

Teil V: Hinter die Kulissen von Umfragen und Experimenten schauen

Es besteht ein grundlegender Unterschied zwischen Experimenten und Beobachtungsstudien wie zum Beispiel Befragungen. In diesem Teil lernen Sie beide Verfahren zur Datenerhebung kennen und einzuschätzen. Dabei sollte deutlich werden, welche Methode bei welcher Art von Fragestellung geeignet ist und wann man den Ergebnissen eines Experiments oder einer Umfrage trauen kann – beziehungsweise wann besser nicht.

Teil VI: Zusammenhänge zwischen zwei Variablen aufspüren und beschreiben

Häufig interessiert man sich in der Statistik für die Zusammenhänge zwischen verschiedenen Variablen. In diesem Teil lernen Sie, solche Zusammenhänge zu identifizieren und richtig zu bewerten. Um es schon einmal vorwegzunehmen: Eine signifikante Korrelation zwischen zwei Variablen erlaubt keinen Schluss auf einen kausalen Zusammenhang zwischen den Variablen. Diese Aussage sollte Ihnen, nachdem Sie diesen Teil des Buches durchgearbeitet haben, selbstverständlich und nachgerade trivial erscheinen.

Teil VII: Der Top-Ten-Teil

Wie viele Gegenstände würden Sie auf eine einsame Insel mitnehmen? Zehn Dinge sollten genügen. Die wirklich wichtigen Themen im Leben lassen sich locker in einer Top-Ten-Liste zusammenfassen. Genau dies geschieht auch in diesem Teil des Buches.

Symbole, die in diesem Buch verwendet werden

In diesem Buch werden einige Symbole verwendet, die Hinweise und Einschübe kennzeichnen, die von besonderer Bedeutung sind. Die Symbole sollen Ihnen helfen, sich einfach und schnell zu orientieren.

Wenn Sie dieses Symbol sehen, geht es um das Wesentliche, quasi um den Kern der Angelegenheit, wie zum Beispiel häufig gestellte Fragen in Klausuren, wichtige Bestandteile, die in einer Antwort nicht fehlen dürfen, oder häufige Fehler, die Sie vermeiden sollten.

Jeder Abschnitt in diesem Buch wird mit einem Übungsbeispiel samt Musterlösung abgeschlossen. Wenn Sie dieses Symbol sehen, wissen Sie, dass Sie es mit einem solchen Beispiel zu tun haben.

Dieses Symbol ist für wichtige Konzepte und Hinweise reserviert, die Sie sich hoffentlich noch lange merken, wenn Sie dieses Buch schon längst wieder vergessen haben.

Mit diesem Symbol werden Tipps und Tricks gekennzeichnet, die alternative Lösungswege, Abkürzungen, Vereinfachungen oder Eselsbrücken aufzeigen.

Dieses Symbol soll Sie auf häufige Fehler und »beliebte« Fallstricke hinweisen, über die auch Statistik-Profis immer wieder gerne stolpern und die Sie unbedingt vermeiden sollten.

Wie es weitergeht

Dieses Buch ist modular aufgebaut, weshalb Sie nicht mit dem ersten Kapitel beginnen müssen, sondern an jeder beliebigen Stelle in das Buch einsteigen können. Wählen Sie als Einstieg also das Kapitel, das Sie am meisten interessiert. Je nachdem, womit Sie sich gerade hauptsächlich beschäftigen, empfehle ich die folgenden Startpunkte:

Wenn Sie sich näher mit statistischen Kennzahlen wie Mittelwert, Median, Standardabweichung etc. beschäftigen möchten, beginnen Sie ganz konventionell am Anfang des Buches, also mit

Teil I

.

Möchten Sie jetzt endlich verstehen, was es mit der Normalverteilung und dem zentralen Grenzwertsatz auf sich hat, überspringen Sie den ersten Teil und legen Sie direkt mit

Teil II

los.

Um mehr Übung im Umgang mit Konfidenzintervallen und Hypothesentests zu bekommen, knöpfen Sie sich die Teile III und IV vor.

Wenn Sie sich näher mit den Unterschieden, Anwendungsfällen und Grenzen von Umfragen und Experimenten auseinandersetzen möchten, springen Sie direkt zu

Teil V

.

Interessieren Sie sich besonders für den Zusammenhang zwischen zwei Variablen (Sie wissen schon, mit Korrelationen, Regressionen und so weiter), sollten Sie in

Teil VI

fündig werden.

Und jetzt legen Sie einfach los. Viel Spaß und viel Erfolg!

Teil I

Kopfüber eintauchen in die Statistik

IN DIESEM TEIL …

In diesem ersten Teil steigen Sie gleich richtig ein in die Grundlagen der Statistik. Sie beginnen mit dem Erstellen und Auswerten von Häufigkeitstabellen, erzeugen Balkendiagramme für kategoriale Daten und Histogramme für quantitative Daten.

Dann lernen Sie die wichtigsten Kennzahlen der Statistik wie Mittelwert, Median und Standardabweichung nicht nur zu berechnen, sondern auch richtig zu interpretieren.

Kapitel 1

Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente

IN DIESEM KAPITEL

Häufigkeitstabellen für kategoriale Daten erstellenDer kleine Unterschied zwischen absoluten Häufigkeiten und relativen HäufigkeitenHäufigkeitstabellen interpretieren und bewerten

Als kategoriale Daten werden solche Daten bezeichnet, die jede Beobachtung genau einer Kategorie zuordnen. Typische Beispiele für solche Kategorien sind klein, mittel, groß oder männlich, weiblich oder Deutscher, Franzose, Italiener, Österreicher etc. Wenn Sie kategoriale Daten erhoben haben, liegen diese in den meisten Fällen zunächst als lange Liste vor, in der jede befragte Person (beziehungsweise allgemein jede Beobachtungseinheit) eine Zeile bildet und die Werte der kategorialen Variablen in einer langen Spalte einzeln untereinander stehen. Eine solche unübersichtliche Liste ist jedoch nur selten aussagekräftig. Daher müssen die Daten für eine Auswertung zusammengefasst und in übersichtlicher Form dargestellt werden. Der einfachste Weg hierzu besteht darin auszuzählen, wie viele Beobachtungen in die einzelnen Kategorien fallen, und das Ergebnis als sogenannte Häufigkeitstabelle darzustellen. Genau dies können Sie in diesem Kapitel üben, nämlich das Erstellen und Interpretieren von absoluten und relativen Häufigkeitstabellen für kategoriale Daten.

Auf die Häufigkeit zählen

Die Anzahl der Beobachtungen, die in eine bestimmte Kategorie fallen, wird als absolute Häufigkeit dieser Kategorie bezeichnet. Durch das einfache Auflisten sämtlicher Kategorien mit den dazugehörigen Häufigkeiten erhalten Sie eine Häufigkeitstabelle. Die Summe der Häufigkeiten aller Kategorien sollte dabei stets der Größe der gesamten Stichprobe entsprechen, da ja schließlich jede Beobachtung genau einer Kategorie zugeordnet wurde.

Die folgenden Aufgaben enthalten Beispiele dafür, wie sich kategoriale Daten mithilfe von Häufigkeitstabellen zusammenfassen lassen.

Angenommen, Sie haben zehn Personen gefragt, ob sie ein Handy besitzen. Jede dieser zehn Personen kann also in eine von zwei möglichen Kategorien fallen: Ja oder Nein. Das Ergebnis Ihrer Befragung ist in der folgenden Tabelle wiedergegeben.

Person Nr.

Handy

Person Nr.

Handy

1

Ja

 6

Ja

2

Nein

 7

Ja

3

Ja

 8

Ja

4

Nein

 9

Nein

5

Ja

10

Ja

Fassen Sie diese Daten in einer Häufigkeitstabelle zusammen.

Worin besteht der Nutzen der Zusammenfassung von kategorialen Daten?

Lösung

In der Zusammenfassung werden die erhobenen Daten klar und übersichtlich dargestellt.

Die Häufigkeitstabelle für die Antworten der zehn befragten Personen ist in der folgenden Tabelle wiedergegeben.

Die Zusammenfassung der Daten ermöglicht es Ihnen, die Relevanz der einzelnen Kategorien abzulesen und Muster in den Daten zu erkennen, die aus Rohdaten nicht auf den ersten Blick ersichtlich wären.

Besitzen Sie ein Handy?

Absolute Häufigkeit

Ja

 7

Nein

 3

Gesamt

10

Aufgabe 1

Sie lassen 20 Kunden in einem Supermarkt zwei unterschiedliche Marken eines Softdrinks testen und fragen anschließend, welches Getränk besser geschmeckt hat, Marke A oder Marke B. Die Ergebnisse dieser Befragung sehen wie folgt aus: A, A, B, B, B, B, B, B, A, A, A, B, A, A, A, A, B, B, A, A.

Welche der beiden Marken bevorzugen die Kunden? Erstellen Sie hierzu eine Häufigkeitstabelle und erläutern Sie das Ergebnis.

Aufgabe 2

Die Einwohner einer Stadt sind in einer Volksabstimmung dazu aufgerufen, über die Erhöhung einer Sonderabgabe zur Finanzierung der öffentlichen Schulen abzustimmen. Insgesamt haben 18.726 Wähler ihre Stimme hierzu abgegeben. Davon stimmten 10.479 für die Erhöhung der Sonderabgabe, die übrigen Wähler dagegen.

Stellen Sie das Ergebnis in einer Häufigkeitstabelle dar.

Warum ist es wichtig, die Anzahl der insgesamt befragten Personen in der Tabelle mit auszuweisen?

Aufgabe 3

Ein Zoo führt eine Befragung durch und möchte von 1.000 Personen wissen, ob sie im letzten Jahr den Zoo besucht haben. 592 der Befragten antworten mit Ja, 198 mit Nein und 210 haben gar nicht geantwortet.

Erstellen Sie eine Häufigkeitstabelle mit den Ergebnissen der Befragung.

Erläutern Sie, warum es notwendig ist, auch die Personen, die keine Antwort abgegeben haben, in der Häufigkeitstabelle mit aufzuführen.

Aufgabe 4

Mal angenommen, Sie würden eine Häufigkeitstabelle erstellen, in der für jede Kategorie nicht die absolute Anzahl der Nennungen dieser Kategorie aufgeführt wird, sondern lediglich der Prozentwert (die relative Häufigkeit). Welchen Vorteil hat eine solche relative Häufigkeitstabelle gegenüber einer Häufigkeitstabelle mit absoluten Häufigkeiten?

Kategorien vergleichen mit Prozentwerten

Eine andere Möglichkeit, kategoriale Daten zusammenzufassen und in verdichteter Form darzustellen, besteht darin aufzulisten, welcher prozentuale Anteil der Antworten auf die verschiedenen Kategorien entfällt. Diese Prozentwerte sind die relativen Häufigkeiten der Kategorien. Die relative Häufigkeit einer bestimmten Kategorie ergibt sich aus der absoluten Häufigkeit (der Anzahl der Beobachtungen in einer Kategorie) geteilt durch die gesamte Stichprobengröße. Wenn Sie beispielsweise 50 Personen nach ihren Präferenzen zu einem bestimmten Thema befragen und zehn der Befragten geben sich als Anhänger einer bestimmten Variante zu erkennen, errechnet sich die relative Häufigkeit der Anhänger dieser Variante als 10 ÷ 50 = 0,2 beziehungsweise 20%.

Durch die Auflistung sämtlicher Kategorien mit ihren jeweiligen relativen Häufigkeiten erstellen Sie eine relative Häufigkeitstabelle. Die Summe der relativen Häufigkeiten aller Kategorien sollte stets 100 Prozent ergeben (wenn man einmal kleine Rundungsfehler außer Acht lässt).

Das folgende Beispiel zeigt, wie kategoriale Daten in einer relativen Häufigkeitstabelle zusammengefasst werden können.

Beispiel

In der folgenden Tabelle können Sie für insgesamt zehn Personen ablesen, ob diese ein Mobiltelefon besitzen. Erstellen Sie für diese Daten eine relative Häufigkeitstabelle und interpretieren Sie das Ergebnis.

Person Nr.

Handy

Person Nr.

Handy

1

Ja

 6

Ja

2

Nein

 7

Ja

3

Ja

 8

Ja

4

Nein

 9

Nein

5

Ja

10

Ja

Lösung

Die folgende Tabelle zeigt eine relative Häufigkeitstabelle für die Handy-Daten. 70% der befragten Personen haben angegeben, ein Handy zu besitzen, während 30% offenbar noch in der Steinzeit leben und mit Rauchzeichen kommunizieren.

Besitzen Sie ein Handy?

Relative Häufigkeit

Ja

70%

Nein

30%

Den Wert 70% in der Tabelle errechnen Sie, indem Sie die Zahl der Personen mit Handy (also 7) durch die Zahl aller befragten Personen (10) dividieren. Sie rechnen also 7 ÷ 10 = 0,7 beziehungsweise 70%. Entsprechend ergeben sich die 30% »Steinzeitmenschen« als 3 ÷ 10 = 0,3 beziehungsweise 30%.

Aufgabe 5

Sie lassen 20 Kunden in einem Supermarkt zwei verschiedene Softdrinks testen und fragen anschließend, welches Getränk ihnen besser schmeckt, Marke A oder Marke B. Sie erhalten die folgenden Ergebnisse: A, A, B, B, B, B, B, B, A, A, A, B, A, A, A, A, B, B, A, A. Welches Getränk findet bei den Befragten mehr Zuspruch?

Erstellen Sie eine relative Häufigkeitstabelle, um das beliebteste Getränk zu ermitteln.

Welche Art von Häufigkeitsauswertung ist generell leichter zu interpretieren: absolute oder relative Häufigkeiten? Begründen Sie Ihre Antwort.

Aufgabe 6

Die Bewohner einer Stadt sind aufgerufen, in einer Volksabstimmung über die Erhöhung einer Sonderabgabe zur Finanzierung öffentlicher Schulen zu entscheiden. Insgesamt haben 18.726 Wähler ihre Stimme hierzu abgegeben; davon stimmten 10.479 für die Erhöhung der Sonderabgabe, die übrigen Wähler dagegen. Stellen Sie das Wahlergebnis in einer relativen Häufigkeitstabelle dar.

Aufgabe 7

Ein Zoo führt eine Befragung durch und möchte von 1.000 Personen wissen, ob sie im letzten Jahr den Zoo besucht haben. 592 der Befragten antworten mit Ja, 198 mit Nein und 210 haben gar nicht geantwortet. Erstellen Sie für dieses Ergebnis eine relative Häufigkeitstabelle und ermitteln Sie anhand der Tabelle die Antwortrate, also den Anteil der Personen, die überhaupt auf die Frage nach dem Zoobesuch geantwortet haben.

Aufgabe 8

Nennen Sie einen Nachteil von relativen Häufigkeitstabellen gegenüber einfachen Häufigkeitstabellen mit absoluten Häufigkeiten.

Vorsicht bei der Interpretation von absoluten und relativen Häufigkeiten

Werden umfangreiche kategoriale Daten wie in einer Häufigkeitstabelle zu verdichteten Daten zusammengefasst, können dabei leicht wichtige Informationen verloren gehen, die in den Ursprungsdaten enthalten sind. Zusammengefasste Daten bergen daher stets das Risiko, dass sie unpräzise oder unvollständig sind. Bei der Interpretation von Häufigkeitstabellen und anderen Formen von Datenzusammenfassungen sollten Sie daher stets wissen, auf welche möglichen Schwachstellen Sie achten müssen, um nicht irreführende oder unvollständige Informationen zu erhalten.

In Statistik-Kursen und -Prüfungen fordern die Lehrer gerne dazu auf, »die Ergebnisse zu interpretieren«. Was der Prüfer damit eigentlich meint, ist nichts anderes, als die vorliegenden Daten in Bezug auf die jeweilige Fragestellung zu bewerten. Mit anderen Worten will der Prüfer wissen: Was kann die Person, die die vorliegenden Daten vor dem Hintergrund einer konkreten Fragestellung erhoben hat, nun aus den gewonnenen Daten lernen?

Wenn Sie relative Häufigkeitstabellen erstellen oder auswerten, vergessen Sie nie zu prüfen, ob sich die Prozentwerte sämtlicher Kategorien zu 100% addieren (abgesehen von minimalen Rundungsfehlern, die zulässig sind). Außerdem sollten Sie sich nie auf die alleinige Betrachtung der relativen Häufigkeiten beschränken, sondern stets überprüfen, wie groß die Stichprobe ist, auf der die relative Häufigkeitstabelle basiert.

Das folgende Beispiel zeigt einige entscheidende Aspekte für einen kritischen Umgang mit zusammengefassten Daten.

Beispiel

Sie sehen im Fernsehen einen Werbespot, in dem der Hersteller eines neuen Erkältungsmedikaments »Antigrippe« dieses mit dem derzeit meistverkauften Erkältungsmedikament vergleicht. Die Ergebnisse sind in der folgenden Tabelle wiedergegeben.

Bewertung von Antigrippe im Vergleich zum Marktführer

Prozent

Viel besser

47%

Mindestens gleich gut

18%

Was für eine Art von Tabelle wurde hier verwendet?

Interpretieren Sie das Ergebnis. Hat das neue Erkältungsmedikament den aktuellen Marktführer geschlagen?

Welche wichtigen Informationen fehlen in der Tabelle?

Lösung

Mit der im Werbespot verwendeten Tabelle verhält es sich ähnlich wie mit guten Ratschlägen: Sie hilft nicht wirklich weiter.

Bei der Tabelle handelt es sich um eine unvollständige relative Häufigkeitstabelle. Die Tabelle ist unvollständig, weil die Kategorie »Antigrippe ist

weniger gut

als das führende Produkt« fehlt. Sie können den fehlenden Wert aber leicht selbst berechnen, denn vermutlich sagen 100% – (47% + 18%) = 35% der Testpersonen, dass der aktuelle Marktführer besser ist als Antigrippe. (Wenn es nicht noch weitere Kategorien wie »Weiß nicht« gibt.)

Wenn man die beiden Kategorien aus der Tabelle zusammenfasst, erkennt man, dass 65% der Testpersonen angeben, dass Antigrippe mindestens so gut wirkt wie das aktuell führende Produkt. Etwa die Hälfte der Personen sagt sogar, Antigrippe wirke besser.

Welche Informationen fehlen? Zunächst einmal fehlt mindestens eine Kategorie, damit sich alle möglichen Antworten fair miteinander vergleichen lassen. Noch gravierender ist aber, dass die Stichprobengröße nicht mit ausgewiesen wird. So wird nicht deutlich, ob die Ergebnisse auf einer Befragung von 10, 100 oder 1.000 Patienten basieren. Damit ist die Zuverlässigkeit der Ergebnisse vollkommen unklar. Es ist überhaupt nicht zu erkennen, ob sich die Ergebnisse verallgemeinern lassen (weil die Stichprobe so groß war, dass starke Abweichungen vom tatsächlichen Stimmungsbild sehr unwahrscheinlich sind) oder ob die Ergebnisse letztlich nur für einige wenige von dem Hersteller befragte Patienten gelten.

Aufgabe 9

Sie haben 1.000 Personen gebeten, aus einer Liste von typischen Urlaubszielen diejenigen anzugeben, die der jeweilige Befragte bereits besucht hat. Bei dieser Befragung haben Sie folgende Ergebnisse erhalten: Spanien: 216 Nennungen; Italien: 312; Frankreich: 418; England: 359; USA: 188.

Erläutern Sie, warum eine klassische relative Häufigkeitstabelle für diese Daten nicht sinnvoll ist.

Wie können Sie die vorliegenden Daten stattdessen sinnvoll mithilfe von relativen Häufigkeiten zusammenfassen und darstellen?

Aufgabe 10

Angenommen, Ihnen liegt als Ergebnis einer Befragung ausschließlich eine Häufigkeitstabelle mit absoluten Häufigkeiten vor. Können Sie anhand dieser Tabelle die korrespondierende relative Häufigkeitstabelle erstellen?

Wie verhält es sich im umgekehrten Fall? Können Sie auf Basis einer relativen Häufigkeitstabelle auch die entsprechende Tabelle mit absoluten Häufigkeiten erstellen?

Begründen Sie Ihre Antworten.

Lösungen für die Aufgaben zum Thema Zusammenfassen von kategorialen Daten

Lösung 1

11 Kunden bevorzugen Marke A, 9 Kunden geben Marke B den Vorzug. Dieses Ergebnis ist in der folgenden Häufigkeitstabelle dargestellt. Marke A hat damit mehr Stimmen erhalten, insgesamt liegen beiden Marken jedoch sehr dicht beieinander.

Bevorzugte Marke

Absolute Häufigkeit

Marke A

11

Marke B

 9

Gesamt

20

Lösung 2

Kategoriale Daten können sehr gut durch die einfache Angabe der absoluten Häufigkeiten der einzelnen Kategorien zusammengefasst werden, solange man dabei stets die Gesamtzahl aller Beobachtungen im Auge behält.

Die Ergebnisse der Volksabstimmung sind in der folgenden Tabelle dargestellt. Da insgesamt 18.726 Einwohner abgestimmt haben und davon 10.479 mit Ja stimmten, ergibt sich die Anzahl der Nein-Stimmen aus der Differenz und beträgt damit 18.726 – 10.479 = 8.247.

Es ist wichtig, die Gesamtzahl der Befragten zu kennen, da sich nur im Vergleich zu dieser Gesamtzahl die Häufigkeiten einzelner Kategorien bewerten lassen.

Wahl

Absolute Häufigkeit

Ja

10.479

Nein

 8.247

Gesamt

18.726

Lösung 3

Dieses Beispiel zeigt, wie wichtig es ist, bei der Ergebnisdarstellung nicht nur die Antworten der Befragungsteilnehmer auszuweisen, sondern auch anzugeben, wie viele Personen insgesamt gefragt wurden und welcher Anteil davon tatsächlich an der Befragung teilgenommen hat.

Die Ergebnisse der Befragung werden in der folgenden Häufigkeitstabelle wiedergegeben.

Würden in dieser Tabelle die Befragten ohne Antwort nicht mit ausgewiesen werden, würden sich die Häufigkeiten der einzelnen Kategorien nicht zu 1.000 (der Gesamtzahl der Befragten) addieren. Grundsätzlich besteht natürlich die Möglichkeit, die Ergebnisse nur auf Basis der gültigen Antworten darzustellen, diese Darstellung könnte jedoch verzerrt sein und relevante Informationen verschweigen. Würde man die Befragten ohne Antwort einfach unter den Tisch fallen lassen, würde man damit implizit unterstellen, diese Personen hätten, wenn sie denn an der Befragung teilgenommen hätten, im Wesentlichen genauso geantwortet wie die tatsächlichen Befragungsteilnehmer. Diese Annahme ist jedoch nicht ohne Weiteres zulässig.

Haben Sie im letzten Jahr den Zoo besucht?

Absolute Häufigkeit

Ja

  592

Nein

  198

keine Antwort

  210

Gesamt

 1.000

Lösung 4

Wenn Sie für die Zusammenfassung kategorialer Daten statt absoluter Häufigkeiten Prozentwerte angeben, erzeugen Sie damit eine relative Häufigkeitstabelle. Ein Vorteil einer solchen relativen Häufigkeitstabelle besteht darin, dass sich die Anteile der einzelnen Kategorien (also ihre relativen Häufigkeiten) stets zu 100% addieren. Dadurch fällt es häufig leichter, die Ergebnisse zu interpretieren, da sich die Bedeutung einzelner Kategorien in Relation zu den übrigen Kategorien leichter ablesen lässt, insbesondere wenn viele verschiedene Kategorien betrachtet werden. Ferner können verschiedene Tabellen gleichen Aufbaus miteinander verglichen werden.

Lösung 5

Relative Häufigkeiten leisten genau das, was ihr Name verspricht: Sie helfen dabei, die einzelnen Ergebnisse in Relation zueinander zu setzen.

11 von 20 Kunden bevorzugen Marke A, 9 der 20 Befragten haben Marke B gewählt. Die relative Häufigkeitstabelle für dieses Ergebnis ist in der folgenden Darstellung wiedergegeben. Marke A hat mehr Stimmen erhalten, allerdings liegen beide Marken nahe beieinander: 55% der Kunden präferieren Marke A, 45% geben Marke B den Vorzug.

Bevorzugte Marke

Relative Häufigkeit

Marke A

55%

Marke B

45%

Häufig lassen sich Prozentangaben leichter interpretieren als absolute Häufigkeiten, denn für eine sinnvolle Bewertung von absoluten Häufigkeiten müssen diese immer noch in Relation zur Basis gesetzt werden, Sie benötigen also Aussagen der Art »soundso viele von insgesamt soundso vielen«.

Lösung 6

Die Ergebnisse sind in der folgenden relativen Häufigkeitstabelle wiedergegeben. Der Prozentwert der Ja-Stimmen beträgt 10.479 ÷ 18.726 = 55,96%. Da die Gesamtheit stets 100% umfasst, lässt sich der Anteil der Nein-Stimmen berechnen als 100% – 55,96% = 44,04%.

Wahl

Relative Häufigkeit

Ja

55,96%

Nein

44,04%

Lösung 7

Die folgende Tabelle gibt die relative Häufigkeitstabelle für die Befragungsergebnisse wieder. Um die Ergebnisse angemessen interpretieren zu können, ist es wichtig, auch die Antwortrate zu kennen. Je höher die Antwortrate, desto besser. Die Antwortrate beträgt hier 59,2% + 19,8% = 79%. Dies ist der Gesamtanteil der Personen, die auf die Frage in irgendeiner Form (mit Ja oder Nein) geantwortet haben. 21 Prozent haben dagegen nicht geantwortet.

Haben Sie im letzten Jahr den Zoo besucht?

Relative Häufigkeit

Ja

592 ÷ 1.000 = 0,592 = 59,2%

Nein

19,8%

keine Antwort

21%

Lösung 8

Ein Nachteil einer relativen Häufigkeitstabelle besteht darin, dass sie nur die prozentuale Verteilung der Ergebnisse anzeigt, nicht aber die absolute Anzahl der Beobachtungen, die der Tabelle zugrunde liegen. Ohne diese Information lässt sich jedoch nicht einschätzen, wie zuverlässig die Ergebnisse sind und ob ihre Aussagekraft hinreichend groß ist, um die Ergebnisse zu verallgemeinern. Diese Schwäche von relativen Häufigkeitstabellen können Sie vermeiden, indem Sie einfach die Größe der Stichprobe direkt ober- oder unterhalb der Tabelle mit angeben.

Wenn Sie eine relative Häufigkeitstabelle erstellen, geben Sie gemeinsam mit der Tabelle stets die Stichprobengröße an.

Lösung 9

Besonders vorsichtig müssen Sie bei der Interpretation von solchen Tabellen sein, bei denen es möglich ist, dass eine Person (beziehungsweise allgemein eine Beobachtung) mehreren Kategorien gleichzeitig zugeordnet ist.

Die Häufigkeiten der einzelnen Kategorien addieren sich hier nicht zu 1.000, der Stichprobengröße, da jeder Befragte eines, mehrere oder auch gar keines der Reiseziele aus der Liste auswählen kann. Es ist also nicht sichergestellt, dass jeder Befragte im Ergebnis genau einer Kategorie zugeordnet ist. Wenn Sie die Summe aller Antworten berechnen (1.493) und die Häufigkeit jeder einzelnen Kategorie durch 1.493 teilen, erhalten Sie die relative Häufigkeit dieser Kategorie. Die relativen Häufigkeiten sämtlicher Kategorien addieren sich dabei auch zu 100%, genau so, wie es sein soll. Aber was sagen die relativen Häufigkeiten aus? Es ist sehr schwierig, diese Prozentwerte zu interpretieren, denn sie basieren nicht auf der Anzahl der befragten Personen (sondern auf der Anzahl der insgesamt genannten Reiseziele).

Eine Möglichkeit, die Ergebnisse sinnvoll darzustellen, besteht darin, für jedes Urlaubsziel den Anteil der Personen anzugeben, die dieses Urlaubsziel bereits besucht haben (im Vergleich zu den Personen, die das Urlaubsziel noch nicht kennen). Diese Prozentangaben beziehen sich nur jeweils auf das einzelne Urlaubsziel und addieren sich daher für jedes einzelne Urlaubsziel zu 100% (Anteil der Besucher + Anteil der Nichtbesucher = 100%). Die folgende Tabelle stellt die Ergebnisse in dieser Form dar.

Beachten Sie aber:

Bei dieser Tabelle handelt es sich nicht um eine relative Häufigkeitstabelle, auch wenn die Darstellung freilich relative Häufigkeiten nutzt.

Urlaubsziel

% Besucher

% Nichtbesucher

Spanien

216 ÷ 1.000 = 21,6%

100% – 21,6% = 78,4%

Italien

312 ÷ 1.000 = 31,2%

68,8%

Frankreich

418 ÷ 1.000 = 41,8%

58,2%

England

359 ÷ 1.000 = 35,9%

64,1%

USA

188 ÷ 1.000 = 18,8%

81,2%

Nicht in allen Tabellen, die Prozentangaben ausweisen, müssen sich diese zu 1 (beziehungsweise 100%) addieren. Verbiegen Sie eine Tabelle daher nicht so lange, bis sich eine Summe von 100% ergibt, wenn dies gar nicht erforderlich ist. Hinterfragen Sie besser stets, ob es sein kann, dass eine Person (oder allgemein eine Beobachtung) in mehrere Kategorien fällt. Ist dies der Fall, ist eine relative Häufigkeitstabelle, in der sich die einzelnen relativen Häufigkeiten zu 100% addieren, für die Darstellung der Ergebnisse nicht geeignet.

Lösung 10

Sie können immer einfach sämtliche absoluten Häufigkeiten zu einer Gesamthäufigkeit addieren und anschließend die relativen Häufigkeiten berechnen, indem Sie die einzelnen absoluten Häufigkeiten durch die Gesamthäufigkeit teilen.

Liegen Ihnen dagegen nur die Prozentangaben vor, können Sie nicht ohne Weiteres rückwärts vorgehen und die ursprünglichen absoluten Häufigkeiten ermitteln, es sei denn, Ihnen ist auch die Anzahl der Personen (Beobachtungen) bekannt, die insgesamt befragt wurden. Angenommen, Sie wissen, dass 80% der Personen aus einer Umfrage Eiscreme mögen. Wie viele Personen mögen dann Eiscreme? Wenn insgesamt 100 Personen befragt wurden, mögen 80 Befragte (100 · 0,8) Eiscreme. Umfasst die Stichprobe dagegen nur 50 Befragte, mögen 40 der Befragten (50 · 0,8) Eiscreme. Wurden insgesamt nur 5 Personen befragt, mögen nur 4 davon (5 · 0,8) Eiscreme. Diese Rechnungen zeigen noch einmal, wie wichtig es ist, dass eine relative Häufigkeitstabelle an irgendeiner Stelle auch die Größe der Stichprobe mit ausweist.

Achten Sie bei der Auswertung einer relativen Häufigkeitstabelle stets auf die Größe der Stichprobe. Lassen Sie sich nicht von einer isolierten Prozentangabe in die Irre führen, indem Sie implizit unterstellen, diese Angaben würden schon auf einer großen Anzahl von Beobachtungen basieren. Häufig ist dies nicht der Fall.

Kapitel 2

Kategoriale Daten darstellen: Grafiken und Diagramme

IN DIESEM KAPITEL

Grafiken und Diagramme erstellenGrafiken und Diagramme richtig interpretierenIrreführende Grafiken und Diagramme erkennen

Für eine Auswertung von kategorialen Daten wird im ersten Schritt zumeist eine Häufigkeitstabelle erstellt, die sämtliche Kategorien, die in den Antworten beziehungsweise den Daten vorkommen können, auflistet und dabei für jede Kategorie die absolute Häufigkeit oder den prozentualen Anteil (relative Häufigkeit), mit dem die jeweilige Kategorie in den Daten vertreten ist, ausweist. In diesem Kapitel wird nun der zweite Schritt in der Auswertung kategorialer Daten geübt, nämlich das Erstellen, Interpretieren und Auswerten von Grafiken und Diagrammen für kategoriale Daten.

Kreisdiagramme erstellen, interpretieren und auswerten

Ein Kreisdiagramm (häufig auch als Tortendiagramm bezeichnet) stellt einen Kreis dar, der in verschiedene Segmente (Tortenstücke) unterteilt ist. Jedes Segment entspricht einer Kategorie und die Größe der einzelnen Segmente zeigt an, welcher Anteil der insgesamt betrachteten Personen (beziehungsweise Beobachtungen) der jeweiligen Kategorie zuzuordnen ist. Größere Segmente repräsentieren Kategorien mit einer größeren Anzahl von Personen (Beobachtungen), kleine Segmente entsprechend Kategorien, auf die nur wenige Personen (Beobachtungen) entfallen.

Bevor Sie ein Tortendiagramm anfertigen, können Sie die darzustellenden Daten zunächst in einer Tabelle zusammenfassen. So listet eine Häufigkeitstabelle sämtliche Kategorien aus den untersuchten Daten auf und gibt für jede Kategorie an, wie viele Personen (Beobachtungen) der jeweiligen Kategorie angehören. Die Summe der Häufigkeiten sämtlicher Kategorien ergibt die Stichprobengröße. Eine relative Häufigkeitstabelle nennt dagegen für jede Kategorie den prozentualen Anteil von Personen (Beobachtungen), der auf die jeweilige Kategorie entfällt. Diese Anteilswerte erhält man, indem man die absoluten Häufigkeiten der einzelnen Kategorien durch die Stichprobengröße teilt. Die relativen Häufigkeiten aller Kategorien addieren sich stets zu 100%.

Kreisdiagramme sind generell gut geeignet, die relative Größe der einzelnen Kategorien anschaulich darzustellen, in bestimmten Fällen können Kreisdiagramme aber auch leicht irreführend oder unbrauchbar sein. Bei der Erstellung von Kreisdiagrammen sollten Sie daher insbesondere die folgenden Punkte beachten:

Sind alle wichtigen Informationen wie zum Beispiel die Größe der zugrunde liegenden Stichprobe enthalten?

Sind die Kategorien hinreichend detailliert dargestellt? So gibt es zum Beispiel immer wieder Kreisdiagramme, die nur wenige Segmente umfassen, von denen das größte Segment nur sehr schwammig mit einem Begriff wie »Sonstiges« bezeichnet ist.

Sind die Kategorien hinreichend gut unterscheidbar? Ein Kreisdiagramm sollte nicht zahllose kleine Kategorien darstellen, wodurch die einzelnen Segmente derart klein werden, dass sich im Ergebnis gar nichts mehr erkennen lässt.

Mit zunehmender Erfahrung im Umgang mit Kreisdiagrammen fällt es immer leichter, die Schwachstellen in einem Kreisdiagramm zu erkennen und einzuschätzen, ob eine Darstellung in einem Kreisdiagramm seriös und glaubwürdig ist. Die folgenden Beispiele und Übungen sollen genau diese Punkte verdeutlichen.

Beispiel

Ein Computerladen möchte herausfinden, wie viele seiner Kunden weiblich sind. Der Geschäftsführer betrachtet eine Zufallsstichprobe von 76 Kunden, die den Laden betreten, und notiert das Geschlecht der einzelnen Kunden. 22 Kunden sind weiblich, alle übrigen sind männlich. Das Ergebnis ist in dem folgenden Tortendiagramm dargestellt.

Beschreiben Sie das Ergebnis.

Wie lässt sich dieses Kreisdiagramm noch verbessern?

Lösung

Offenbar stellen die Männer die Mehrheit unter den Kunden des Computerladens, die Frauen haben aber auch einen nicht zu vernachlässigenden Anteil.

Die in dem Kreisdiagramm dargestellten Ergebnisse zeigen, dass der Anteil der Frauen unter den Kunden ungefähr ein Drittel und damit circa 33% beträgt.

Das Diagramm lässt sich noch verbessern, indem für jedes Segment auch die tatsächlichen Prozentangaben mit ausgewiesen werden. (Die genauen prozentualen Anteile betragen für die Frauen 28,9% und für die Männer 71,1%.)

Aufgabe 1

Angenommen, 375 Personen werden gefragt, welche Art von Auto sie fahren: Geländewagen, Kombi oder ein normales Auto. Die Ergebnisse dieser Befragung sind in der folgenden Häufigkeitstabelle wiedergegeben.

Kategorie

Absolute Häufigkeit

Geländewagen

150

Kombi

125

normales Auto

100

Gesamt

375

Erstellen Sie eine relative Häufigkeitstabelle für diese Ergebnisse.

Stellen Sie die Ergebnisse in einem Kreisdiagramm dar.

Interpretieren Sie die Ergebnisse.

Aufgabe 2

Angenommen, ein Restaurantbesitzer beobachtet, zu welchen Zeiten seine Gäste das Restaurant besuchen: zum Frühstück, Mittagessen, Abendessen oder zu einer anderen Zeit. Einen Monat lang notiert er genau die Besuchszeiten all seiner Gäste. Insgesamt besuchen in diesem Monat 1.000 Gäste das Restaurant. Das Tortendiagramm gibt die Ergebnisse seiner Beobachtung wieder.

Welche Erkenntnisse lassen sich aus diesem Diagramm für den Restaurantbesitzer ablesen?

Welches Problem könnte es mit der Kategorie »Andere« geben? Wie könnte eine solche Untersuchung in der Zukunft verbessert werden?

Aufgabe 3

Angenommen, eine Büroangestellte möchte herausfinden, wie sie künftig besser mehrere Aufgaben gleichzeitig erledigen kann. Sie hat festgestellt, dass sie einen Großteil ihrer Arbeitszeit mit der Beantwortung von E-Mails zubringt, und hat daher ihre E-Mails in fünf Kategorien unterteilt: 1. Hohe Priorität; 2. Mittlere Priorität; 3. Niedrige Priorität; 4. Privat; 5. Spam-Mails, die unmittelbar gelöscht werden können. Unten sehen Sie eine Häufigkeitstabelle, in der die Beobachtungen der Büroangestellten für einen Zeitraum von zwei Wochen zusammengefasst sind.

Erstellen Sie eine relative Häufigkeitstabelle für diese Daten.

Erstellen Sie ein Kreisdiagramm für diese Daten.

Interpretieren Sie die Ergebnisse für die Büroangestellte.

Kategorie

Absolute Häufigkeit

Kategorie

Absolute Häufigkeit

Hohe Priorität

 60

Privat

 50

Mittlere Priorität

120

Spam

150

Niedrige Priorität

 20

Gesamt

400

Aufgabe 4

Angenommen, eine Befragung soll Aufschluss darüber geben, welche Haustiere die Menschen in Deutschland so besitzen. Die Antworten von 100 Befragten zeigen, dass 40 Personen einen Hund, 60 eine Katze, 20 einen Fisch und 10 einen Hamster haben. Können diese Daten sinnvoll in einem Tortendiagramm dargestellt werden? Begründen Sie Ihre Antwort.

Aufgabe 5

Angenommen, als Teil der Führerscheinausbildung haben Fahrschüler die Aufgabe, an einer Kreuzung mit Stoppschild zu beobachten, ob die Autofahrer tatsächlich korrekt anhalten. Die Fahrschüler notieren dabei zwei Stunden lang, ob die Autofahrer an dem Stoppschild tatsächlich zu einem kompletten Stopp kommen, langsam an dem Stoppschild vorbeirollen oder das Schild komplett missachten. Die beobachteten Daten sind in dem folgenden Kreisdiagramm wiedergegeben.

Interpretieren Sie die Ergebnisse gemäß der Darstellung in dem Kreisdiagramm.

Welche Information fehlt in dem Kreisdiagramm?

Beeinflusst die fehlende Information die Interpretation der Ergebnisse?

Ist es möglich, die Ergebnisse aus dem Kreisdiagramm zu verallgemeinern und auf die Gesamtheit der Autofahrer zu schließen?

Aufgabe 6

20 Angestellte eines Büros werden gefragt, ob sie es vorziehen würden, von zu Hause aus zu arbeiten. Von den 10 befragten Frauen haben 7 angegeben, sie würden in der Tat lieber zu Hause arbeiten; 3 sagten, sie würden dies nicht vorziehen. Von den 10 befragten Männern lehnten 8 die Arbeit von zu Hause aus ab; 2 würden dagegen lieber von zu Hause aus arbeiten. Vergleichen Sie die Ergebnisse, indem Sie zwei Kreisdiagramme erstellen. Beeinflusst das Geschlecht die Präferenz für den Arbeitsort? Erläutern Sie Ihre Antwort.

Aufgabe 7

Geben Sie ein Beispiel für kategoriale Daten, die sich nicht sinnvoll in einem Kreisdiagramm darstellen lassen.

Aufgabe 8

Eine Studie soll herausfinden, ob Arbeitgeber und Angestellte der Meinung sind, dass das Surfen auf nicht arbeitsrelevanten Websites im Internet die Arbeitsproduktivität der Angestellten verringert. Die Ergebnisse einer entsprechenden Befragung sind in dem folgenden Kreisdiagramm wiedergegeben.

Interpretieren Sie die Ergebnisse.

Welche wichtige Information fehlt in den Kreisdiagrammen?

Balkendiagramme erstellen, interpretieren und auswerten

Balkendiagramme sind wahrscheinlich die in den Medien am häufigsten verwendete Form der grafischen Darstellung von Daten. Ebenso wie Kreisdiagramme stellen auch Balkendiagramme kategoriale Daten dar, indem für jede einzelne Kategorie die absolute oder relative Häufigkeit grafisch wiedergegeben wird. Dazu verwenden Balkendiagramme, wie der Name bereits vermuten lässt, Balken, deren Länge die absolute oder relative Häufigkeit der jeweiligen Kategorie anzeigt.

Bevor Sie ein Balkendiagramm erstellen, kann es hilfreich sein, die Daten zunächst in einer Häufigkeitstabelle zusammenzufassen. Jeder Kategorie der Häufigkeitstabelle entspricht dann ein Balken in dem Balkendiagramm, wobei die Länge des Balkens die Häufigkeit der Kategorie anzeigt.

Wie Kreisdiagramme können auch Balkendiagramme, die nicht sorgfältig und korrekt erstellt wurden, leicht irreführend sein und einen falschen Eindruck von den Daten vermitteln. Achten Sie daher auf die Feinheiten bei der Darstellung in einem Balkendiagramm, die den Gesamteindruck der Grafik maßgeblich beeinflussen können.

Das folgende Beispiel verdeutlicht die Gemeinsamkeiten und Unterschiede von Balken- und Kreisdiagrammen.

Beispiel

Die beiden Abbildungen zeigen ein Kreisdiagramm und ein Balkendiagramm mit den Ergebnissen eines Ratespiels, das zehn Fragen umfasst. Beide Diagramme stellen die Anzahl der richtigen Antworten für die zehn verschiedenen Fragen dar. Nennen Sie für jedes der beiden Diagramme einen Vorteil, den dieses gegenüber der jeweils anderen Grafik hat.

Lösung

Das Kreisdiagramm stellt die einzelnen Kategorien als Teile eines Ganzen dar. Anhand dieser Darstellung können Sie die einzelnen Kategorien in Relation zur Gesamtheit setzen und bewerten, denn Sie wissen sofort, dass sich die Anteile der einzelnen Segmente zu 100% addieren. In dem Balkendiagramm ist es dagegen einfacher, die Kategorien miteinander zu vergleichen. Ein Vergleich der Kategorien ist grundsätzlich auch in dem Kreisdiagramm möglich, die Unterschiede zwischen den Kategorien sind jedoch im Balkendiagramm auf einen Blick zu erkennen. Ohne Angabe der genauen Prozentwerte wäre ein solcher Vergleich im Kreisdiagramm kaum möglich.

Aufgabe 9

Die folgende Abbildung zeigt ein Balkendiagramm mit absoluten Häufigkeiten für insgesamt 500 Personen, die sich in drei Kategorien unterteilen (1: für ein Rauchverbot; 2: gegen ein Rauchverbot; 3: keine Meinung).

Erstellen Sie anhand der Daten aus dem Balkendiagramm eine relative Häufigkeitstabelle.

Verwenden Sie die relative Häufigkeitstabelle, um daraus die Daten in einem Balkendiagramm darzustellen.

Interpretieren Sie die Ergebnisse. Wie denken die Menschen dieser Stichprobe über ein Rauchverbot?

Aufgabe 10

Ein Fitnessklub bittet 30 seiner Mitglieder, die Servicequalität auf einer Skala mit den Noten sehr gut (1), gut (2), mittelmäßig (3) und schlecht (4) zu bewerten. Die Antworten der Mitglieder sind in dem folgenden Balkendiagramm wiedergeben. Wie viel Prozent der Mitglieder bewerteten den Service als gut?

Aufgabe 11

Ein Wahlforschungsinstitut möchte herausfinden, wie die Stimmungslage unter den Wählern in Bezug auf ein bestimmtes Thema X ist. Dazu befragt das Institut eine Zufallsstichprobe aus den wahlberechtigten Personen nach ihrer Meinung zu diesem Thema. Die Antworten sind in dem folgenden Balkendiagramm wiedergegeben.

Erstellen Sie eine Häufigkeitstabelle dieser Ergebnisse. (Vergessen Sie dabei nicht die Angabe der Gesamthäufigkeit.)

Beurteilen Sie das Balkendiagramm daraufhin, ob es die Ergebnisse angemessen und korrekt wiedergibt.

Aufgabe 12

Angenommen, eine Zufallsstichprobe von 270 Uni-Absolventen wird nach ihren aktuellen Prioritäten hinsichtlich ihrer Zukunftspläne befragt, wobei eine der möglichen Prioritäten der Kauf eines Hauses sei. Die Ergebnisse sind in dem folgenden Balkendiagramm dargestellt.

Das Balkendiagramm ist in dieser Form irreführend. Warum?

Erstellen Sie ein neues Balkendiagramm, das die Ergebnisse besser wiedergibt.

Aufgabe 13

Ein Autohändler, der sich auf Minivans spezialisiert hat, möchte etwas genauer erfahren, wer seine typischen Kunden sind. Eine der Variablen, die sich das Unternehmen dazu anschaut, ist das Geschlecht der Kunden. Das Ergebnis für diese Variable ist in dem folgenden Balkendiagramm wiedergegeben.

Interpretieren Sie das Ergebnis.

Denken Sie, dass das Balkendiagramm die Daten angemessen und korrekt darstellt? Begründen Sie Ihre Meinung.

Aufgabe 14

Es wird eine Befragung durchgeführt, um zu ermitteln, ob 20 Angestellte in einem bestimmten Büro es vorziehen würden, von zu Hause aus zu arbeiten. Das Gesamtergebnis der Befragung ist in dem oberen Balkendiagramm wiedergegeben, die Ergebnisse unterteilt nach Geschlecht sind im zweiten Balkendiagramm dargestellt.

Interpretieren Sie beide Grafiken.

Erläutern Sie, inwieweit die zusätzliche Berücksichtigung des Geschlechts im zweiten Diagramm einen Mehrwert für die Interpretation der Daten bietet. (Die spezielle Darstellungsform in dem zweiten Balkendiagramm wird als

gruppiertes Balkendiagramm

bezeichnet und häufig verwendet, wenn die dargestellten Ergebnisse nach zwei oder mehr Variablen differenziert werden sollen, wie hier nach Antwortverhalten und Geschlecht.)

Vergleichen Sie das gruppierte Balkendiagramm mit den Kreisdiagrammen, die Sie in Aufgabe 6 erstellt haben. Welche Darstellungsmethode eignet sich besser für den Vergleich zweier Gruppen?

Lösungen für die Aufgaben zum Thema Darstellen von kategorialen Daten

Lösung 1

Vor dem Erstellen eines Kreisdiagramms ist es häufig hilfreich, die zugrunde liegenden Daten zunächst in einer relativen Häufigkeitstabelle zusammenzufassen.

Die folgende Tabelle zeigt die relative Häufigkeitstabelle für diese Daten.

Kategorie

Relative Häufigkeit

Geländewagen

150 ÷ 375 = 0,400 = 40,0%

Kombi

125 ÷ 375 = 0,333 = 33,3%

normales Auto

100 ÷ 375 = 0,267 = 26,7%

Gesamt

375 ÷ 375 = 1,000 = 100%

Die folgende Grafik zeigt das Kreisdiagramm für die betrachteten Daten. (Das Kreisdiagramm wurde mit Excel erstellt. Wenn Sie das Kreisdiagramm mit der Hand gezeichnet haben, sollte es ähnlich aussehen, auch wenn es freilich nicht so präzise sein mag.)