Die Kaufempfehlung, die Ihnen ein Webstore ausspricht, die Einschätzung, welcher Kunde kreditwürdig ist, oder die Analyse der Werttreiber von Immobilien – alle diese Beispiele aus dem heutigen Leben sind Ergebnis moderner Verfahren der Datenanalyse. Dieses Buch führt in solche statistische Verfahren anhand der Programmiersprache R ein.
Ziel ist es, Leser mit der Art und Weise vertraut zu machen, wie führende Organisationen und Praktiker angewandte Statistik heute einsetzen. Weil sich mit der Digitalisierung auch die statistischen Verfahren verändert haben, vermittelt der Autor neben klassischen Analysemethoden wie Regression auch moderne Methoden wie Textmining und Random-Forest-Modelle. Dabei sind die Inhalte des Buchs durchgehend so aufbereitet, dass sie auch für Leser ohne umfangreiche mathematische Vorkenntnisse verständlich sind. Anhand von Fallbeispielen und Übungen werden die Leser durch alle Phasen der Datenanalyse geführt: Sie lernen, wie Daten eingelesen, aufbereitet, visualisiert, modelliert und kommuniziert werden können. Dabei wird vor allem die Aufbereitung, Umformung und Prüfung der Daten ausführlicher als in anderen Publikationen behandelt, da dieser Teil in der Praxis oft einen wesentlichen Teil des Aufwands ausmacht. Aber auch die Visualisierung bekommt viel Raum, denn gute Diagramme ermöglichen Einblicke, die Zahlen und Worte verbergen.
Mit seinem praxisorientierten Ansatz will das Buch dazu befähigen,
- alle grundlegenden Schritte eines Datenanalyseprojekts durchzuführen,
- Daten kompetent in R zu bearbeiten,
- simulationsbasierte Inferenzstatistik anzuwenden und kritisch zu hinterfragen,
- klassische und moderne Vorhersagemethoden anzuwenden und
- betriebswirtschaftliche Fragestellungen mittels datengetriebener Vorhersagemodelle zu beantworten.
Sowohl Anwender ohne statistisches Grundlagenwissen als auch Nutzer mit Vorerfahrung lesen dieses Buch mit Gewinn. In verständlicher Sprache und anhand von anschaulichen Beispielen zeigt der Autor, wie moderne Datenanalyse heute funktioniert.