Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
Business-Intelligence-Lösungen sind für Unternehmen unabdingbar, um Datenmengen in vertretbarer Zeit zu analysieren und daraus resultierend Entscheidungen zu treffen. Dieses Buch zeigt den Weg auf, wie aus Daten mittels Visualisierung entscheidungsrelevante Informationen für den Empfänger werden. Neue, interaktive und grafische Darstellungen tragen dazu bei, dass Entscheider ihr Wissen und ihre Fähigkeiten besser nutzen können, um einen echten Mehrwert für ihr Unternehmen zu generieren. Die Autoren bieten eine fundierte Einführung in das Thema und geben einen praxisnahen Überblick über Visual Business Analytics mit seinen drei Teilgebieten: Information Design, Visual Business Intelligence und Visual Analytics. Sie erläutern anhand vieler Beispiele aus Business-Intelligence-Anwendungsszenarien, welche Darstellungsformen jeweils geeignet sind, um komplexe Zusammenhänge abzubilden, wie Unternehmen Visual Business Analytics erfolgreich nutzen können und welche zukünftigen Möglichkeiten sich durch interaktive Darstellungen ergeben. Im Einzelnen werden behandelt: - Visualisierung von Daten und Informationen - Reporting und Information Design - Diagrammtypen und -eigenschaften - Information-Design-Richtlinien - Visual Business Intelligence - Interaktive Visualisierung - Dashboard-Design - Visual Analytics in Big-Data-SzenarienAnwendungsbeispiele mit aktuellen Business-Intelligence-Werkzeugen im Bereich Visual Analytics und ein Blick in die Forschung runden das Buch ab. Die 2. Auflage wurde durchgehend überarbeitet, aktualisiert und um neue Themen wie Visualisierungsstandards und maschinelles Lernen erweitert.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 343
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
Prof. Dr. Jörn Kohlhammer ist Abteilungsleiter für den Bereich Visual Analytics am Fraunhofer IGD. Er studierte Informatik mit Betriebswirtschaftslehre an der LMU München. Nach seiner Forschungstätigkeit am Fraunhofer-Center for Research in Computer Graphics in Providence, RI, USA promovierte er 2005 an der TU Darmstadt. Seine Abteilung betreibt angewandte Forschung für Visual Business Analytics, visuelle Ansätze der Cybersicherheit sowie der Analyse medizinischer Daten. Seit 2015 ist er zudem Honorarprofessor für User-Centered Visual Analytics an der TU Darmstadt. Prof. Kohlhammer ist Autor und Co-Autor vieler Bücher, Fachartikel und Konferenzbeiträge. Er ist regelmäßiger Redner bei Veranstaltungen und Kongressen in der Industrie und der Forschung und anerkannter Experte zum Thema Visual Analytics und Visual Business Intelligence.
Dirk U. Proff ist als Founder und CEO der blueforte GmbH, einer vielfach prämierten Unternehmensberatung, für die Bereiche Strategy und Corporate Development verantwortlich. Er studierte Wirtschaftsinformatik an der privaten Fachhochschule Wedel sowie Administration and Management an der Harvard University. Danach war er für mehrere internationale Managementberatungen in unterschiedlichen Führungspositionen tätig und erhielt darüber hinaus den Lehrauftrag für Betriebswirtschaftliche Informationsverarbeitung an der EBC Hochschule Hamburg. Neben Publikationen in Fachzeitschriften veröffentlicht er regelmäßig wissenschaftliche Artikel in Fach- und Lehrbüchern und hält zudem Vorträge auf Veranstaltungen und internationalen Konferenzen. Dirk U. Proff ist Pionier und anerkannter Experte für die Themen Information Design und Visual Business Intelligence sowie Gründungsmitglied der IBCS Association. Er war jahrelang Mitglied des Fachbeirats der Fachzeitschrift BI-SPEKTRUM und ist einer von 14 TDWI Europe Fellows.
Andreas Wiener ist Geschäftsführer der reportingimpulse GmbH, die auf Information Design, Dashboarding und Change Management spezialisiert ist. Andreas Wiener absolvierte sein geisteswissenschaftliches Studium an der Christian-Albrechts-Universität zu Kiel und war danach bei mehreren Unternehmensberatungen tätig. Er ist Herausgeber der Bücher »Managementberichte gekonnt visualisieren« und »Reporting- und Business-Intelligence-Werkzeuge für den Controller«, in denen verschiedene Unternehmen von ihren Erfahrungen zum Thema Visualisierung berichten. Neben seiner Tätigkeit als Key Note Speaker auf internationalen Konferenzen ist er Vorsitzender des TDWI Roundtable in Berlin.
Zu diesem Buch – sowie zu vielen weiteren dpunkt.büchern – können Sie auch das entsprechende E-Book im PDF-Format herunterladen. Werden Sie dazu einfach Mitglied bei dpunkt.plus+:
www.dpunkt.plus
Jörn Kohlhammer · Dirk U. Proff · Andreas Wiener
Effektiver Zugang zu Daten und Informationen
2., überarbeitete und aktualisierte Auflage
Edition TDWI
Jörn Kohlhammer · [email protected]
Dirk U. Proff · [email protected]
Andreas Wiener · [email protected]
Fachlektorat: Dr. Carsten Bange, Business Application Research Center - BARC GmbH
Lektorat: Christa Preisendanz
Copy Editing: Ursula Zimpfer, Herrenberg
Satz: Birgit Bäuerlein
Herstellung: Susanne Bröckelmann
Umschlaggestaltung: Anna Diechtierow, Heidelberg; Helmut Kraus, www.exclam.de
Druck und Bindung: M.P. Media-Print Informationstechnologie GmbH, 33100 Paderborn
Fachliche Beratung und Herausgabe von dpunkt.büchern in der Edition TDWI:
Prof. Dr. Peter Gluchowski · [email protected]
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
ISBN:
978-3-86490-410-3
978-3-96088-519-1
ePub
978-3-96088-520-7
mobi
978-3-96088-521-4
2., überarbeitete und aktualisierte Auflage
Copyright © 2018 dpunkt.verlag GmbH
Wieblinger Weg 17
69123 Heidelberg
Die vorliegende Publikation ist urheberrechtlich geschützt. Alle Rechte vorbehalten. Die Verwendung der Texte und Abbildungen, auch auszugsweise, ist ohne die schriftliche Zustimmung des Verlags urheberrechtswidrig und daher strafbar. Dies gilt insbesondere für die Vervielfältigung, Übersetzung oder die Verwendung in elektronischen Systemen.
Es wird darauf hingewiesen, dass die im Buch verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken- oder patentrechtlichem Schutz unterliegen.
Alle Angaben und Programme in diesem Buch wurden mit größter Sorgfalt kontrolliert. Weder Autor noch Verlag können jedoch für Schäden haftbar gemacht werden, die in Zusammenhang mit der Verwendung dieses Buches stehen.
5 4 3 2 1 0
Die Visualisierung von Daten ist ein wesentlicher Baustein zur Entscheidungsunterstützung.
Die Gründe dafür sind vielfältig:
1.
Big Data
Unternehmen sehen sich einer stark wachsenden Menge und Vielfalt an Daten gegenüber, die analysiert und angezeigt werden sollen. Je größer die Menge an Daten, desto wichtiger und interessanter sind visuell dargestellte Muster und Entwicklungen statt einer Anzeige von Einzelwerten.
Gerade bei Datenströmen mit sehr vielen schnell aktualisierten Daten oder noch unbekannten Datenquellen helfen Visualisierungsmethoden Anwendern, interessante Konstellationen zu identifizieren und einen Mehrwert aus Big Data zu ziehen.
2.
Advanced Analytics und Data Discovery
Mit fortschreitender Reife und Durchdringung von BI in Unternehmen wächst die Bedeutung des Einsatzes fortgeschrittener Analyseverfahren, z. B. im Rahmen einer explorativen Datenanalyse. Eine Analyse schafft durch die Generierung neuer Information einen Mehrwert, der durch das Reporting historischer Daten so nicht erreicht werden kann. Um Fachanwendern Muster und Modelle als Analyseergebnisse verständlich zu machen, sind Visualisierungsverfahren ein fester Bestandteil und Erfolgsfaktor der fortgeschrittenen Analyse.
3.
Consumerization und Self-Service BI
Anwender erwarten intuitive Benutzungsoberflächen und visuell ansprechende Applikationen, gerade weil es hier in den letzten Jahren bei Anwendungen im Privatbereich große Fortschritte gab. Dies setzt die Standards auch für Geschäftsanwendungen (Consumerization of IT). Der Trend zur »Self-Service BI« umfasst insbesondere auch die Möglichkeit zur Visualisierung und visuellen Analyse.
Die einschlägigen und neuen Softwareanbieter für Business Intelligence/Analytics haben ihre Visualisierungsfähigkeiten in den letzten Jahren deutlich ausgebaut. Wie Visualisierung sinnvoll eingesetzt wird, ist aber nicht nur eine Frage der Möglichkeiten in den Werkzeugen. Es sind die Anwender, die sowohl in der visuellen Analyse als auch im Einsatz von Visualisierung in Reporting und Ergebniskommunikation geschult werden müssen. Standards des Information Design können hier beispielsweise eine gute Hilfestellung liefern.
Die ausführliche Auseinandersetzung mit diesem Themenkomplex in Form eines Buches war zum Zeitpunkt der ersten Auflage überfällig und so bisher im deutschsprachigen Raum nicht verfügbar. Dem Autorenteam ist es auch in der vorliegenden zweiten Auflage des Buches wieder gut gelungen, Ziele, Methoden und Verfahren umfassend vorzustellen, aber auch für den Praktiker durch Beispiele greifbar zu machen.
Ich wünsche eine anregende Lektüre, die ihren Mehrwert durch eine Umsetzung in der betrieblichen Praxis beweist.
Dr. Carsten Bange
Geschäftsführer Business Application Research Center GmbH (BARC)Würzburg, im Januar 2018
Vor Ihnen liegt die zweite Auflage unseres Buches, für die es zwei gute Gründe gibt. Wir freuen uns sehr über die hohe Anerkennung für die erste Auflage und die weiterhin starke Nachfrage. Deshalb haben wir uns auch dazu entschlossen, eine überarbeitete Version herauszubringen. Als das Buch Mitte 2013 erschien, waren die verschiedenen Anwendungsfelder für Visualisierungen – Information Design, Visual Business Intelligence und Visual Analytics – noch nahezu unbekannt. Das Buch hatte die Aufgabe, das noch neue Thema im Markt zu platzieren und die wesentlichen Begrifflichkeiten sowie den titelgebenden Begriff »Visual Business Analytics« (VBA) für die verschiedenen Anwendungsgebiete bekannt zu machen. Mittlerweile zeichnet sich seitens der Anwender im Unternehmen als auch aufseiten der Softwarehersteller eine hohe Aufmerksamkeit für das Thema VBA ab. Die Wirksamkeit guter und durchdachter Visualisierungen bei der Analyse von massiven Datenmengen und zur Darstellung komplexer Sachverhalte und Steuerungskennzahlen wird von vielen Marktteilnehmern gesehen und anerkannt.
Die vor Ihnen liegende Ausgabe wird dieser Entwicklung gerecht, indem wir bestehende Inhalte aktualisiert und um neue Themen ergänzt haben. So hat die Bedeutung von Visualisierungsstandards für Information Design und Visual Business Intelligence in den letzten Jahren deutlich zugenommen. Als bedeutender Standard haben sich beispielsweise die IBCS®-Standards etabliert, die aus den SUCCESS-Regeln von Prof. Dr. Rolf Hichert hervorgegangen sind. Die Visualisierungsstandards haben mittlerweile eine internationale Community, die das Regelwerk für ihre BI-Applikationen adaptiert haben und über ihr Feedback zur kontinuierlichen Verbesserung der Regeln beitragen. Um diese Entwicklung angemessen abzubilden, haben wir uns entschlossen, den IBCS®-Standards ein eigenes Unterkapitel zu widmen.
Gleichzeitig haben sich, motiviert durch aktuelle Trends wie Digitalisierung, Transformation von Geschäftsmodellen und Industrie 4.0, vollkommen neue Einsatzmöglichkeiten für VBA ergeben. Eines dieser neuen Themen, denen aktuell eine hohe Bedeutung beigemessen wird, ist maschinelles Lernen als Teilgebiet der künstlichen Intelligenz, dem wir auch ein eigenes Unterkapitel gewidmet haben. In diesem noch jungen Zweig lernen Maschinen auf Basis von Algorithmen, eigenständig aus »Big Data« Handlungsempfehlungen abzuleiten und Entscheidungen zu treffen.
Dank intensiver Projektarbeit mit Kunden haben wir uns ein Repertoire an praxisorientierten Erkenntnissen erarbeitet, die wir Ihnen in einigen dedizierten Abschnitten gerne weitergeben möchten. Da sich die Projekte aus den Teilgebieten Visual Business Intelligence und Visual Analytics stark unterscheiden, können wir Ihnen so ein hoffentlich spannendes Portfolio an Beispielen liefern. Wie in der ersten Auflage haben blueforte und Fraunhofer IGD wieder eine VBA-Studie durchgeführt, deren Ergebnisse Ihnen an den passenden Stellen im gesamten Buch einen repräsentativen Blick zu den einzelnen Themen aus Sicht der Anwender vermitteln sollen.
Ein besonderer Dank geht dabei für diese Ausgabe an Arne-Kristian Schulz von blueforte, der uns insbesondere bei der Einarbeitung der neuen Studienergebnisse unterstützt hat. Einen ganz herzlichen Dank möchten wir auch an den dpunkt.verlag richten, vor allem an Frau Christa Preisendanz, die mit viel Geduld und Nachdruck die Arbeiten an der zweiten Auflage gefördert hat. Außerdem möchten wir uns für die zahlreichen Anregungen von Lesern bedanken, die mit Kritik, Anregungen und Hinweisen zu einer Verbesserung und Erweiterung des Buches beigetragen haben. Wir möchten an dieser Stelle auch unsere zukünftigen Leser zu konstruktiver Kritik und Feedback ermuntern. Allen unseren Lesern wünschen wir eine hoffentlich lehrreiche und interessante Lektüre.
Jörn Kohlhammer, Dirk U. Proff, Andreas Wiener
Darmstadt und Hamburg, im März 2018
Visualisierung ist ein hochaktuelles Thema in Business Intelligence und Business Analytics. Viele Anbieter haben die Funktionalität ihrer Software gerade beim Benutzerinterface deutlich erweitert und werben mit neuen Möglichkeiten der Analyse und Vorhersage. Die neuen Versionen der Self-Service-BI-Werkzeuge beinhalten vielfach erweiterte Visualisierungstechniken, die bei sinnvoller Nutzung zusätzliche Einblicke in die Unternehmensdaten erlauben. Häufig verschwimmen dabei noch die Grenzen zwischen Marketingbroschüren und nutzbaren Visualisierungstechniken. Unternehmen wollen Visualisierung jedoch nur dann flächendeckend nutzen, wenn sie eindeutig verstanden haben, wie sie am Ende von den neuen Lösungen profitieren.
In dieser aktuellen Strömung haben wir und auch der TDWI-Verein den Bedarf für ein Buch über Visual Business Analytics gesehen. Denn der angesprochene Wissensbedarf in den Unternehmen lässt sich sicherlich am besten von einer neutralen Stelle beantworten. Mit dem Begriff Visual Business Analytics (VBA) beschreiben wir drei Teilthemen, denen wir jeweils ein Kapitel gewidmet haben: Information Design (ID), Visual Business Intelligence (VBI) und Visual Analytics (VA). Das Hauptziel unseres Buches ist es dabei, den Unternehmen Entscheidungshilfen und Vorgehensbeispiele in allen drei Teilgebieten an die Hand zu geben. Wir möchten auch einige Missverständnisse ausräumen, die in vielen Unternehmen zu verwirrenden oder ineffektiven Darstellungen führen.
Auch wenn heutige Werkzeuge eine Fülle an Visualisierungstechniken mitliefern, kann der Benutzer häufig nicht einschätzen, für welche seiner Daten sich denn nun welche Technik am besten eignet. In vielen Unternehmen können zwar ansprechende Dashboards entworfen werden, aber die Informationen werden anders dargestellt als in den täglichen Management-Reports. Dieses Buch möchte Wege aufzeigen, auch in der Visualisierung eine klare Linie im Unternehmen zu definieren. Absolutes Neuland betreten viele Unternehmen im Bereich Big Data. Es gibt zwar viele Angebote, wie das Datenmanagement beispielsweise auf Basis von Hadoop und verwandten Ansätzen erweitert werden kann. Doch bei effektiven, entscheiderfreundlichen Analyseumgebungen für diese neuen Datenquellen ist das Angebot noch deutlicher dünner.
Ein Leitthema von VBA ist das Sprichwort »Ein Bild sagt mehr als tausend Worte«. Die Erweiterung und Verbesserung von Visualisierungsfunktionalität haben sich aktuell fast alle führenden BI-Anbieter auf die Fahnen geschrieben. Wo früher einige kleine Nischenanbieter erste Self-Service-BI-Werkzeuge bereitstellten, gehen heute auch die großen Hersteller genau in diese Richtung. Dabei ist nicht immer jede Funktion ein echter Mehrwert für die Nutzer, auch wenn die visuelle Darstellung mit vielen Farben und Glanzeffekten daherkommt und sich auf Marketingbroschüren gut verkaufen lässt. VBA adressiert auch die wachsenden Anforderungen der Benutzer insbesondere im Hinblick auf einen intuitiven, zielführenden und interaktiven Zugang zu Daten und Informationen. Neue, interaktive und grafische Darstellungen können dafür sorgen, dass Entscheider ihr Wissen und ihre Fähigkeiten stärker nutzen können – wenn zumindest die wesentlichen Grundlagen der Visualisierung beachtet werden. Diesen Grundlagen werden wir uns in handhabbaren Einheiten in diesem Buch immer wieder widmen.
In Kapitel 1 beginnen wir mit einer Einführung in Visual Business Analytics und in die Teilthemen Information Design, Visual Business Intelligence und Visual Analytics. In allen Bereichen wird die Frage beantwortet, wie man bessere Wege zur Entscheidungsfindung über visuelle Darstellungen findet. Im Falle des Information Design sind diese Darstellungen statisch, in VBI und Visual Analytics immer dynamisch und interaktiv. In diesem Kapitel werden wir auch einen detaillierten Überblick über den aktuellen Markt und zukünftige Trends geben. Am Ende des Kapitels wird Ihnen klar sein, welche Möglichkeiten der visuellen Unterstützung es gibt und welche weiteren Kapitel für Sie und Ihr Unternehmen am relevantesten sind.
Alle Kapitel dieses Buches betrachten die Nutzung und Visualisierung von Daten und Informationen. Kapitel 2 wird daher genauer klären, was wir unter Daten verstehen und welchen Einfluss die verschiedenen Arten von Daten auf Visualisierung und Entscheidungsfindung haben. Jeder Datentyp, zum Beispiel hierarchische Daten, ist mit bestimmten Visualisierungen verbunden, die diesen Datentyp besonders gut darstellen, zum Beispiel eine Treemap. Dabei existiert eine breite Vielfalt an Visualisierungstechniken für alle möglichen Datentypen und Anwendungsszenarien, die in heutigen BI-Werkzeugen noch gar nicht verwendet werden. In unserer Historie werden wir auch einen kurzen Überblick über die Vergangenheit der Visualisierung bieten. Denn es gibt einen großen Fundus an Vorarbeiten in den Forschungs- und Entwicklungslabors von Universitäten und Forschungsinstituten, auf die wir auch in den weiteren Kapiteln immer wieder zurückkommen werden.
Die Kapitel 3–5 widmen sich im Detail den drei Themen innerhalb von VBA: Information Design für das Reporting, Informationsvisualisierung für Business Intelligence und Visual Analytics für Big Data. In Kapitel 1 werden die Unterschiede dieser drei Themen im Detail dargestellt, die einen guten Anhaltspunkt für die jeweiligen Einsatzmöglichkeiten geben. Alle drei Kapitel folgen dabei einem sehr praxisnahen roten Faden, der die Erklärung von VBA immer mit vielen Beispielen aus BI-nahen Anwendungsszenarien anreichert. Die Zusammenfassung am Ende und die verschiedenen Hinweise zur verwandten Literatur sollen einen abschließenden Überblick und viele Möglichkeiten zur weiteren Vertiefung geben.
Bevor wir in die Details von VBA einsteigen, möchten wir an dieser Stelle noch einigen Personen danken, die uns bei den vielen Dingen, die für dieses Buch zu erledigen waren, unterstützt haben. Zuerst einmal ganz herzlichen Dank an das Team im TDWI-Verein, das mit seinem Buchprogramm eine sehr interessante Veröffentlichungsreihe etabliert hat. Genauso geht unser Dank an das Team des dpunkt.verlags, das uns über die gesamte Zeit hinweg mit Rat und Tat zur Seite gestanden hat. Ein besonderes Dankeschön möchten wir Andreas Bannach am Fraunhofer IGD für seine Rechercheunterstützung sowie Kai-Uwe Stahl von blueforte für die Durchführung der Visual Business Analytics Studie 2012 richten.
Zuletzt möchten wir uns bei unseren Familien bedanken und insbesondere bei unseren Ehefrauen, die uns stets motiviert haben und viele Feiertage und Wochenenden es erdulden mussten, wie wir schreibend und mit Türmen von Büchern vor dem Computer saßen.
1Visual Business Analytics
1.1Bessere Wege der Entscheidungsfindung durch VBA
1.2Trends und Zukunft von VBA
2Visualisierung von Daten und Informationen
2.1Daten und Datentypen
2.1.1Daten
2.1.2Datentypen
2.1.3Datenakquisition und Datenherkunft
2.1.4Datenspeicherung
2.1.5Datenqualität in der Visualisierung
2.1.6Datenvorverarbeitung
2.2Syntax und Semantik
2.3Informationen
2.4Wissen
2.5Historie der Visualisierung
2.5.1Von der Antike bis zur frühen Neuzeit
2.5.2Die Neuzeit – Geburt der modernen Diagramme
2.5.3Die Moderne – Information Design und interaktive Visualisierung
2.6Zusammenfassung
3Reporting und Information Design
3.1Reporting
3.2Information Design
3.3Diagramme
3.3.1Säulen- und Balkendiagramme
3.3.2Kreisdiagramme
3.3.3Liniendiagramme
3.3.4Punktdiagramme
3.4Eigenschaften von Diagrammen
3.4.1Einsatz von Farben
3.4.2Schlanke Visualisierung
3.4.3Skalierung
3.4.4Diagrammnotation für Säulen- und Balkendiagramme
3.4.5Darstellung von Abweichungen
3.5Gestaltung von Tabellen
3.6Einführung einer Information-Design-Richtlinie
3.7International Business Communication Standards (IBCS®)
3.7.1Die IBCS®-Standards
3.7.2Die IBCS Association und ihre Entstehung
3.7.3Das IBCS®-Aus- und Fortbildungsprogramm
3.7.4IBCS®-zertifizierte Software
3.8Zusammenfassung
4Business Intelligence und Visualisierung
4.1Visual Business Intelligence
4.1.1Herausforderung
4.1.2Marktüberblick
4.2Interaktive Visualisierung
4.2.1Dynamische und geführte Berichte
4.2.2Motivation
4.2.3Menschliche Wahrnehmung
4.2.4Aufmerksamkeit
4.2.5Vorteile der Informationsvisualisierung
4.2.6Referenzmodell nach Card, Mackinlay und Shneiderman
4.2.7Interaktion
4.2.8Webbasierte Visualisierungen
4.2.9Das Shneiderman-Mantra
4.2.10Weitere Visualisierungsbeispiele
4.2.11Zusammenfassung
4.3Empfehlungen für das Dashboard-Design
4.3.1Der Einsatz von Dashboards in Unternehmen
4.3.2Einsatz geeigneter grafischer Elemente
4.3.3Interaktivität als besondere Herausforderung
4.3.4Anwendungsszenarien
4.4Anwendungsbeispiele
4.4.1Wer liefert was? GmbH
4.4.2Otto Group
4.4.3ProSiebenSat.1 Media SE
4.5Zusammenfassung
5Big Data und Visual Analytics
5.1Big Data
5.1.1Herausforderung
5.1.2Definition von Big Data
5.1.3Aktuelle Trends im Big-Data-Bereich
5.1.4Maschinelles Lernen
5.1.5Interaktive Analyse von Big Data
5.1.6Der Mensch im Mittelpunkt von Big Data?
5.2Visual Analytics
5.2.1Motivation
5.2.2Einführendes Beispiel
5.2.3Der Begriff Visual Analytics
5.2.4Der Visual-Analytics-Prozess
5.2.5Zusammenfassung
5.3Visual Analytics in Big-Data-Szenarien
5.3.1Aktuelle Situation in Unternehmen
5.3.2Aktueller Einsatz von Visual Analytics
5.3.3Auswahl einer geeigneten Vorgehensweise
5.3.4Einführung von Visual Analytics im Unternehmen
5.4Anwendungsbeispiele
5.4.1SAS Visual Analytics
5.4.2TIBCO Spotfire
5.4.3Tableau
5.4.4Risikomanagement
5.4.5Anwendungsfall aus dem Energiesektor
5.4.6Analysen zeitabhängiger Daten
5.4.7Visuelle Analyse von Energienetzen
5.4.8Zusammenfassung
5.5Ein Blick in die Forschung
5.6Zusammenfassung
Anhang
Abkürzungen
Literatur
Index
Die ständige Verfügbarkeit großer Datenmengen bestimmt zunehmend unser persönliches und unternehmerisches Handeln. Immer mehr Daten werden immer schneller erstellt – und überall fehlt die Zeit, um die Spreu vom Weizen zu trennen. So wachsen die Datenberge weiter, in denen die interessanten Informationen unter einer massiven Menge an uninteressanten Daten begraben sind. Immer mehr Unternehmen machen sich auf den Weg vom Datenzeitalter ins Informationszeitalter und wollen ihre Datenberge besser und effektiver analysieren, um daraus entscheidungsrelevantes Wissen zu ziehen. Die Schlagworte Big Data und Business Analytics stehen für diese Bestrebungen und sind aktuell von großem Interesse für die Wirtschaft. Sie ergänzen die bisherigen Ansätze von Business Intelligence und Data Warehousing um Technologien und Herangehensweisen, die mit den hochdynamischen, heterogenen und häufig unstrukturierten Datenmassen besser zurechtkommen.
Eine wesentliche Grundlage für den Erfolg eines Unternehmens ist die effektive Verarbeitung einer wachsenden Masse an Daten und Informationen sowie der Einsatz des Wissens und der Erfahrung der Mitarbeiter für geschäftsrelevante Entscheidungen. Ein großer Teil des vorhandenen Potenzials liegt zunehmend brach, da sich die Technologien für die Erzeugung, Speicherung und den Abruf von Daten in den letzten Jahren schneller entwickelt haben als die Möglichkeiten, die Daten effektiv zu nutzen. Kennzeichnend für diese Entwicklung ist eine gewachsene Trennung von automatisierten IT-Prozessen und den strategischen und operationellen Entscheidungsprozessen, an denen der Mensch in den Geschäftsprozess eingreifen muss.
Diese Trennung hat sicherlich die Entwicklung effektiver Verfahren für die Datenakquisition und Datenhaltung begünstigt. An der Schnittstelle zwischen Mensch und Maschine konnte die Technologie aber nicht in gleicher Weise Schritt halten. In vielen Unternehmen besteht diese Schnittstelle in der grafischen Aufbereitung eines Reports aus einer Excel-Tabelle mit Kennzahlen. Der Entscheider wird hier als (passiver) Empfänger von vorbereiteten Informationen in den Geschäftsprozess integriert. Er kann seiner eigentlichen Rolle innerhalb der Unternehmensprozesse, nämlich der Nutzung seiner Expertise und Erfahrung in der Bewertung der Sachlage, dadurch aktuell nicht in vollem Umfang gerecht werden.
Das Ziel von Business Intelligence, Business Analytics und so ziemlich jedem Bericht im Unternehmen war schon immer die Unterstützung von Entscheidungsträgern. Manchmal scheinen die aktuellen Technologien und Angebote im Big-Data-Bereich diese Tatsache in den Hintergrund zu rücken. Dieses Buch stellt den Menschen und den Entscheider in den Mittelpunkt des Interesses. Wir stellen in den einzelnen Kapiteln dabei immer wieder die Frage, wie wir Daten verarbeiten und Informationen darstellen müssen, damit Entscheider möglichst schnell die wesentlichen Aspekte erkennen können. Die Visualisierung von Informationen für Berichte, Informationssysteme und Analysen, zusammengefasst unter dem Begriff Visual Business Analytics (VBA), ist das zentrale Element dieses Buches.
In Unternehmen werden täglich Tausende von Entscheidungen getroffen. Es gibt auch ungefähr genauso viele Theorien und Ansätze, die erklären, wie Menschen Entscheidungen treffen. Dieses Buch will definitiv keine weitere Theorie hinzufügen, sondern betrachtet die Entscheidungsfindung eher allgemein wie die folgenden zwei Definitionen aus [Harris 2012]:
Entscheidungsfindung bezeichnet die Identifizierung und Auswahl von Möglichkeiten basierend auf den Werten und Prioritäten des Entscheiders.
Entscheidungsfindung ist der Prozess, in dem Unsicherheit und Zweifel über die bestehenden Möglichkeiten so weit reduziert wird, dass eine der Möglichkeiten sinnvoll ausgewählt werden kann.
Uns ist dabei bewusst, dass viele Entscheidungen nicht durch die akribische Identifikation aller Alternativen und anschließende Auswahl der besten Alternative getroffen werden. Gerade Experten und erfahrene Entscheider haben einen breiten Fundus an Wissen, der es ihnen erlaubt, sich innerhalb von Sekunden für ein (in den meisten Fällen sogar das optimale) Vorgehen zu entscheiden, ohne schwächere Alternativen überhaupt zu bedenken. Gary Klein, um einen bekannten Vertreter der Forschung zu nennen, hat dies in vielen Untersuchungen eindrucksvoll demonstriert [Klein 1999].
Der für dieses Buch zentrale Aspekt steckt aber in der zweiten Definition. Denn in einem Punkt sind sich eigentlich alle Ansätze einig: Die Verringerung von Unsicherheit und ein besseres Verständnis der Situation ermöglichen auch bessere Entscheidungen. Statt Situationkönnte man hier auch den Begriff Entscheidungsumfeld verwenden, das sämtliche Informationen, Werte und Prioritäten (siehe 1. Definition) beinhaltet [Spradlin 1997]. Tatsächlich kann man Folgendes sagen: Je mehr relevante Informationen vom Entscheider verarbeitet werden, desto höher wird die Wahrscheinlichkeit für eine gute Entscheidung. Spradlin erklärt aber auch, dass neben Unsicherheit vor allem die Informationsüberflutung die größte Herausforderung darstellt. Auf der Suche nach relevanten Informationen bekommen wir nämlich vor allem erst einmal mehr Informationen.
So betrachtet basieren viele Prozesse in Unternehmen darauf, dass aus großen Datenmengen relevante Informationen werden. Unternehmen definieren KPIs (Key Performance Indicators), die in prägnanter Form die aktuelle Situation einzelner Aspekte des Unternehmens kommunizieren. Analyseabteilungen durchforsten die Verkaufsdaten ihres Unternehmens nach neuen Erkenntnissen, um die Kunden besser zu verstehen und so Entscheidungen über das Produktportfolio zu unterstützen. Auch das Marketing arbeitet daran, welche Nachrichten bei potenziellen Kunden in all der Reizüberflutung vor allem als relevanteInformationen ankommen sollen.
Ein besserer Weg der Entscheidungsfindung wäre also einer, der die Aufnahme relevanter Informationen erleichtert und so die Wahrscheinlichkeit guter Entscheidungen erhöht. Daher beginnen wir auch unsere Argumentation nicht bei den Daten, sondern beim Entscheider. Die Entscheider auf den verschiedenen Ebenen der Datennutzung und -verarbeitung werden überhaupt im gesamten Buch im Zentrum des Interesses stehen. Wir werden Ihnen im Verlauf dieses Buches gleich drei bessere Wege zeigen, wie Sie von der Bereitstellung von Daten zu einer Kommunikation relevanter Informationen kommen. Welchen Weg man am besten einschlägt, liegt vor allem daran, welche Rolle man im Unternehmen spielt und mit welchen Daten man es zu tun hat. Betrachten wir hierzu Abbildung 1–1, die einen Überblick über die drei Wege in Visual Business Analytics und die drei zentralen Kapitel (Kap. 3–5) in diesem Buch darstellt: Information Design, Visual Business Intelligence und Visual Analytics. Diese drei Wege unterscheiden sich bezüglich Nutzer, Einsatzgebiet, Daten und Visualisierung, aber auch anhand weiterer Eigenschaften, auf die wir im Folgenden näher eingehen werden. Jedes Teilgebiet wird natürlich noch einmal detailliert im eigentlichen Kapitel vorgestellt.
Abb. 1–1Die drei Wege der Entscheidungsfindung in Visual Business Analytics (VBA)
Information Design kümmert sich um die möglichst gute Herausstellung relevanter Informationen mittels statischer Visualisierungen. Dies betrifft vor allem Berichtsdaten, die im Rahmen von Präsentationen und dem Unternehmensreporting an Entscheider kommuniziert werden. Die Datenmenge ist dabei (in Relation zur heutigen Diskussion um Big Data) eher klein und einfach strukturiert. Die Problematik besteht eher darin, die relevanten Daten in den Vordergrund zu heben und die Lesbarkeit zu erhöhen. Dabei achtet Information Design darauf, dass keine besonderen Anforderungen an den Nutzer gestellt werden. Die Grafiken müssen also verständlich und intuitiv lesbar sein, wie Sie in Kapitel 3 sehen werden.
Visual Business Intelligence steht für die heutige Business Intelligence, nur unter starker Nutzung von visuellen und interaktiven Benutzerschnittstellen. Heutige BI-Anwender lernen immer mehr, mit Visualisierungen verschiedenster Art umzugehen. War früher bei Balken- und Liniendiagrammen schon die Grenze erreicht, etablieren sich immer mehr auch Heatmaps, Netzdiagramme und Blasendiagramme. Die Datenmengen sind auch hier nicht massiv groß und liegen üblicherweise strukturiert vor. Der BI-Anwender kann sich aber bereits interaktiv durch die Daten bewegen. Die sinnvolle Zusammenstellung geeigneter Visualisierungen und das ideale, interaktive Zusammenspiel in einem Dashboard werden in Kapitel 4 näher betrachtet.
Visual Analytics hat sich einem neuen, visuellen Weg der Nutzung von Big Data gewidmet. Während das Arbeiten mit den Daten im Information Design und VBI ziemlich vorgegeben ist, ist Visual Analytics interaktiv und explorativ. Der typische Nutzer ist ein Data Scientist, der zu Beginn seiner Analyse eigentlich noch nicht wirklich weiß, was er am Ende finden wird. Die Datenmengen sind extrem groß (der Begriff Big Data ist zurzeit in aller Munde) und viele der Daten sind Rohdaten, die unstrukturiert vorliegen. Die Anforderungen an den Nutzer sind deutlich höher. Ein Data Scientist muss mit verschiedenen Werkzeugen und Programmierschnittstellen effektiv umgehen können, um Analysen durchzuführen. Kapitel 5 betrachtet die aktuellen Trends im Big-Data-Umfeld und zeigt, welche Schritte man auf diesem Weg schon heute gehen kann.
Diese drei Wege schließen sich nicht gegenseitig aus oder sind Alternativen für dieselben Daten und dieselben Ziele. Alle drei Wege werden idealerweise miteinander kombiniert und führen so auf verschiedenen Ebenen des Unternehmens zu besseren Entscheidungen. Abbildung 1–2 zeigt das Zusammenspiel von Information Design, Visual Business Intelligence und Visual Analytics. Gutes Information Design verbessert dabei nicht nur das statische Reporting von verdichteten Berichtsdaten, sondern auch die Verwendung von Dashboards und Cockpits für strukturierte Unternehmensdaten, auch wenn unterschiedliche Nutzer mit den Visualisierungen arbeiten.
[Kandel et al. 2012] unterteilen die Analysten im Unternehmen in drei Grundtypen: Big Data Scientists1, Tool-Spezialisten und Anwender. Die Gruppe der Big Data Scientists ist dabei die kleinste, aber zukünftig wohl eine stark nachgefragte Gruppe von Analysten [Manyika et al. 2011]. Big Data Scientists kennen sich mit vielen Analysepaketen wie R oder Matlab aus, auch wenn sie einfachere statistische Modelle als die Tool-Spezialisten einsetzen. Sie können mit Skriptsprachen wie Perl und Python umgehen und haben keine Berührungsängste mit SQL oder Pig. Dadurch sind Big Data Scientists in der Lage, relativ schnell neue, umfangreiche Datenquellen zu erschließen. Auch bei der Nutzung von Visualisierungstechniken sind Data Scientists in einer Vorreiterrolle und nutzen neben Excel und PowerPoint auch Tools wie Tableau oder D3, um ihre Daten zu visualisieren.
Abb. 1–2Das VBA-Modell der Datennutzung und Visualisierung
Die Gruppe der Tool-Spezialisten zeichnet sich durch ein tiefes Verständnis eines bestimmten Analysewerkzeuges aus. Sie erhalten üblicherweise die Daten von anderen Stellen im Unternehmen, aber können dann hochkomplexe statistische Methoden und Modelle auf diese Daten anwenden. Tool-Spezialisten visualisieren ihre Ergebnisse meist innerhalb des Analysetools (wie R oder Matlab), um ein interaktives Testen ihrer Modelle zu ermöglichen. Die dritte Gruppe besteht aus Anwendern von sämtlichen Standardfunktionen in Softwaretools wie Excel, SAS/JMP oder SPSS. Die Visualisierung erfolgt dabei meist in Form von Excel-Charts oder mithilfe von Reporting-Software wie Crystal Reports.
In unserem VBA-Modell (vgl. Abb. 1–2) verwenden wir zwei Anwendertypen. Der BI-Anwender nutzt Business-Intelligence-Werkzeuge und die darin verwendete Visualisierung. In der obigen Definition können unsere BI-Anwender sowohl Anwender als auch Tool-Spezialisten sein. Der Data Scientist im VBA-Modell verwendet existierende Analysetools und selbst implementierte Programme, um aus großen Datenmengen interessante Unternehmensinformationen zu extrahieren. Sowohl Tool-Spezialisten als auch Big Data Scientist können diese Rolle im Unternehmen ausfüllen.
BI-Anwender arbeiten interaktiv mit VBI-Werkzeugen wie Dashboards, Cockpits oder anderen visuellen BI-Werkzeugen. Die Daten sind strukturiert und sind aus Rohdaten extrahierte, veredelte Daten. Welche Daten dabei aus den Rohdaten auf welche Weise extrahiert werden, ist dabei festgelegt. Oftmals kann daher noch auf heutige Big-Data-Technologien verzichtet werden bzw. diese sind für den BI-Anwender komplett transparent. Der Data Scientist jedoch beeinflusst auch, welche Rohdaten für die Analysen verwendet werden, und kann dies interaktiv und explorativ während der Analyse ändern. Hat sich eine Analyse als hilfreich für BI-Anwender herausgestellt, kann der Analyseprozess z. B. über die IT-Abteilung verstetigt werden, sodass diese Auswertungen auch den BI-Anwendern über strukturierte Daten zur Verfügung stehen.
Als wir das VBA-Modell in unserer ersten Auflage eingeführt hatten, sah das BARC-Institut, ein führender Analyst für Business-Intelligence-Technologien, heute Teil der CXP Group, Visualisierung in Berichten und BI-Tools als eines der Trendthemen der Zukunft [Bange 2013]. Es sollte für die Zeit nach 2013 in jedem Fall Recht behalten. Beim Gang über die TDWI-Messe oder die CeBIT im BI-Bereich findet man seit 2015 eigentlich keinen BI-Anbieter mehr, der nicht mit einem erweiterten und verbesserten visuellen User Interface oder einem besonderen Ansatz für das Dashboarding wirbt. Das VBA-Modell hat diese Trends damals aufgegriffen und strukturiert. Wir sehen also, dass dieses Modell auch heute in den Landschaften der BI- und Business-Analytics-Anbieter Bestand hat.
Weiterhin kommt kaum ein Kongress oder eine Messe ohne einen Vortrag aus, in dem Visualisierung eine große Rolle spielt. Zudem finden sich zahlreiche sehr gute Blogs zum Thema im Internet. Auf sehr hohem Niveau werden Lösungsmöglichkeiten vorgestellt, wie Unternehmen Visualisierungen erfolgreich einsetzen können. Auch Universitäten bieten gerade im Bereich der interaktiven Informationsvisualisierung viele freie Inhalte an. Vor allem in den USA erfahren die Themen einen regelrechten Hype. Edward Tuftes Buch »The Display of Quantitative Information« von 1983 und die in den 90ern aufgestellten Theorien von Ben Shneiderman und Stuart Card erfahren eine regelrechte Renaissance.
In Deutschland und weltweit hat sich gerade im Bereich Information Design besonders viel getan. Rolf Hichert gehört dabei zu den bekanntesten Information Designern und hat sein Modell für die Geschäftskommunikation weiterentwickelt (vgl. Abschnitt 3.2). Auf diesen Regeln basieren auch die International Business Communication Standards (IBCS®-Standards), die von der IBCS Association veröffentlicht werden [Hichert et al. 2017]. Aber auch Stephen Few und Andy Kirk halten mittlerweile zahlreiche Vorträge zu den Themen Dashboard Design und visuelle Analyse in Europa.
Softwarehersteller beschäftigen sich wie gesagt stark mit den Möglichkeiten, die Visualisierung bietet, sowohl als Unterstützung für das Reporting als auch für die visuelle Analyse großer Datenmengen. Hier haben sich viele Technologien deutlich weiterentwickelt (vgl. Abschnitt 4.1.2 und 5.2). Vor allem spezialisierte Information-Design-Tools, wie etwa graphomate oder auch DeltaMaster von Bissantz werden für ihre Visualisierungskomponenten in Fachartikeln und in Firmen gelobt. Die VBA-Studien 2012 und 2015 zeichneten über die Branche hinweg ein stärker werdendes Bild in Bezug auf die Visualisierungskomponenten der aktuellen Werkzeuge.
Dies deckt sich auch mit dem im 3. Quartal 2012 erschienenen Research-Dokument mit dem Titel »Advanced Data Visualization«, in dem vor allem die verschiedenen Produkthersteller auf ihre Visualisierungskomponenten untersucht wurden [Evelson 2012]. Hier schnitten Tableau und TIBCO sehr gut ab. Aber auch IBM Cognos und Information Builders konnten gute Plätze belegen. Zudem werden in dem Research-Dokument die Anforderungen an die BI-Tools, die »Advanced Data Visualization« bieten, formuliert. Eine Vielzahl von Diagrammarten sollte verfügbar sein, u. a. Microcharts oder Nadeldiagramme. Zudem sollte sowohl die Möglichkeit zur visuellen Suche gegeben sein als auch Möglichkeiten für Geovisualisierung.
Im Jahr zuvor veröffentlichte der TDWI einen Best Practices Report zum Thema »Visual Reporting und Analysis« [Eckerson & Hammond 2011]. Auch dort kamen die Autoren Wayne Eckerson und Mark Hammond zu der Erkenntnis, dass Visualisierung zunehmend an Bedeutung gewinnen wird. Befragt wurden 210 BI-Professionals. 74 % aller Teilnehmer gaben an, dass Visualisierung ein sehr gutes Mittel sei, um Einblicke in das Business zu geben, die sonst verborgen geblieben wären. Als bestes Mittel dafür wurden in erster Linie interaktive Dashboards genannt, die das Wesentliche auf einen Blick darstellen, aber auch auf Anfrage Details durch Drill-downs zutage fördern.
Nach einer ersten Studie im Jahr 2012 [Kohlhammer et al. 2012] führten die blueforte GmbH und das Fraunhofer IGD die VBA-Studie 2015 in Deutschland durch [Schulz et al. 2015]. 301 Teilnehmer beantworteten Fragen zu den Bereichen Information Design, Visual Business Intelligence und Visual Analytics. Über 72 % der Teilnehmer bezeichneten sich selbst als Reportempfänger. 42 % der Teilnehmer waren dabei dem mittleren Management oder der Geschäftsleitung zuzuordnen, während 51 % von ihnen Mitarbeiter ohne Führungsverantwortung waren. Sie alle arbeiteten in verschiedenen Unternehmensgrößen, wobei mittelgroße Unternehmen mit über 46 % den Schwerpunkt der Teilnehmer bildeten. Insgesamt kann die Teilnehmerstruktur damit als repräsentativ betrachtet werden, um einen aktuellen Blick auf aktuelle Anforderungen an Visualisierungen und Information Design zu bekommen (vgl. Abb. 1–3).
Abb. 1–3Teilnehmerzusammensetzung der VBA-Studie 2015 [Schulz et al. 2015]
Ein gutes Beispiel, wie sich das VBA-Modell in Kundenprojekten bewährt hat, sind gemeinsame Artikel und Vorträge auf der TDWI-Konferenz mit BI-Verantwortlichen der Industrie [Schröer et al. 2014]. Weitere Kundenprojekte wurden in einer Sonderausgabe des Journals BI-Spektrum veröffentlicht, die sich fast ausnahmslos auf das VBA-Modell bezogen. Ein genereller Trend der letzten Jahre ist das Hineintragen des VBA-Modells in unterschiedliche Fachdomänen. So entstand unter diesem Eindruck ein Buch dediziert für das Management-Controlling [Schneider et al. 2016]. Nicht zuletzt wurde ein Exzerpt des Buches in dem nun schon in fünfter Auflage herausgegebenen Buch »Analytische Informationssysteme« als neuer Aspekt mit aufgenommen [Kohlhammer et al. 2015].
Das VBA-Modell erreichte auch über Deutschland hinaus viele Interessenten. Auf Basis des Buches entstand ein Workshop namens BusinessVis auf der größten Visualisierungskonferenz, der IEEE VIS. 2014 zum ersten Mal durchgeführt und in 2015 noch einmal thematisch erweitert, wird er seit 2016 als Teil von Visualization in Practice (VIP) weitergeführt. Auch hier hat sich gezeigt, dass das VBA-Modell eine passende Strukturierung bereithält, die nicht nur für die Praxis und für BI-Anbieter funktioniert, sondern auch für die Forschung und deren Gedanken über den möglichen Einsatz neuer Visualisierungstechniken [Stodder 2013b]. Parallel dazu hat die TDWI-Organisation in den USA ebenfalls eine Reihe von Publikationen veröffentlicht, die den Stellenwert der Visualisierung und von Visual Analytics [Stodder 2015] in Amerika unterstreichen.
Seit der Veröffentlichung der ersten Auflage hat sich also eine Menge im Bereich Visual Business Analytics getan. Doch die Aufgaben bleiben vielfältig und Anwender wie Anbieter brauchen einen langen Atem. Auch 2016 platzierte BARC die Datenexploration und die Datenvisualisierung an der Spitze der wichtigsten Trends für Business Intelligence und Datenmanagement. Hier schließt sich der Kreis zum Beginn dieses Kapitels. Unser Fazit ist die Hoffnung, dass mit dem VBA-Modell ein längerfristig gültiges Modell geschaffen wurde, das über die Zeit weiterentwickelt wird. Die ersten Jahre seiner Existenz haben diese Hoffnung in jedem Fall bestärkt.
Heutige Unternehmen sammeln, speichern und verwerten Daten in einem nie da gewesenen Ausmaß. Wo vor Jahrzehnten noch das Hauptaugenmerk auf den Möglichkeiten der besseren Sammlung und Speicherung von Daten lag, hat die Business-Welt und viele andere Bereiche von Regierungen bis zum individuellen Menschen ein Problem mit der schieren Masse an Daten. Dieser sogenannte Information Overload ist eigentlich erst einmal ein Data Overload. Wenn man es genau betrachtet, sind wir auch weniger im Informationszeitalter, sondern eher noch im Datenzeitalter, denn wir haben viele Probleme noch nicht gelöst, die mit dem Umgang verschiedener Datenarten und großen Mengen dieser Daten zu tun haben.
Viele Quellen stimmen darin überein, dass die Menge der Daten, wie auch die Dynamik der Änderungen, in Zukunft weiter zunehmen wird. Es liegt in jedem größeren Unternehmen eine Vielzahl von relevanten Datenquellen vor, die heute noch gar nicht angebunden werden, da die Datenmengen die aktuellen Möglichkeiten der Verarbeitung und Auswertung übersteigen. Erst allmählich beschäftigen sich Unternehmen mit sozialen Netzwerken, unstrukturierten Daten und all den Texten und Dokumenten, die bisher in den Verzeichnissen der Unternehmensserver liegen.
Dabei unterscheiden sich die für verschiedene Unternehmen relevanten Daten nicht unerheblich, auch wenn wir in diesem Buch den klaren Fokus auf diejenigen Daten setzen, die für Business Intelligence und Business Analytics wesentlich sind. Jedoch sind in den letzten Jahren neben betriebswirtschaftlichen Zahlen zum Beispiel eben auch Texte, soziale Netzwerke oder geografische Daten zunehmend geschäftsrelevant geworden.
Im Folgenden gehen wir auf verschiedene Aspekte von Daten und Informationen sowie deren Visualisierung ein. Dies legt den Grundstock für die weiteren Kapitel, die näher auf die drei Ausbaustufen der VBA eingehen.
Als Leser dieses Buches haben Sie mit großer Wahrscheinlichkeit ein sehr gutes Verständnis von Daten sowie ihrer Sammlung, Speicherung und Verwendung. Wir werden daher in diesem Kapitel keine Datenbankgrundlagen wiederholen, sondern sehr stark auf diejenigen Aspekte von Daten eingehen, die für die Visualisierung und die weiteren Kapitel essenziell sind. Die Fragestellung ist immer, was wir über die Daten wissen sollten und was wir mit den Daten tun sollten, damit wir sie besser visualisieren und dadurch besser entscheiden können.
Daten sind die Rohmaterialien unserer heutigen Informationswelt. Sie haben aber für sich alleine genommen noch keinen großen Wert für Entscheider. Daten sind zum Beispiel Zahlenreihen, die ohne Kontext keinen Sinn ergeben. Die Zahlenreihe 4015555634 bekommt erst im Kontext »Telefonnummer« eine spezielle Bedeutung, die eine andere ist als im Kontext »ISBN«.
Das heißt, um eine Bedeutung zu erhalten, müssen Daten im Kontext erklärt werden, in Gruppen oder Strukturen organisiert werden, transformiert und präsentiert werden. Erst dann werden Daten zu Informationen. Diese Daten mit kontextueller Bedeutung können sinnvoll verwendet und visualisiert werden.
Eine typische Datenmenge, wie sie in der Visualisierung betrachtet wird, ähnelt einer relationalen Datenbanktabelle. Die Datenmenge besteht aus Datensätzen, die wiederum über mehrere Attribute beschrieben werden. Jedes dieser Attribute hat einen bestimmten Datentyp, z. B. Text oder Zahl. Natürlich ist Text nicht gleich Text, da es nur eine definierte Menge an Ausprägungen geben kann, die ein Attribut tragen. Genauso sind Zahlen nicht gleich Zahlen. Sie können für einen Geldbetrag stehen oder einen Monat bezeichnen.
Daten und Datentypen interessieren uns insbesondere deshalb für die Visualisierung, da sich verschiedene Visualisierungstechniken für bestimmte Datentypen und die Struktur, in der die Daten vorliegen (Hierarchie, Netzwerk, Text etc.), eignen. Diese lernen wir in Kapitel 4 näher kennen. Ein Balkendiagram eignet sich nicht für Netzwerkdaten, eine Darstellung von Netzwerken nicht für jährliche Verkaufszahlen. In Abschnitt 2.1.2 gehen wir näher auf diese Zusammenhänge ein.
Im Allgemeinen werden Daten in ordinale und nominale Typen unterschieden [Ward et al. 2010]. Ordinale Daten enthalten numerische Werte, die binär (0 oder 1), diskret (also numerische Zahlen oder Wert einer definierten Menge von Zahlen, z. B. 1, 2, …, 12 für die Monate des Jahres) oder kontinuierlich sein können (also reale Zahlen). Nominale Daten enthalten nicht numerische Werte. Diese können einer Kategorie aus einer (eher) kurzen Liste entsprechen (z. B. privat, beruflich), einer geordneten Liste angehören (z. B. Januar, Februar, …) oder ein beliebiger nicht numerischer Wert sein (z. B. ein Firmenname).
Tabelle 2–1 fasst diesen Zusammenhang noch einmal grafisch zusammen.
Quantitativ
Ordinal
Nominal
Numerische Werte
Numerische oder nicht numerische Werte
Nicht numerische Werte
Berechnungen möglich
Definierte Ordnung
Keine definierte Ordnung
Beispiele: Umsatz, Kennzahlen, Größe
Beispiel: Monate, Schulnoten, Steuerklassen
Beispiele: Geschlecht, Familienstand, Farben
Tab. 2–1 Datentypen
Bei der Datenakquisition ist die Herkunft der Daten und damit auch die Verlässlichkeit der Daten ein wesentliches Kriterium für die Datenverwertung, Analyse und Visualisierung. Dies hängt eng auch mit den Fragen der Datenqualität zusammen, auf die wir in Abschnitt 2.1.5 kurz eingehen werden.
Unternehmen haben dabei bestimmte Datenquellen unter ihrer Kontrolle und Verfügungsgewalt. Sie können damit selbst entscheiden, welches Format diese Daten haben, wie oft sie erhoben werden und wie sie aggregiert und verarbeitet werden sollen. Diese Daten bezeichnen wir als interne Daten. Andere DatenqOuellen werden extern erhoben und verarbeitet oder werden als Rohdaten im Unternehmen weiterverwendet. Diese Daten bezeichnen wir als externe Daten. Diese können sowohl frei verfügbar als auch kommerziell vom eigenen Unternehmen erworben sein.
Ordinal
Nominal
Interne Daten
▪ Tagliche Verkaufszahlen
▪ Interne E-Mails
▪ Tagesaktuelle Kosten
▪ u. v. a.
▪ Geschaftskennzahlen
▪ Jahresberichte
▪ Kundenanalyse
▪ u. v. a.
Externe Daten
▪ Neue Patente
▪ Kundenanfragen
▪ Aktienkurse
▪ Kommerzieller Newsticker
▪ u. v. a.
▪ Marktanalysen
▪ Branchenliteratur
▪ Kommerzielle Datenquellen (Hoppenstedt, Reuters etc.)
▪ u. v. a.
Tab. 2–2 Interne und externe Daten
Eine Vielzahl von Dienstleistern bietet aufbereitete Daten und Informationen für verschiedene Unternehmensbereiche und Fragestellungen an. Die Dynamik der Daten reicht dabei von untersekündlichen Ticks an der Börse bis hin zu aggregierten Firmeninformationen im Überblick. Gerade in letzterem Fall stellt sich die Frage nach den Aktualisierungsmechanismen, die den Datenverwender von Änderungen an aggregierten Datensätzen in Kenntnis setzt. Anders als bei Data Warehouses, bei denen das Unternehmen die zeitlichen Abstände der Aktualisierung selbst unter Kontrolle hat, kann sich dies von Datenquelle zu Datenquelle unterscheiden. Ähnliches gilt für die Einschätzung der Unsicherheit von Daten.