1Visual Business Analytics
Die ständige Verfügbarkeit großer Datenmengen bestimmt zunehmend unser persönliches und unternehmerisches Handeln. Immer mehr Daten werden immer schneller erstellt – und überall fehlt die Zeit, um die Spreu vom Weizen zu trennen. So wachsen die Datenberge weiter, in denen die interessanten Informationen unter einer massiven Menge an uninteressanten Daten begraben sind. Immer mehr Unternehmen machen sich auf den Weg vom Datenzeitalter ins Informationszeitalter und wollen ihre Datenberge besser und effektiver analysieren, um daraus entscheidungsrelevantes Wissen zu ziehen. Die Schlagworte Big Data und Business Analytics stehen für diese Bestrebungen und sind aktuell von großem Interesse für die Wirtschaft. Sie ergänzen die bisherigen Ansätze von Business Intelligence und Data Warehousing um Technologien und Herangehensweisen, die mit den hochdynamischen, heterogenen und häufig unstrukturierten Datenmassen besser zurechtkommen.
Eine wesentliche Grundlage für den Erfolg eines Unternehmens ist die effektive Verarbeitung einer wachsenden Masse an Daten und Informationen sowie der Einsatz des Wissens und der Erfahrung der Mitarbeiter für geschäftsrelevante Entscheidungen. Ein großer Teil des vorhandenen Potenzials liegt zunehmend brach, da sich die Technologien für die Erzeugung, Speicherung und den Abruf von Daten in den letzten Jahren schneller entwickelt haben als die Möglichkeiten, die Daten effektiv zu nutzen. Kennzeichnend für diese Entwicklung ist eine gewachsene Trennung von automatisierten IT-Prozessen und den strategischen und operationellen Entscheidungsprozessen, an denen der Mensch in den Geschäftsprozess eingreifen muss.
Diese Trennung hat sicherlich die Entwicklung effektiver Verfahren für die Datenakquisition und Datenhaltung begünstigt. An der Schnittstelle zwischen Mensch und Maschine konnte die Technologie aber nicht in gleicher Weise Schritt halten. In vielen Unternehmen besteht diese Schnittstelle in der grafischen Aufbereitung eines Reports aus einer Excel-Tabelle mit Kennzahlen. Der Entscheider wird hier als (passiver) Empfänger von vorbereiteten Informationen in den Geschäftsprozess integriert. Er kann seiner eigentlichen Rolle innerhalb der Unternehmensprozesse, nämlich der Nutzung seiner Expertise und Erfahrung in der Bewertung der Sachlage, dadurch aktuell nicht in vollem Umfang gerecht werden.
Das Ziel von Business Intelligence, Business Analytics und so ziemlich jedem Bericht im Unternehmen war schon immer die Unterstützung von Entscheidungsträgern. Manchmal scheinen die aktuellen Technologien und Angebote im Big-Data-Bereich diese Tatsache in den Hintergrund zu rücken. Dieses Buch stellt den Menschen und den Entscheider in den Mittelpunkt des Interesses. Wir stellen in den einzelnen Kapiteln dabei immer wieder die Frage, wie wir Daten verarbeiten und Informationen darstellen müssen, damit Entscheider möglichst schnell die wesentlichen Aspekte erkennen können. Die Visualisierung von Informationen für Berichte, Informationssysteme und Analysen, zusammengefasst unter dem Begriff Visual Business Analytics (VBA), ist das zentrale Element dieses Buches.
1.1Bessere Wege der Entscheidungsfindung durch VBA
In Unternehmen werden täglich Tausende von Entscheidungen getroffen. Es gibt auch ungefähr genauso viele Theorien und Ansätze, die erklären, wie Menschen Entscheidungen treffen. Dieses Buch will definitiv keine weitere Theorie hinzufügen, sondern betrachtet die Entscheidungsfindung eher allgemein wie die folgenden zwei Definitionen aus [Harris 2012]:
- Entscheidungsfindung bezeichnet die Identifizierung und Auswahl von Möglichkeiten basierend auf den Werten und Prioritäten des Entscheiders.
- Entscheidungsfindung ist der Prozess, in dem Unsicherheit und Zweifel über die bestehenden Möglichkeiten so weit reduziert wird, dass eine der Möglichkeiten sinnvoll ausgewählt werden kann.
Uns ist dabei bewusst, dass viele Entscheidungen nicht durch die akribische Identifikation aller Alternativen und anschließende Auswahl der besten Alternative getroffen werden. Gerade Experten und erfahrene Entscheider haben einen breiten Fundus an Wissen, der es ihnen erlaubt, sich innerhalb von Sekunden für ein (in den meisten Fällen sogar das optimale) Vorgehen zu entscheiden, ohne schwächere Alternativen überhaupt zu bedenken. Gary Klein, um einen bekannten Vertreter der Forschung zu nennen, hat dies in vielen Untersuchungen eindrucksvoll demonstriert [Klein 1999].
Der für dieses Buch zentrale Aspekt steckt aber in der zweiten Definition. Denn in einem Punkt sind sich eigentlich alle Ansätze einig: Die Verringerung von Unsicherheit und ein besseres Verständnis der Situation ermöglichen auch bessere Entscheidungen. Statt Situationkönnte man hier auch den Begriff Entscheidungsumfeld verwenden, das sämtliche Informationen, Werte und Prioritäten (siehe 1. Definition) beinhaltet [Spradlin 1997]. Tatsächlich kann man Folgendes sagen: Je mehr relevante Informationen vom Entscheider verarbeitet werden, desto höher wird die Wahrscheinlichkeit für eine gute Entscheidung. Spradlin erklärt aber auch, dass neben Unsicherheit vor allem die Informationsüberflutung die größte Herausforderung darstellt. Auf der Suche nach relevanten Informationen bekommen wir nämlich vor allem erst einmal mehr Informationen.
So betrachtet basieren viele Prozesse in Unternehmen darauf, dass aus großen Datenmengen relevante Informationen werden. Unternehmen definieren KPIs (Key Performance Indicators), die in prägnanter Form die aktuelle Situation einzelner Aspekte des Unternehmens kommunizieren. Analyseabteilungen durchforsten die Verkaufsdaten ihres Unternehmens nach neuen Erkenntnissen, um die Kunden besser zu verstehen und so Entscheidungen über das Produktportfolio zu unterstützen. Auch das Marketing arbeitet daran, welche Nachrichten bei potenziellen Kunden in all der Reizüberflutung vor allem als relevanteInformationen ankommen sollen.
Ein besserer Weg der Entscheidungsfindung wäre also einer, der die Aufnahme relevanter Informationen erleichtert und so die Wahrscheinlichkeit guter Entscheidungen erhöht. Daher beginnen wir auch unsere Argumentation nicht bei den Daten, sondern beim Entscheider. Die Entscheider auf den verschiedenen Ebenen der Datennutzung und -verarbeitung werden überhaupt im gesamten Buch im Zentrum des Interesses stehen. Wir werden Ihnen im Verlauf dieses Buches gleich drei bessere Wege zeigen, wie Sie von der Bereitstellung von Daten zu einer Kommunikation relevanter Informationen kommen. Welchen Weg man am besten einschlägt, liegt vor allem daran, welche Rolle man im Unternehmen spielt und mit welchen Daten man es zu tun hat. Betrachten wir hierzu Abbildung 1–1, die einen Überblick über die drei Wege in Visual Business Analytics und die drei zentralen Kapitel (Kap. 3–5) in diesem Buch darstellt: Information Design, Visual Business Intelligence und Visual Analytics. Diese drei Wege unterscheiden sich bezüglich Nutzer, Einsatzgebiet, Daten und Visualisierung, aber auch anhand weiterer Eigenschaften, auf die wir im Folgenden näher eingehen werden. Jedes Teilgebiet wird natürlich noch einmal detailliert im eigentlichen Kapitel vorgestellt.
Abb. 1–1Die drei Wege der Entscheidungsfindung in Visual Business Analytics (VBA)
Information Design kümmert sich um die möglichst gute Herausstellung relevanter Informationen mittels statischer Visualisierungen. Dies betrifft vor allem Berichtsdaten, die im Rahmen von Präsentationen und dem Unternehmensreporting an Entscheider kommuniziert werden. Die Datenmenge ist dabei (in Relation zur heutigen Diskussion um Big Data) eher klein und einfach strukturiert. Die Problematik besteht eher darin, die relevanten Daten in den Vordergrund zu heben und die Lesbarkeit zu erhöhen. Dabei achtet Information Design darauf, dass keine besonderen Anforderungen an den Nutzer gestellt werden. Die Grafiken müssen also verständlich und intuitiv lesbar sein, wie Sie in Kapitel 3 sehen werden.
Visual Business Intelligence steht für die heutige Business Intelligence, nur unter starker Nutzung von visuellen und interaktiven Benutzerschnittstellen. Heutige BI-Anwender lernen immer mehr, mit Visualisierungen verschiedenster Art umzugehen. War früher bei Balken- und Liniendiagrammen schon die Grenze erreicht, etablieren sich immer mehr auch Heatmaps, Netzdiagramme und Blasendiagramme. Die Datenmengen sind auch hier nicht massiv groß und liegen üblicherweise strukturiert vor. Der BI-Anwender kann sich aber bereits interaktiv durch die Daten bewegen. Die sinnvolle Zusammenstellung geeigneter Visualisierungen und das ideale, interaktive Zusammenspiel in einem Dashboard werden in Kapitel 4 näher betrachtet.
Visual Analytics hat sich einem neuen, visuellen Weg der Nutzung von Big Data gewidmet. Während das Arbeiten mit den Daten im Information Design und VBI ziemlich vorgegeben ist, ist Visual Analytics interaktiv und explorativ. Der typische Nutzer ist ein Data Scientist, der zu Beginn seiner Analyse eigentlich noch nicht wirklich weiß, was er am Ende finden wird. Die Datenmengen sind extrem groß (der Begriff Big Data ist zurzeit in aller Munde) und viele der Daten sind Rohdaten, die unstrukturiert vorliegen. Die Anforderungen an den Nutzer sind deutlich höher. Ein Data Scientist muss mit verschiedenen Werkzeugen und Programmierschnittstellen effektiv umgehen können, um Analysen durchzuführen. Kapitel 5 betrachtet die aktuellen Trends im Big-Data-Umfeld und zeigt, welche Schritte man auf diesem Weg schon heute gehen kann.
Diese drei Wege schließen sich nicht gegenseitig aus oder sind Alternativen für dieselben Daten und dieselben Ziele. Alle drei Wege werden idealerweise miteinander kombiniert und führen so auf verschiedenen Ebenen des Unternehmens zu besseren Entscheidungen. Abbildung 1–2 zeigt das Zusammenspiel von Information Design, Visual Business Intelligence und Visual Analytics. Gutes Information Design verbessert dabei nicht nur das statische Reporting von verdichteten Berichtsdaten, sondern auch die Verwendung von Dashboards und Cockpits für strukturierte Unternehmensdaten, auch wenn unterschiedliche Nutzer mit den Visualisierungen arbeiten.
Die Anwender im VBA-Modell
[Kandel et al. 2012] unterteilen die Analysten im Unternehmen in drei Grundtypen: Big Data Scientists1, Tool-Spezialisten und Anwender. Die Gruppe der Big Data Scientists ist dabei die kleinste, aber zukünftig wohl eine stark nachgefragte Gruppe von Analysten [Manyika et al. 2011]. Big Data Scientists kennen sich mit vielen Analysepaketen wie R oder Matlab aus, auch wenn sie einfachere statistische Modelle als die Tool-Spezialisten einsetzen. Sie können mit Skriptsprachen wie Perl und Python umgehen und haben keine Berührungsängste mit SQL oder Pig. Dadurch sind Big Data Scientists in der Lage, relativ schnell neue, umfangreiche Datenquellen zu erschließen. Auch bei der Nutzung von Visualisierungstechniken sind Data Scientists in einer Vorreiterrolle und nutzen neben Excel und PowerPoint auch Tools wie Tableau oder D3, um ihre Daten zu visualisieren.
Abb. 1–2Das VBA-Modell der Datennutzung und Visualisierung
Die Gruppe der Tool-Spezialisten zeichnet sich durch ein tiefes Verständnis eines bestimmten Analysewerkzeuges aus. Sie erhalten üblicherweise die Daten von anderen Stellen im Unternehmen, aber können dann hochkomplexe statistische Methoden und Modelle auf diese Daten anwenden. Tool-Spezialisten visualisieren ihre Ergebnisse meist innerhalb des Analysetools (wie R oder Matlab), um ein interaktives Testen ihrer Modelle zu ermöglichen. Die dritte Gruppe besteht aus Anwendern von sämtlichen Standardfunktionen in Softwaretools wie Excel, SAS/JMP oder SPSS. Die Visualisierung erfolgt dabei meist in Form von Excel-Charts oder mithilfe von Reporting-Software wie Crystal Reports.
In unserem VBA-Modell (vgl. Abb. 1–2) verwenden wir zwei Anwendertypen. Der BI-Anwender nutzt Business-Intelligence-Werkzeuge und die darin verwendete Visualisierung. In der obigen Definition können unsere BI-Anwender sowohl Anwender als auch Tool-Spezialisten sein. Der Data Scientist im VBA-Modell verwendet existierende Analysetools und selbst implementierte Programme, um aus großen Datenmengen interessante Unternehmensinformationen zu extrahieren. Sowohl Tool-Spezialisten als auch Big Data Scientist können diese Rolle im Unternehmen ausfüllen.
BI-Anwender arbeiten interaktiv mit VBI-Werkzeugen wie Dashboards, Cockpits oder anderen visuellen BI-Werkzeugen. Die Daten sind strukturiert und sind aus Rohdaten extrahierte, veredelte Daten. Welche Daten dabei aus den Rohdaten auf welche Weise extrahiert werden, ist dabei festgelegt. Oftmals kann daher noch auf heutige Big-Data-Technologien verzichtet werden bzw. diese sind für den BI-Anwender komplett transparent. Der Data Scientist jedoch b...