1. Antikes Präludium
Was würde sich Diogenes von Sinope von Big Data wünschen: Weiterhin die Sonne genießen zu können?
Geh mir nur ein wenig aus der Sonne!
Diogenes zu Alexander dem Großen
2. Illustration großer Datenmengen
als Einstimmung
Im vorliegenden Buch werden viele Zahlen zur Beschreibung von Datenmengen, teilweise unvorstellbar große Zahlen, verwendet. Der kurze Exkurs dient dazu, die Größe dieser Zahlen zu verdeutlichen.
Tab. 2.1. Illustration der gigantischen Zahlen.
Eine durchschnittliche Textbuchseite hat etwa ein Kilobyte Inhalt. Je nach Anzahl der Seiten umfasst ein Buch damit 100 Kilobyte bis hin zu ein paar Megabyte. Die Bibel als eines der weitverbreitetsten Bücher mit allen Bänden hat etwa 5 Megabyte Inhalt. Typische Digitalfotos hoher Qualität haben 3 Megabyte. Das alte Sprichwort, ein Bild sagt mehr als tausend Worte, ist damit auch in Bezug auf die dahinterliegenden Datenmengen richtig. Ein gesamter Spielfilm benötigt etwa 5 Gigabyte.
Die Speicherfähigkeit des menschlichen Gehirns wird auf 2 Terabyte geschätzt und entspricht dem Inhalt aller Textbücher einer großen Bibliothek. Die weltweit größte Bibliothek ist die Nationalbibliothek des Vereinigten Königreiches (British Library) mit ihren 170 Millionen Werken, davon sind 25 Millionen Bücher (mehr Bücher gibt’s übrigens in der zweitgrößten Bibliothek der Welt: Library of Congress in den USA). Schätzungen zufolge beinhalten alle Bücher der Nationalbibliothek des Vereinigten Königreiches 6,5 Terabyte an Daten. Auf einer Festplatte eines guten PC kann somit der gesamte Inhalt aller Bücher der größten Bibliothek liegen. Die größte Bibliothek der Antike ist die Bibliothek von Alexandria mit geschätzten 500.000 Rollen also etwa 50 Megabyte an Daten. Das gesamte niedergeschriebene Wissen der Antike hat damit auf einem kleinen billigen USB-Stick oder auf einer bereits veralteten CD leicht Platz.
Für das Betreiben des Spieles „World of Warcraft“ benötigt Blizzard Entertainment 2,5 Petabyte an Daten. 10 Milliarden auf Facebook gespeicherte Fotos erfordern 1,5 Petabyte Speicherplatz. Übrigens werden zurzeit pro Tag etwa 5 Millionen Bilder im Internet neu eingestellt. Würde man das gesamte Leben eines Menschen eins zu eins in Full-HD Qualität als Film (Filmdauer 80 Jahre) dokumentieren, würde dies etwa 2 Petabyte an Datenvolumen verursachen.
Exabyte und Zetabyte übertreffen jegliche Vorstellungskraft. Seit Entwicklung der Sprachfähigkeit vor 1,5 Millionen Jahren, haben alle (Ur)Menschen, die je gelebt haben, zusammen Wörter im Umfang von 5 Exabyte gesprochen. Und noch unvorstellbarer: Stapelt man eine heute handelsübliche, gute Festplatte (Bauteilhöhe 8 mm und Speicherkapazität 1 Terabyte) zwischen der Erde und der Sonne so könnte man in all diesen Festplatten gemeinsam 4,7 Zetabyte Daten speichern.
Teil I
Der Eroberungsfeldzug
3. Eine kurze historische
Betrachtung zur Einleitung
Daten. Was sind Daten? Seit wann gibt es Daten? Also seit wann werden Daten bewusst gesammelt, verarbeitet, ausgewertet, übertragen und verwendet?
Wahrscheinlich liegt das etwa 50.000 Jahre zurück. Die ersten Wandmalereien und die Entwicklung der ersten Elemente der Schrift bzw. deren Vorläufer Piktogramme sowie der Zahlen dürften die Geburtsstunde der Daten kennzeichnen. Die ersten Datenträger sind Felsen, Steine, Kerbhölzer und später Tafeln aus Ton, Holz, Stein, gefolgt von Papyrus und Pergament.
Archäologische Funde lassen vermuten, dass die ersten Zählverfahren bereits vor 50.000 Jahren zu datieren sind. Bekannt ist ein Kerbholz aus der älteren Steinzeit, das in Vstonice (Mähren) gefunden worden ist. In diesem Kerbholz sind 55 tiefe Kerben eingeschnitten, von denen die ersten 25 in Gruppen zu 5 angeordnet sind. Danach kommt eine doppelt so lange Kerbe, die die Reihe abschließt; dann beginnt mit der nächsten, ebenfalls doppelt so langen Kerbe eine neue Reihe. Dieses Kerbholz ist damit das älteste, erhaltene europäische Speichermedium mit quantitativen Daten. Besonders hervorzuheben ist, dass noch 50.000 Jahre später Kerbhölzer zum Zählen verwendet worden sind. So sind noch im Mittelalter Schuldverträge über ein Kerbholz geschlossen bzw. dokumentiert worden – sowohl Kreditnehmer als auch Kreditgeber erhielten jeweils eine der Länge nach gespaltete Hälfte des Kerbholzes zum Nachweis der Schuldenhöhe.
Bauwerke, wie die Pyramiden, setzen die Beherrschung mathematischer Verfahren und die Fähigkeit Zahlendaten zu speichern und zu verarbeiten voraus. Die ältesten bekannten Funde mathematischer Abhandlungen sind Tontafeln aus Mesopotamien (2000 v. Chr.). Die Babylonier, Ägypter sowie Maya beherrschten bereits alle vier Grundrechnungsarten und kannten bereits eine sehr gute Näherung der Kreiszahl Pi. Im 2. Jahrhundert v. Chr. sind in Mesopotamien die Vorläufer heutiger Banken entstanden. Damit dürfte das auch die Geburtsstunde von Datenerfassung bezüglich Guthaben, Schulden, Rückzahlungsverpflichtungen usw. sein. Schließlich dürften die Römer die ersten gewesen sein, die überterritoriale Systeme für Maße und Gewichte einführten und somit als die ersten „Standardisierer“ sowie „Normierer“ von Daten gelten.
Steuern im Sinne, dass Privates für das Gemeinwesen zur Verfügung gestellt werden muss, wurden bereits im 3. Jahrtausend v. Chr. in Naturalien eingehoben oder waren als Dienstleistungen (z. B. Frontdienst, Bauarbeiten) zu erbringen. Dazu benötigt man Daten, Datenspeicherung und Datenverarbeitung. Insbesondere Volkszählungen in der Antike (auch jene der Neuzeit), wie z. B. die in der Bibel erwähnte unter Kaiser Augustus, hatten die Erfassung der Steuerpflichtigen und die Abschätzung der zu erwartenden Steuereinnahmen als Hintergrund. Auch der Zoll entwickelte sich im 3 Jahrtausend v. Chr. und stellt eine Art Benutzungsgebühr für die Durchfahrt, Bereitstellung eines sicheren Geleites sowie Nutzung der Infrastruktur dar. Die Abwicklung des Zolls förderte ebenfalls die Entwicklung von Methoden zur Datenerhebung und -verarbeitung.
Die Kriegsführung, die Spionage und die Überwachung von Personen hat seit Anbeginn die Entwicklung der Techniken zur Datensammlung und Datenkommunikation gefördert. Bereits 500 v. Chr. beschreibt der chinesische General Sun-Tzu die Kunst des Krieges und betont dabei die Wichtigkeit der systematischen Einholung von Erkundigungen über den Feind. Julius Caesar hat über ein dichtes Netzwerk an Informanten verfügt, die eine eigene Geheimschrift verwendeten. Im Mittelalter entstanden Polizeistaaten wie Venedig oder später Napoleons Frankreich bis hin zur österreichischen Monarchie unter Kaiser Joseph II, in denen Bespitzelungen sowie Denunziationen zur Tagesordnung gehörten. Die zahlreich verfassten Dossiers über viele Bürger gaben den Mächtigen einen guten Überblick und wurden akribisch verwaltet. Die Spionage und die Überwachung der Bürger wurden mit den neuen Techniken wie Telegrafen, Kameras und Mikrofonen schlagartig perfektioniert. Im Kalten Krieg hatten Wanzen und ähnliche Technologien ihren Höhepunkt. Das Internet und die modernen Kommunikationswerkzeuge revolutionierten noch einmal die Abhörtechniken und gipfelten unter anderem in die Späh- und Abhöraktionen der NSA rund um Bad Aibling. Vor Ort anwesend sein zu müssen, um jemanden zu beobachten oder abzuhören, ist aufgrund des Einsatzes von Satelliten und dem Internet nicht mehr erforderlich. Bespitzelung, wie vieles andere, kann heute aus sicherer Distanz stattfinden.
Schriftzeichen, Schriften und Zahlen ermöglichten es, Daten klarer zu formulieren und zu strukturieren. Die ältesten bekannten Schriftzeichen stammen aus China und werden auf 6600 v. Chr. datiert. Etwa tausend Jahre später sind erste Sequenzen von Schriftzeichen, also Schriften, auf Tontafeln entstanden. Die Keilschrift (ab 2700 v. Chr.) markiert den Übergang von „ein Zeichen steht für ein Objekt“ hin zu „ein Zeichen steht für einen Laut“ und stellt damit den Ursprung der heute verwendeten Schriften dar. Die Keilschrift hat den Handel positiv gefördert und erstmals entstanden handelsbezogene Daten (z. B. Handelsverträge, aber auch 1700 v. Chr. der Codex Hammurabi – das erste bekannte Handelsgesetz sowie der erste Versuch eines umfassenden Rechtsstaates), die nicht nur gespeichert, sondern auch überregional verbreitet worden sind.
Die ältesten Vorläufer des Buches waren die Papyrusrollen der Ägypter aus dem 3. Jahrtausend v. Chr. Die Grie...