Nachrichten

Dark Data: Die dunkle Seite der Business Analytics

Sascha Grosskopf
Sascha Grosskopf

Von Sascha Grosskopf, CornerstoneonDemand

Dark Data“ – das klingt unheimlich, wenn nicht fast schon gefährlich. Und in der Tat, die „dunklen Daten“, also der verborgene Teil der anfallenden Datenmassen, birgt durchaus Risiken für Unternehmen. Dabei besteht die größte Gefahr darin, dass Datenmassen unkontrolliert bleiben. Was steckt also hinter diesen dunklen Daten? Und wie können Firmen darauf reagieren?

Weltweit wächst die Menge der gespeicherten und der über das Internet transportiert Daten rapide an. Nach Studien des IDC-Instituts wird die Menge anfallender Daten weltweit von rund 8,6 Zettabyte im Jahr 2015 auf rund 40 Zettabyte im Jahr 2020 anwachsen. In der aktuellen Dekade 2010 bis 2020 wird danach die Datenmasse auf das 50-fache ansteigen. Damit wird es schließlich 57-mal mehr Daten als Sandkörner auf den Stränden dieser Erde geben.

In einem unserer letzten Blogbeiträge berichteten wir bereits über verschiedene Anwendungslösungen im Bereich Big Data, aus denen mittels Enterprise Search eine Vielzahl an Daten entsprechend ausgewertet werden kann. Die Entwicklungen der betriebsinternen Unternehmenssuchmaschinen bietet zwar viele Vorteile und wird auf lange Sicht in größere Organisationen Einzug halten müssen, dennoch gibt es bis heute immer noch Daten, die nur schwer zu evaluieren sind. Hier spricht man von Dark Data.

Really BIG Data

Im Grunde lassen sich nach dem Databerg-Report von Veritas Technolgies Daten in drei verschiedene Kategorien einteilen:

  1. Geschäftskritische Daten:

Hierbei handelt es sich um Daten, die einfach offenkundig wichtig für den Betrieb und Unternehmenserfolg sind. Sie stellen dabei – entgegen der weitverbreiteten Meinung – nicht den Großteil des Datenvolumens dar, werden aber am meisten genutzt, da sie sich leicht erheben und messen lassen. Die Daten werden gleichzeitig proaktiv geschützt und in Echtzeit von Mitarbeitern analysiert. Allerdings sind sie mit einem Anteil von 15 Prozent an der Gesamtdatenmenge vergleichsweise überschaubar.

  1. ROT-Daten:

ROT oder anders ausgedrückt „Redundant, Obsolet, Trivial“ stellen Daten ohne Geschäftswert dar und sollten daher in Abständen gelöscht werden. Hierzu zählen vor allem Spam, Werbung oder Phishing-Mails. Sie entsprechen ungefähr 19 Prozent in Deutschland, der europäische Schnitt liegt bei 32 Prozent.

  1. Dark Data:

Bei Dark Data handelt es sich um grundsätzlich ungenutzte Daten, die in den Untiefen der Speicherplattformen schlummern. Ihre Nutzbarkeit und damit ihr Wert ist noch nicht identifiziert. Eine aktive Zuordnung zu geschäftskritischen oder ROT-Daten ist aber aus wirtschaftlichen Gründen notwendig.

Dark Data sind betriebliche Informationen, die an unterschiedlichsten Stellen und Geräten anfallen. Sie werden entweder gar nicht oder nicht ausreichend betrieblich zielführend ausgewertet. Nehmen wir als Beispiel Log-Dateien von Servern. Sie werden in aller Regel angelegt und gespeichert um im Fall der Fälle Fehler des Servers analysieren und beheben zu können. Gleichzeitig werden sie auch eingesetzt, um die Wirksamkeit von Sicherheitsmaßnahmen prüfen zu können – also nachträglich zu prüfen, ob jemand Sicherheitsmaßnahmen austricksen konnte und unbefugt auf Daten zugegriffen hat.

Diese dunklen Daten ließen sich aber auch für weitere betriebliche Zwecke auswerten. Unternehmen könnten zum Beispiel die Inhalte und Services ihrer Webseite auf Grundlage dieser Daten optimieren, wozu in der Praxis regelmäßig jedoch zusätzliche Tools eingesetzt werden, die unabhängig von den vorhandenen Daten eigene Datensilos anlegen und nutzen. Unabhängig von der wirtschaftlich effizientesten Nutzung von Daten müssen Unternehmen natürlich auch Risiken dieser Daten erkennen und minimieren. Dabei müssen diese Datenmassen zuerst vor unbefugtem Zugriff geschützt werden. Wenn sie für das eigene Unternehmen einen Wert haben könnten, dann werden sie schließlich auch für andere Unternehmen – in jedem Fall aber für spezialisierte kriminelle Organisationen – einen Wert darstellen.

Wenn die Daten sich auf Personen beziehen, also beispielsweise Mitarbeiter oder Kunden, ist über das eigene unternehmerische Risiko, auch das Risiko für diese Personen zu kontrollieren. Das heißt schon die Speicherung dieser Art von Daten sollte mit den entsprechenden Experten, wie dem Datenschutzbeauftragten, besprochen sein. Die tatsächliche Nutzung und Auswertung dieser Daten sollte ebenfalls in enger Abstimmung mit dem Datenschutz und auch mit den Mitbestimmungsgremien erfolgen. Denn unter Umständen führen die angefallenen Daten zu Informationen über Social Skills wie Teamfähigkeit oder kommunikative Kompetenzen von Mitarbeitern. Das Management wird durch die Einbindung der Stakeholder in der Lage sein, eine ausgewogene data driven HR-Strategie zu entwickeln, die sich auf die effiziente Nutzung der notwendigen Daten beschränkt.

Dunkle Daten bergen auch Gefahren für Unternehmen

Unternehmen aus Deutschland schneiden vor allem im Kostenvergleich zu den USA schlecht ab. Demnach wendet ein heimisches Unternehmen pro 1.000 Terabyte an Daten jährlich 594.000 Euro auf, um triviale Daten zu verarbeiten, die irrelevant für das Geschäft sind. Langsam wird den Organisationen dieser Umstand aber bewusst, jedoch fehlt es häufig noch an einer ganzheitlichen Systemlösung, um die Datenmassen möglichst frühzeitig in werthaltige und wertlose Daten zu trennen. Lösungen wie Cornerstone Reporting bieten beispielsweise ein Dashboard als Gesamtpaket an, bei dem die Nutzer in einem funktionalen Cockpit einfach auf die Daten zugreifen können. Bei dieser Nutzung stehen wie in der ganzen Applikation natürlich nur die hinreichend definierten und indexierten Daten zur Verfügung.

Die möglichst effiziente Arbeit mit den anfallenden Daten gilt im Bereich Big Data zurzeit als eines der dringlichsten Themen. Auch Cornerstone OnDemand unterstützt seine Kunden hierbei sowohl mit technischen Funktionen wie auch mit Beratungsleistungen. Die Kernfrage: Wie lassen sich Dark Data kategorisieren und nutzbar machen? Wie können Daten genutzt und dabei das Vertrauen der Mitarbeiter in einen respektvollen Umgang bestätigt werden?

Licht ins Dunkel bringen

Schließlich sind Daten keine Highscores, die man wie in einem alten Arcade-Videospiel sammelt und am Ende eine Medaille erhält. Daten sollen einen Wert besitzen und vor allem Mehrwert schaffen. Denn Dark Data, die als Vorratsdaten umherschwirren wie Meteoriten durchs Weltall, laufen Gefahr, schädlich für das Unternehmen zu werden. Denn einige der Daten könnten brisante Informationen über die Organisation enthalten oder sogar gegen bestehende Compliance-Regeln verstoßen. Der Dieselgate-Skandal hat der ganzen Welt demonstriert, wie zu viel Unwissenheit über die eigenen Daten sogar einen Konzern ins Wanken bringen können.

Bisher haben die IT-Strategien auf zusätzliche Ressourcen wie Speichervolumen gesetzt, die immer schneller verarbeitet werden konnten. Es scheint an der Zeit den Wert als Abwägung zwischen Nutzen und Risiko der anfallenden Daten in den Vordergrund zu rücken. Das Management muss daher verstärkt auf Lösungen wie Enterprise Search setzen und flexible Information-Governance-Strategien entwickeln, um die dunklen Daten transparent und messbar zu machen. Im Ergebnis wird nicht nur effizienter mit wertvollen Firmenressourcen umgegangen, sondern auch IT-Risiken aktiv kontrolliert.

 

.

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert