8. Juni 2017 | pArtikel drucken | k1 Kommentar

Das sollten IT-Entscheider über Governed Self-Service wissen

Mit der Digitalisierung geht vor allem eines einher: Eine enorme Datenflut. So nützlich die Masse an gesammelten Daten für Unternehmen sein kann, so essenziell ist es auch, sie in passender Form bereitzustellen. Aktuell im Trend: der sogenannte Governed Self-Service mit Unterstützung der Datenvisualisierung.

„Der Datenmarkt entwickelt sich rasanter denn je“ – häufig liest man diese oder ähnliche Schlagzeilen in der Fachpresse. Doch was bedeutet das für Unternehmen konkret?

Die Anforderungen an die Datenhaltung in Unternehmen haben sich in den vergangenen Jahrzehnten drastisch geändert. Im Klartext bedeutet das: Wer konkurrenzfähig bleiben will, muss neue Architekturen implementieren und an der eigenen Strategie zur Datenhaltung für die weitergehende Verarbeitung und Analyse feilen.

Ein vielversprechender Ansatz in diesem Kontext, der sogenannte Governed-Self Service, soll Daten für jeden Mitarbeiter individuell aufbereitet zur Verfügung stellen – jeweils entsprechend des jeweiligen Bedarfs und der Berechtigung im Unternehmen.

Als Basis für diesen Ansatz dienen sogenannte Data Warehouse oder Data Lakes.

Data Warehouse oder Data Lake?

Für die klassische Business Intelligence (BI) werden Daten aller Art erst strukturiert und dann typischerweise in einem sogenannten Data Warehouse abgelegt. Das erleichtert zwar die interaktive Analyse und kann verschiedene Prozesse effizienter gestalten, erfordert jedoch, dass unstrukturierte und semistrukturierte Rohdaten zuvor aufwendig für die Datenintegration aufbereitet werden.

Für viele IT-Entscheider stellt ein Data Lake heute daher das “Mittel der Wahl” dar. In diesem laufen aus den unterschiedlichsten Quellen alle Informationen und Daten – ob die von Sensoren, von Social-Media-Anwendungen oder klassischen Dokumenten – zusammen und werden dort in ihrer Rohform abgelegt.

Das hat den Vorteil, dass die Rohdaten für jede beliebige Fragestellung mit hoher Flexibilität neu verknüpft und analysiert werden können, womit sich die Datenauswertung wesentlich beschleunigen lässt.

Aber wie das US-Magazin DataInformed schreibt, müsse man sich nicht für ein Data Lake oder ein Data Warehouse entscheiden: „Warum nicht zweigleisig fahren und die Vorteile beider Ansätze nutzen?“

Governed Self-Service wird unverzichtbar

Für welches Modell der Datenhaltung Sie sich auch entscheiden: Self-Service Analytics oder Self-Service Business Intelligence (SSBI) gewinnt hierbei zunehmend an Bedeutung.

Laut BigData Insider bezeichnet den Ansatz, „anwendergesteuerte Datenanalyse in Fachabteilungen weitgehend unabhängig von der IT durch eigenständigen und automatisierten Zugriff auf Unternehmensinformationen erstellen zu lassen“. Mitarbeiter der verschiedenen Abteilungen können so selbst auf die Daten zugreifen, die sie benötigen.

Das schafft eine hohe Flexibilität, erfordert aber auch gewisse Regeln oder Regularien, denn sonst würden bald die Kontrolle und die Datensicherheit verlorengehen. Daher wird sich als neues „Must-have“ mittel- bis langfristig der sogenannte Governed Self-Service durchsetzen.

Die Herausforderung aus Governance-Sicht wird sein, Prozesse langfristig nachvollziehbar abzubilden und die Dokumentation von Daten zu gewährleisten. Auch die Erteilung der korrekten Zugriffsberechtigungen könnte sich für IT-Entscheider als schwierig herausstellen.

So ist es wichtig, dass nur diejenigen Mitarbeiter Zugriff auf Daten und gewisse Inhalte von Datensätzen erhalten, die sie tatsächlich einsehen dürfen. Ein Beispiel: Praktikanten sollten etwa unternehmenskritische Daten gar nicht erst zu Gesicht bekommen.

Gleichzeitig müssen diese kritischen Daten aber für die Geschäftsleitung zur Verfügung stehen und so aufbereitet sein, dass sie für Analysezwecke zugänglich und nutzbar sind.

Datenvisualisierung schafft Durchblick

In einer unternehmensinternen Darstellung kommt es darauf an, die vielen unstrukturierten und semistrukturierten Daten so aufzubereiten, dass sie visualisierbar werden. Ziel der Datenvisualisierung ist, die Daten in eine verständliche grafische Form zu bringen, um so aus Textdateien zum Beispiel Muster, Korrelationen und Trends erkennbar zu machen und ableiten zu können. Die Datenvisualisierung schafft im wahrsten Sinne des Wortes „Durchblick“.


Hintergrund: Die jeweiligen Rohdaten müssen hierfür zunächst mit beschreibenden Metadaten (bei Bildern zum Beispiel Aufnahmezeitpunkt, Blende und Belichtungsdauer) angereichert werden, um sie zu katalogisieren, zu sortieren und zu aggregieren. Das bedeutet: Verschiedene Fakten zu einem Fakt zusammenzufügen.


Verschiedene Anwendungsszenarien werden möglich

Je nachdem, wo die Unternehmensdaten dann eingesetzt werden sollen, müssen IT-Verantwortliche dafür sorgen, dass diese entsprechend aufbereitet werden, um sie für die entsprechenden Visualisierungszwecke nutzbar zu machen.

Ein Beispiel: Werden die Daten beispielsweise im operativen Bereich für das maschinelle Lernen benötigt, reicht es, die Informationen direkt aus einem Data Lake zur Verfügung zu stellen.


Sie wollen mehr zu zeitgemäßen Speichertechnologien und Analytics Lösungen erfahren? Hier finden Sie weitere Beiträge zum Thema.


Quelle Titelbild: © sturti / iStock 

Hier schreibt Carla Bösl für Sie

Mehr Artikel vom Autor