Data Science: Wir stehen erst am Anfang

31.08.2016 – Christoph Schuler

Fachartikel für den Newsletter von IngCH Engineers Shape our Future, August 2016

 

Big Data oder eher «Data Science» gilt als einer der ganz grossen Trends in der Informatik und darüber hinaus. Nicht umsonst haben die ETH Zürich und die Eidgenössische Technische Hochschule Lausanne (EPFL) gemeinsam ein Zentrum für Datenwissenschaft geschaffen. Was aber bedeutet das Geschäft mit den Daten für Industrieunternehmen in der Schweiz? Wo stehen sie heute, und wie können sie das Thema vorantreiben? Eine Orientierungshilfe, veranschaulicht am Beispiel von Retailunternehmen.

 

Der Status von Data Science bei einem Unternehmen lässt sich anhand der folgenden drei Phasen einteilen:

1. Erfassen der Daten

Anfang und Ausgangslage eines Big-Data-Projekts ist immer die systematische Erfassung von Datenpunkten, die als Basis für Innovation oder Optimierungsprozesse dienen. Das Unternehmen muss sie mittels Elektrotechnik (für Hardware bzw. Sensoren) und Software erheben.

Am Beispiel des Retailmarkts wird deutlich, dass schon heute Daten gesammelt werden (z. B. zum Einkaufsverhalten, zu den Lagerbeständen etc.), oft sogar mehr, als man im Moment braucht. Eine Herausforderung beim Erfassen von Daten ist es darum, die richtigen Daten zu erheben, um keinen unnötigen Aufwand an der Infrastruktur zu betreiben. Dazu müssen zuerst die Fragestellungen geklärt werden, in denen man sich von Big Data einen Nutzen verspricht. Beispiel: Alle Produkte eines Detailhändlers sind in der digitalen Warenwirtschaft erfasst. Können die Nachbestellungen optimiert werden, indem man sie zum Beispiel basierend auf den Verfallsdaten von Produkten präzisiert?

Dieses Beispiel zeigt aber auch auf, dass bereits das Erheben von Daten eine Investition bedeutet, z. B. weil Sensoren an unzähligen Produkten angebracht werden müssten und weil das Erfassen von vielen unterschiedlichen Messpunkten einen hohen Komplexitätsgrad mit sich bringt. Informatiker arbeiten in dieser Phase eng mit Infrastrukturverantwortlichen und Systemtechnikern zusammen.

2. Organisieren der Daten

Werden die gewünschten Daten einmal erfasst, ist es wichtig, sie effizient zu organisieren und in geeigneten Strukturen zu speichern. Die «Datenhaufen» müssen auf eine Weise verwaltet werden, die eine spätere Analyse erlaubt. Datenreihen können manchmal über Jahre hinweg relevant bleiben (z. B. das Einkaufsverhalten über die Festtage). Beim Organisieren sind insbesondere die Performanz und Verfügbarkeit grosser, komplexer Datenmengen von Bedeutung. Diese Fragestellungen gehören zu den Kernkompetenzen von Informatikingenieuren.

3. Auswerten der Daten

Der eigentliche Mehrwert von Big Data entsteht erst in Phase drei. Hat man die gewünschten Daten einmal erfasst, besteht die Kunst der Datenanalyse («Data Mining») darin, die Daten zu analysieren und mit anderen geeigneten Daten aus unterschiedlichsten Quellen zu verknüpfen. Solche Projekte sind immer interdisziplinär, Informatiker arbeiten mit Statistikern oder Mathematikern zusammen. Elementar ist zudem das Business-Know-how, damit man die richtigen Fragen stellt. Manchmal muss man auch unkonventionelle Wege gehen. Firmen wie Apple oder Google gehören hier zu den Vorreitern: So werden VIP-Kunden im Apple-Shop durch ihre personalisierte Apple-Uhr erkannt und bevorzugt behandelt. Google benutzt das Tracking von Smartphones für die Darstellung von Besucherzahlen und Öffnungszeiten. In der Schweiz stehen wir hingegen erst am Anfang einer systematischen Auswertung solcher Daten.

Wo steht die Schweiz heute?

Fortschrittliche Unternehmen der Schweizer Industrie – nicht nur im Retailmarkt – sind heute mehrheitlich bei Phase zwei angelangt. Das heisst, sie haben eine Infrastruktur entwickelt und beschäftigen sich aktuell mit der Frage, wie die Daten eingelagert und organisiert werden können. Viele befinden sich aber auch noch auf Stufe 1, auch im Retailbereich: Schon heute ist auf vielen Produkten zwar ein Strichcode, aber das Haltbarkeitsdatum ist z. B. nicht maschinenlesbar, was ermöglichen würde, dass daraus ein weitergehender Nutzen für die Warenwirtschaft und den Bestellprozess gezogen werden könnte. Das Geschäft mit den Daten hat viel Potenzial, aber auf dem Weg dahin sind noch ein paar Hürden zu nehmen.