ExDRa

Exploratory Data Science over Raw Data

Anwendungsbranche: Produktion; branchenunabhängig
Technologiebereich: Data & Service Management; Machine Learning

ExDRa erleichtert die Analyse von großen Mengen heterogener Rohdaten aus unterschiedlichen Quellen und trägt dazu bei, dass Industrieanlagen zuverlässiger überwacht und ausfallsicherer betrieben werden können.

Ausgangslage
Typische Prozesse zur Auswertung von Daten, sogenannte Data-Science-Prozesse, verlaufen in vielen Unternehmen explorativ. Das bedeutet, dass Datenwissenschaftler zunächst Hypothesen aufstellen, die erforderlichen Daten zentral zusammenführen und dann in verschiedenen Analysen nach Mustern oder Vorhersagemodellen suchen. Vorab ist nicht bekannt, ob der Prozess verwertbare Ergebnisse liefert, daher werden die Daten meist nicht systematisch akquiriert und aufbereitet. Der Vorgang wird jedes Mal aufwendig wiederholt, wodurch hohe Kosten entstehen. Hinzu kommt, dass Daten, die an verschiedenen Orten erhoben werden, oft aus rechtlichen Gründen oder Exportbeschränkungen nicht ohne Weiteres an ein zentrales System übermittelt werden dürfen.

Projektziel
Im Projekt ExDRa wird ein Demonstrator entwickelt, der den explorativen Data-Science-Prozess über heterogene und verteilte Rohdaten unterstützt. Das umfasst Daten, die zum Beispiel aus unterschiedlichen Rechnersystemen stammen. Dadurch soll die Bewertung neuer Datenprodukte vereinfacht und beschleunigt werden. Unter Datenprodukten sind hier zum Beispiel Vorhersagen oder Modelle des maschinellen Lernens zu verstehen, die bei der Analyse von Daten gewonnen wurden. Weil Rohdaten in ExDRa auch dezentral gespeichert und verarbeitet werden können, gewährleistet ExDRa auch die rechtskonforme Verarbeitung sensibler oder exportbeschränkter Daten. In der Praxis soll die Lösung in der Prozessindustrie bei der Siemens AG erprobt werden, beispielsweise bei der Fernüberwachung von Pumpen. Die Leistung dieser Pumpen wird mit Hilfe von Verfahren des maschinellen Lernens überwacht. ExDRa verwendet die anfallenden Daten direkt vor Ort, ohne die Rohdaten an eine zentrale Stelle zu schicken.

Anwendung und praktischer Nutzen
ExDRa soll schließlich Überwachungsmodelle verbessern, wodurch Anlagen zuverlässiger und produktiver arbeiten sowie weniger Kosten verursachen. ExDRa eignet sich daher besonders für die Fernüberwachung von verteilten Systemen, wie sie zum Beispiel in der Chemie- und Pharmaindustrie oder bei der Förderung von Öl und Gas vorkommen. Gerade diese Anlagen verlangen schnelle Reaktionen, um Störungen und Ausfallzeiten zu vermeiden. Im Anschluss an das Projekt wäre der Aufbau einer Marktplattform für verteilte Datenprodukte denkbar.

Konsortium
Siemens AG (Konsortialführer), Technische Universität Berlin, DFKI GmbH, Technische Universität Graz

01.06.2019 - 31.05.2022

Dr. Claus Neubauer
Siemens AG

Per E-Mail kontaktieren