SPEAKER

Sprachassistenzplattform Made in Germany

Speaker-Logo
© Projekt Speaker
Speaker-Logo

Sie heißen Alexa, Siri, Bixby oder Cortana: Sprachassistenten regeln vieles im Alltag automatisiert auf Zuruf. Doch dem Einsatz im lauten Großraumbüro oder gar in der Produktion sind sie nicht gewachsen. Das Projekt SPEAKER entwickelt eine Sprachassistenzplattform auf Basis Künstlicher Intelligenz (KI) für Business-to-BusinessAnwendungen (B2B). Ziel des Projekts ist, Infrastruktur, Technologiebausteine und Standards für B2B-Sprachassistenten in einem umfassenden Ökosystem bereitzustellen. Der Datenschutz und die Sicherheit personenbezogener und unternehmensrelevanter Informationen haben dabei oberste Priorität.

Marktperspektive und Produktversprechen

Die SPEAKER-Plattform ermöglicht die Umsetzung spezialisierter Sprachassistenten im B2B-Umfeld unter Einhaltung höchster Datenschutzkriterien. Durch die Erweiterungsmöglichkeit um spezialisierte Technologiekomponenten können sämtliche Branchen von der neu geschaffenen Sprachassistenzplattform profitieren. Im Projekt werden konkrete Lösungen im Gesundheitsbereich, im Kundenservice und im technischen Service entwickelt. Die Plattform soll von einer ausgegründeten Betreibergesellschaft betrieben werden, welche flexible Lizenzmodelle für die Nutzung der Angebote ermöglicht.

Konsortium

audEERING GmbH, Comma Soft AG, DATEV eG, Deutsche Bahn AG, Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Fraunhofer-Gesellschaft, Grundig Business Systems GmbH, IAV GmbH Ingenieurgesellschaft Auto und Verkehr, iNNOVO Cloud GmbH, International Data Spaces e. V., Ludwig-Maximillians-Universität München, ONSEI GmbH, Retresco GmbH, SAP SE, Scopevisio AG, Siemens Aktiengesellschaft, Techniche Universität Carolo-Wilhelmina zu Braunschweig, Universität Paderborn

Herausforderung und Innovation

Der Bedarf nach Sprachassistenzlösungen in der Wirtschaft ist enorm, ihre Anwendungsmöglichkeiten erstrecken sich auf nahezu jede Branche. Die bereits existierenden, vornehmlich Endkunden-orientierten Sprachplattformen erfüllen die Ansprüche vieler deutscher Unternehmen aus mehreren Gründen jedoch nicht: Die aufgenommenen, mitunter sehr sensiblen Unternehmensinformationen werden auf Plattformen von außereuropäischen Unternehmen übertragen und verarbeitet, was geltenden Datenschutzvorschriften meistens widerspricht. Gleichzeitig scheitern aktuelle Lösungen auf der technischen Ebene daran, auch in Umgebungen mit hohen Störgeräuschpegeln den Sprecher zu verstehen, verschiedene Personen zu identifizieren oder Fachvokabular zu verstehen. Durch seine Sprachassistenzplattform „Made in Germany“ will das SPEAKER-Projekt diese Herausforderungen lösen.

Lösungsansatz

Herzstück des Ökosystems ist eine skalierbare, mehrsprachige Plattform, auf der maßgeschneiderte KI-Technologien und Dienste für viele verschiedene Anwendungsbereiche zur Verfügung gestellt werden. Unternehmen erhalten Zugriff auf die neuen Technologien inklusive der Möglichkeit, diese auf ihren Bedarf hin anzupassen.

So werden auf der Plattform Technologien aus den Bereichen Sprachsignalverarbeitung, Sprachverstehen sowie Künstliche Intelligenz entwickelt und bereitgestellt. Beispiele dafür sind eine Lösung für die Spracherkennung (Automatic Speech Recognition), Sprachverstehen (Natural Language Understanding) oder die automatisierte Beantwortung von Fragen (Question Answering). Damit werden in der Industrie beispielsweise Mitarbeiter durch sprachgestützte Inspektionen und Qualitätssicherungen von Maschinen, Fahrzeugen oder Infrastrukturen entlastet sowie Service- und Verwaltungsprozesse effizienter gestaltet.

Die Technologie und Datensouveränität wird bei allen Anwendungen optimal in Einklang gebracht, um sie inbesondere deutschen Unternehmen mit hohen Datenschutzanforderungen gezielt und sicher anzubieten. Unternehmen erhalten zudem die Option, die notwendigen Daten für ihre Sprachassistenzlösungen in einer unternehmensinternen Cloud zu speichern.

Use Cases

Im Laufe der Projektlaufzeit werden verschiedene Use Cases entwickelt und in der Praxis erprobt. Im Folgenden sind exemplarisch drei beschrieben.

Gesundheitslogbuch

Ein Gesundheitslogbuch, in dem Patienten ihre Beobachtungen mündlich festhalten, kann den Gesundheitszustand von Patienten lückenlos und möglichst barrierefrei dokumentieren. Somit ermöglichen die KI-basierten Lösungen von SPEAKER, ein solches Gesundheitslogbuch einfach und intuitiv zu führen. Darauf aufbauend leiten die behandelnden Ärzte Diagnosen und Therapiemöglichkeiten ab.

Digitaler Sprachassistent im Kundenservice

Der digitale Sprachassistent soll rund um die Uhr für Mandanten von Steuerberatungs- und Rechtsanwaltskanzleien für Fragen und Informationen zur Verfügung stehen. Diese Anwendung demonstriert besonders die datenschutzkonforme Verarbeitung höchst sensibler Informationen und den Umgang mit Fachvokabular.

Wartungsunterstützung

Mit Hilfe einer Sprachassistenzlösung wird das Personal bei Wartungsprotokollen unterstützt, indem bereits während der Prüfung oder Reparatur die wesentlichen Informationen per Spracheingabe hinterlegt werden.

Ohne SPEAKER Mit SPEAKER
US-amerikanische und asiatische Unternehmen beherrschen den Markt der Sprachassistenten. Eine sichere und DSGVO-konforme Sprachassistenzplattform „Made in Germany“ ist attraktiv für europäische und deutsche Unternehmen.
Viele Sprachassistenz-Lösungen bieten keine Datensouveränität, die Verarbeitung und Speicherung der Daten ist unklar. Die SPEAKER-Plattform ermöglicht kompromisslose Datensouveränität.
Die domänenspezifische Anpassung der einzelnen Komponenten, wie das Erkennen von Fachvokabular, ist mit vorhandenen Lösungen nur bedingt umsetzbar. Die SPEAKER-Plattform ermöglicht das Nachtrainieren einzelner Technologiekomponenten, um auch Anwendungen mit domänenspezifischen Fachbegriffen umzusetzen.
Am Markt vorhandene SprachassistenzSysteme sind nur eingeschränkt in der Lage, Dialoge zu führen.Mit SPEAKER werden einfache Question-Answering-Szenarien bis hin zu komplexen, nichtlinearen, sogenannten Multi-turn-Dialogen ermöglicht.
Fachwissen z. B. zum Einsatzgebiet muss mit hohem individuellem Aufwand in die Sprachassistenzlösung eingebunden werden.Mit Hilfe des SMART-Data-Connectors, einer der Technologiekomponenten von SPEAKER, werden Wissensdarstellungen wie Datenbanken oder Wissensgraphen einfach integriert.

Ansprechpartner

Fraunhofer IAIS

Dr. Joachim Köhler