Smart Data Web auf der CeBIT 2017 am Stand des BMWi

Die Projekte SD4M und Smart Data Web, die im Smart Data Programm des Bundesministeriums für Wirtschaft und Energie gefördert werden, präsentieren sich auch in diesem Jahr mit einem gemeinsamem Exponat den Besuchern der CeBIT.  Das Exponat wird wie letztes Jahr am Stand des BMWi  in Halle 6 gezeigt (BMWi – Informationen zur CeBIT 2017):

Ob Ausfälle von Zulieferern oder Naturkatastrophen – es gibt eine Vielzahl externer Ereignisse, die einen Einfluss auf die Wertschöpfungs- und Lieferketten eines Unternehmens haben. Viele Informationen über solche Geschehnisse sind auf Nachrichtenwebseiten oder in sozialen Netzwerken verfügbar, erreichen Entscheiderinnen und Entscheider jedoch oft zu spät oder eher zufällig. Nur, wenn Unternehmen unvorhersehbare Entwicklungen frühzeitig erkennen, können sie auch entsprechend reagieren. 

Das Projekt Smart Data Web will diese zeitliche Lücke schließen und die Informationen unmittelbar und systematisiert zur Verfügung stellen. Deshalb wertet das Projekt pro Tag automatisch rund 300.000 Tweets, 16.000 Nachrichtendokumente und etwa 20.000 Meldungen von Polizei, Behörden und Verkehrsunternehmen aus, und kombiniert diese mit Daten aus Firmendatenbanken und der OpenStreetMap, einer Datenbank für frei nutzbare Geodaten. Auf Basis dieses Wissensnetzes können Unternehmen unvorhersehbare Ereignisse schnell erkennen und in ihre Planungs- und Entscheidungsprozesse für die Produktion miteinbeziehen.

Im Vergleich zum letzten Jahr hat sich das Projekt in vielfältiger Weise weiterentwickelt. Ein besonderer Augenmerk lag auf der Verbesserung der Informationsextraktionstechnologien und ihrer Integration in das Big-Data-Framework Apache Flink. Die zugrundeliegenden Natural Language Processing und Machine Learning Verfahren wurden auf neue Entitätstypen wie z.B. Produkte und Technologien, neue Relationen und Fakten, wie z.B. „Firma-ist-Lieferant-für-Produkt“, erweitert und die Erkennungsgenauigkeit verbessert. In enger Zusammenarbeit aller Partner wurden verschiedene Ansätze zur Informationsextraktion entwickelt und erprobt, u.a. regelbasierte Ansätze, statistische Modelle und auch Verfahren des Deep Learning.

Der auf der CeBIT gezeigte Demonstrator ist auch unter http://ta.dfki.de öffentlich verfügbar (Hinweis – nur für Google Chrome/Chromium optimiert, andere Browser unterstützen nicht alle Funktionen der Demo).