KI-basierte Layout- und Inhaltserkennung in unstrukturierten Textdokumenten

© Mari Helin - Unsplash

Unstrukturierte Textdokumente (Kundenanfragen, Geschäftskorrespondenz etc.) sind Element vieler Geschäftsprozesse in nahezu allen Unternehmen. Die Dokumente im Posteingang können aber derzeit nur selten automatisiert weiterverarbeitet werden.

Obwohl bereits viele Standardlösungen für einige Teilprobleme der Auswertung von Texten existieren, stellt besonders die korrekte Erkennung von Inhalten in Dokumenten mit nicht-standardisierten Layouts weiterhin eine Herausforderung dar.

Das Team Angewandte Künstliche Intelligenz am Fraunhofer IAO beschäftigt sich mit der Entwicklung von Methoden und Prototypen im Bereich Text-und Dokumentenverarbeitung, welche Ansätze des maschinellen Lernens mit Regelwerken kombinieren.

Im Rahmen dieses Projekts werden weitere Methoden und Komponenten zur Analyse von Inhalt und Layout von unstrukturierten Textdokumenten entwickelt, die auch kleinere Unternehmen (KMU) bei der effizienten Verarbeitung von typischen Geschäftsdokumenten unterstützen.