Kontakt am KI-Fortschrittszentrum

Andreas Frommknecht

KI-Anomalieerkennung mit begrenzten Datensätzen

AI Innovation Seed

Das Fraunhofer IPA Stuttgart sucht Industriepartner mit Sitz in Baden-Württemberg für ein Forschungsprojekt im Bereich der Anomalieerkennung bei begrenzten Datenbeständen. Wenn Sie ein Unternehmen sind, in dem die Erkennung von Anomalien eine strategische Rolle für Ihre Geschäftsprozesse spielt oder spielen könnte, bewerben Sie sich um die Teilnahme an dem Forschungskonsortium. Beginn des AI Innovation Seed-Projekts voraussichtlich ab Januar 2022.

Ausgangssituation

Eine der Anwendungen, bei denen künstliche Intelligenz (KI) einen wichtigen Beitrag zu verschiedenen Geschäftsaktivitäten leisten kann, ist die Erkennung von Anomalien. Sie ermöglicht es Unternehmen, ihre Effizienz und Produktqualität zu verbessern, indem sie Produkte, Ereignisse oder Situationen erkennt, die erheblich vom gewünschten Ergebnis abweichen und ein Problem oder eine Gefahr darstellen könnten.

Abbildung Kabelbaum, Quelle: msk.nina/Adobe Stock
Abbildung 1: Projektidee, Quelle: Fraunhofer IPA

Diese Art von Problemen betrifft, wenn auch mit großen Unter-schieden in der Umsetzung, eine Vielzahl von Bereichen wie die Fertigung (z. B. Fehlererkennung im Produkt), die Pharmaindustrie (z. B. Erkennung von Fremdkörpern in einem Fläschchen), das Recycling (z. B. Erkennung von schlecht differenzierten Produkten) oder die Medizinbranche (z. B. Erkennung von Krankheiten bei Untersuchungen).

KI benötigt Daten

Die Entwicklungen im Bereich der Deep-Learning-Netze ermöglichen es, die Leistung bei dem Aufgabentyp der Annomalieerkennung erheblich zu steigern. Die meisten dieser Algorithmen benötigen jedoch eine große Menge an Daten, um zu funktionieren. Denn je mehr Daten den Modellen der künstlichen Intelligenz zur Verfügung gestellt werden, desto höher ist die Wahrscheinlichkeit, dass der Algorithmus bessere Ergebnisse erzielt. Trotz seiner Vorteile hat ein solcher Ansatz für die Erstellung großer Datenmengen auch seine Tücken. Einerseits, weil es in bestimmten Zusammenhängen schwierig ist, große Datenmengen zu sammeln, wenn die Anomalie beispielsweise nur selten auftritt. Andererseits wegen des Prozesses der Erstellung des Datensatzes selbst. Das Verfahren erfordert einen erheblichen zeitlichen und finanziellen Aufwand, nicht nur für
die Erhebungsphase, sondern vor allem für das Labeling, in der die Daten von ausreichend qualifiziertem Personal verarbeitet werden müssen. Darüber hinaus ist die »Variabilität und Unberechenbarkeit realer Kontexte« ein kritischer Punkt dieses Ansatzes. Neue Arten von Anomalien könnten in verschiedenen Kontexten auftreten und die Stabilität des bestehenden Systems untergraben (Alterung von ML-Netzen). Eine Familie von KI-Algorithmen, die in der Lage sind, die genannten Einschränkungen zu überwinden, könnten eine höhere Leistung erzielen, indem sie allen Unternehmen, die sie einsetzen, mehr Effizienz, Flexibilität und ggf. höhere Produktqualität bieten und die Nutzung dieser Algorithmen auf bisher nicht anwendbare Bereiche ausdehnt.

Projektziele

Ziel des Projekts ist es, kontextübergreifende Methoden der künstlichen Intelligenz zu erforschen und zu entwickeln, die das Erkennen von Anomalien für reale Anwendungsfälle ermöglichen und auch bei Datenknappheit verlässliche Ergebnisse liefern. Datenknappheit kann sowohl einen Mangel an annotierten Daten sowie eine zu geringe Datenmenge bedeuten. Insbesondere schwierige Anwendungskontexte (geringe Fehlerrate, sicherheitskritische Anwendungen etc.) können zu einer geringen Datenmenge führen. Die folgenden Fragen werden daher in dem vorgestellten Projekt behandelt:

  • Welche Strategien gibt es, um das Problem der Erkennung von Anomalien zu lösen, wenn keine Daten vorliegen?
  • Ist es möglich KI-Systeme zu entwickeln, die auch bei einem Mangel an Daten verlässliche Ergebnisse in realen Kontexten liefern?
  • Bis zu welchem Grad stellt welcher Mangel an Daten kein Problem für die Leistung des KI-Systems dar?
  • Inwieweit sind die entwickelten Modelle über den eigentlichen Anwendungskontext hinaus auf andere Fälle übertragbar?

Unser Angebot

  • Ergebnisse der Forschungstätigkeit auf der Grundlage der von den Unternehmen des Konsortiums vorgeschlagenen Anwendungsfälle
  • Ergebnisse auf der Grundlage von Best-Practice-Ansätzen und des aktuellen Stands der Fachliteratur
  • Untersuchung der Übertragbarkeit entwickelter Methoden auf unternehmensspezifische Anwendungsfälle
  • Interdisziplinärer Austausch innerhalb des Projektkonsortiums (Aufbau eines Interessensnetzwerks)
  • Direkte Partizipation an aktuellsten Forschungsergebnissen

Ihre Teilnahme

Ihre Teilnahme an dem Projekt ist kostenlos und steht nach einem Auswahlverfahren allen Unternehmen offen, die

  • ihren Sitz oder Tätigkeit in Baden-Württemberg haben,
  • Anwendungsfälle im Kontext des Forschungsprojekts einbringen,
  • möglichst Daten zur Verfügung stellen können
  • und Spaß am interdisziplinären Austausch mitbringen.

Was ist nicht enthalten?

Die Teilnahme an dem Konsortium umfasst jedoch nicht finanzielle Förderung des Beitrags des Unternehmens für die Teilnahme an dem Projekt sowie Kosten für eigene Hard- und Software.

Projektplanung

Das Projekt startet im Januar 2022 und geht über eine Laufzeit von 12 bis 18 Monaten. Das voraussichtliche Projektende ist für Juni 2023 geplant.

Abbildung Kabelbaum, Quelle: msk.nina/Adobe Stock
Abbildung 2: Projektplannung; in einer ersten Phase, die im letzten Quartal 2021 stattfinden wird, wird das F orschungskonsortium, bestehend aus mindestens vier Unternehmen, gegründet. Quelle: Fraunhofer IPA