Bewertung der Relevanz von Bilddaten beim Training neuronaler Netze

Quick Check

Ausgangssituation

Beim Training von KI-Modellen und insbesondere neuronalen Netzen werden große Mengen von Daten benötigt. Aktuelle Forschungen zeigen, dass nicht alle Trainingsbilder gleich viel wert sind. So haben minderwertige Daten keinen oder sogar einen negativen Einfluss auf KI-Modelle und können ohne Genauigkeitseinbuße entfernt werden, um Kosten zu reduzieren. IDS bietet seinen Kundinnen und Kunden Industriekameras sowie eine Plattform, in der KI-Modelle nach eigenen Anforderungen trainiert werden können. Ziel dieses Projekts ist es, ein Verfahren zu finden, welches minderwertige Daten identifizieren kann und es Anwendern erlaubt, diese frühzeitig aus dem Deep Learning-Prozess zu entfernen.

 

Lösungsidee

Einige Veröffentlichungen haben das Thema Datenwert in den letzten Jahren aufgegriffen. Durch Reinforcement Learning wird ein neuronales Netz trainiert, die Güte von Bildern und ihrer Annotationen zu bewerten. In den beschriebenen Experimenten waren die Ergebnisse überzeugend. Um das Verfahren auf der Kamera anzuwenden, muss es allerdings ohne Annotationen auskommen. Zu klären bleibt also, ob das Verfahren auf Bilddaten funktioniert und ob es auch ohne Annotationen stabil läuft.

© Danilo Brajovic, Fraunhofer IPA

Nutzen

Durch das Entfernen von korrumpierten Bildern kann die Performance eines KI-Modells enorm gesteigert werden.

Durch das frühzeitige Bewerten der Güte eines Bildes kann der Upload des Bildes auf den Server sowie das manuelle Nachlabeln des Bildes vermieden werden. Insbesondere das manuelle Labeln von Bildern ist zeit- und kostenintensiv. Dadurch ließen sich viele KI Verfahren leichter und schneller in der Praxis einsetzen. 

 

Umsetzung der KI-Applikation 

Ein fertiges Bewertungsmodell könnte wahlweise auf der Kamera oder auf dem Server laufen. Auf der Kamera würde es verhindern, dass Bilder mit geringer Güte überhaupt hochgeladen werden. Sollte die Anwendung zu rechenintensiv sein, könnte sie auf dem Server laufen, um das manuelle Nachlabeln zu vermeiden oder um Bilder zu identifizieren, die sich negativ auf die Trainingsperformance auswirken.