Bewertung der Relevanz von Bilddaten beim Training neuronaler Netze

Quick Check

Ausgangssituation

Beim Training von KI-Modellen und insbesondere neuronalen Netzen werden große Mengen von Daten benötigt. Gerade bei Bildern ist der Speicherbedarf und die Trainingszeit dadurch enorm. Aktuelle Forschungen zeigen, dass nicht alle Trainingsbilder gleich viel wert sind. So haben minderwertige Daten keinen oder sogar einen negativen Einfluss auf KI-Modelle und können ohne Genauigkeitseinbuße entfernt werden, um Kosten zu reduzieren. IDS bietet seinen Kunden Industriekameras sowie eine Plattform, in der die Kunden KI-Modelle nach eigenen Anforderungen trainieren können. Ziel dieses Projekts ist es, ein Verfahren zu finden, welches minderwertige Daten identifizieren kann und es Anwendern erlaubt, diese frühzeitig aus dem Deep Learning-Prozess zu entfernen, idealerweise bereits bei der Bildaufnahme auf der intelligenten Kamera.

Lösungsidee

Einige Veröffentlichungen haben das Thema Datenwert in den letzten Jahren aufgegriffen. Besonders herausgestochen hat ein Google-Paper aus dem Jahr 2020. Durch Reinforcement Learning wird ein neuronales Netz trainiert, die Güte von Bildern und ihrer Annotationen zu bewerten. In den beschriebenen Experimenten waren die Ergebnisse überzeugend. Um das Verfahren auf der Kamera anzuwenden, muss es allerdings ohne Annotationen auskommen. Zu klären bleibt also, ob das Verfahren auf Bilddaten funktioniert und ob es auch ohne Annotationen stabil läuft.

Abbildung 1: Bewertung der Güte von Trainingsbildern und anschließend gewichtetes Training, Danilo Brajovic, Fraunhofer IPA

Nutzen

Durch das Entfernen von korrumpierten Bildern kann die Performance eines KI-Modells enorm gesteigert werden. Durch das frühzeitige Bewerten der Güte eines Bildes kann der Upload des Bildes auf den Server sowie das manuelle Nachlabeln des Bildes vermieden werden. Insbesondere das manuelle Labeln von Bildern ist zeit- und kostenintensiv. Dadurch ließen sich viele KI-Verfahren leichter und schneller in der Praxis einsetzen.

Umsetzung der KI-Applikation

Ein fertiges Bewertungsmodell könnte wahlweise auf der Kamera oder auf dem Server laufen. Auf der Kamera würde es verhindern, dass Bilder mit geringer Güte überhaupt hochgeladen werden. Sollte die Anwendung zu rechenintensiv sein, könnte sie auf dem Server laufen, um das manuelle Nachlabeln zu vermeiden oder um Bilder zu identifizieren, die sich negativ auf die Trainingsperformance auswirken.