Informationsextraktion aus medizinischen Publikationen

Quick Check

Ausgangssituation

Bei der Erstellung von Zulassungsunterlagen (Core Dossiers) müssen spezifische Informationen aus medizinischen Studien zusammengestellt werden. Zu diesen Informationen gehören das Studiendesign, der Zweck der Studie, die Indikation, die benutzten Medikamente, die Größe der Teilnehmergruppe, die Studienergebnisse und das Fazit.

In den medizinischen Studien werden verschiedene Begriffe und Formulierungen verwendet. Deshalb erfordert die Extraktion dieser Informationen aus den Dokumenten Expertenwissen im pharmazeutischen Bereich und benötigt viel Zeit. Werkzeuge, die den Extraktionsprozess unterstützen und ihn vereinfachen und beschleunigen können, sind wünschenswert.

 

Lösungsidee

Im Quick Check wurde zunächst ein gemeinsames Verständnis der Dokumente und der darin ent­hal­tenen Informationen erarbeitet.

Anhand von Testdokumenten wurden die Extraktionsmerkmale betrachtet und Formulierungen identifiziert, die Hinweise auf bestimmte Merkmalswerte geben. Es wurde auch darauf geachtet, inwieweit die Dokumentstruktur genutzt werden kann, um die besten Kandidaten für Merkmalswerte zu bestimmen.

Weiterhin wurde diskutiert, wie die Extraktionsfunktionen den Benutzenden zur Verfügung gestellt werden können und wie die extrahierten Informationen zu speichern sind, um den größt­möglichen Nutzen zu erzielen.

 

Nutzen

Die im Quick Check erreichten Ergebnisse zeigen, dass es mit den verfügbaren KI-Ansätzen möglich ist, die gewünschten Informationen aus den Dokumenten zu extrahieren, um die Medical Writer bei ihren Aufgaben zu unterstützen. Das Nutzenpotenzial sollte anhand einer größeren Dokumentenmenge noch genauer evaluiert werden.

Im ersten Schritt sollte keine vollauto­matische Extraktion der benötigten Merkmale angestrebt werden. Vielmehr sollte eine Assistenzfunktion mit Korrekturmöglichkeit implementiert werden. Die Korrekturdate können später genutzt werden, die KI weiter zu trainieren und bessere Ergebnisse zu erzielen.

 

Umsetzung der KI-Applikation

Die bestehenden Methoden zur Merkmalsextraktion wurden evaluiert und für jedes Merkmal wurden die am besten geeigneten Methoden ausgewählt.

Für die Merkmale Studiendesgin, Medikation und Indikation wurden KI-Modelle erstellt, anhand von frei verfügbaren Sprachmodellen angepasst und für erste Tests im bestehenden Software-Framework Thorpedo des Fraunhofer IAO verfügbar gemacht. Die KI-Modelle wurden mit regelbasierten Ansätzen (z.B. Schlagwort-Listen) zu einem hybriden Ansatz kombiniert, um die jeweils relevanten Abschnitte und Sätze für die einzelnen Merkmale zu identifizieren.

Partnerunternehmen

»Die Extraktion von Informationen aus medizinischen Publikationen ist eine anspruchsvolle Tätigkeit, die viel Zeit in Anspruch nimmt. Ein Werkzeug, dass diese Aufgabe unterstützt und uns dabei hilft, den Aufwand deutlich zu reduzieren, wäre eine große Verbesserung.«

Wörwag Pharma