Semantische Modelle
für die Medizin

Die digitale Darstellung medizinischen Wissens erfordert dringend Verbesserungen. Forscher verlassen sich stark auf statische, oft unstrukturierte Textartikel zur Veröffentlichung ihrer Ergebnisse. Das vorhandene medizinische Wissen ist zwar teilweise strukturiert, jedoch in verschiedenen Vokabularen und wissenschaftlichen Datenbanken verstreut. Diese Wissenslücken führen zu Herausforderungen wie unzureichender Auffindbarkeit, erschwerter Reproduzierbarkeit und einem Mangel an qualitativem Peer-Review, was den Fortschritt der wissenschaftlichen Forschung insgesamt gefährdet.

Aktuelle Entwicklungen in der digitalen wissenschaftlichen Kommunikation haben zu neuen Ansätzen geführt, wie z. B. KI-basierte Methoden zur Darstellung, Organisation und Abfrage von medizinischem Wissen. Diese Ansätze nutzen semantische Modelle, die als Wissensgraphen (Knowledge Graph, KG) bekannt sind, zur Beschreibung von Forschungsartikeln, deren Komponenten (wie Forschungsdaten, Software und Workflows) und medizinischem Wissen (aus medizinischen Datensätzen und Vokabularen). Ein Beispiel ist der „Open Research Knowledge Graph (ORKG)“, entwickelt an der TIB und der Leibniz Universität Hannover.

Induktive Techniken wie die Einbettung von KGs und Mining-Modelle spielen eine entscheidende Rolle beim Erlernen symbolischer (z. B. Regeln) und numerischer (z. B. niedrigdimensionale Vektoren) Repräsentationen eines KGs. Diese Techniken erfassen explizite und implizite Interaktionen und erleichtern verschiedene Inferenzaufgaben, darunter die Vorhersage fehlender Beziehungen, die Ausrichtung von Entitäten und Empfehlungssysteme.

Kausalmodelle drücken Ursache-Wirkungs-Beziehungen zwischen Variablen aus und verbessern die Interpretierbarkeit von KGs. Sie unterstützen Aufgaben wie kontrafaktische Schlussfolgerungen und erhöhen die Übertragbarkeit von Vorhersagemodellen zwischen verschiedenen Populationen. Modelle, die auf einem KG aufbauen, können effektiver an andere KGs mit ähnlichen kausalen Strukturen angepasst werden, was ihren Nutzen und ihre Verallgemeinerbarkeit erweitert.

Diese Nachwuchsgruppe wird Techniken zur Orchestrierung von symbolischen, kausalen Schlussfolgerungen und maschinellem Lernen erforschen, um die Interpretierbarkeit von KI auf medizinischem Wissen aus einschlägiger Literatur, Ontologien und Datenbanken zu verbessern. Die entwickelten semantischen Modelle und hybriden KI-Methoden stehen allen CAIMed-Gruppen zur Verfügung und werden im CAIMed-ORKG-Observatorium angepasst. Zudem werden sie für die Vorhersage von Wechselwirkungen und die Entdeckung von Mustern eingesetzt, um RNAs bei Herz-Kreislauf-Erkrankungen und Lungenfibrose zu identifizieren sowie RNA-gerichtete Therapien zu entwickeln.

Team

Prof. Dr. Sören Auer, L3S

Mentor

Prof. Dr. Dr. Thomas Thum, MHH

Mentor

Prof. Dr. Maria-Esther Vidal, L3S

Mentor

Dr. Daniel Kudenko, L3S

Mentor