Kollaborative Entwicklung & Validierung von KI
Die Entwicklung von KI bis hin zum klinischen Einsatz geschieht in der Praxis in vielen Iterationen eines Prozesses aus medizinischer Datenbereitstellung, technischer Entwicklung, technischer, biologischer und statistisch-fallbasierter Validierung und anschließender medizinischer, biologischer und technischer Verfeinerung. Hierbei ist die enge und effiziente Kollaboration verschiedener informatischer und medizinischer Arbeitsgruppen notwendig. Insbesondere in der Onkologie sind hierbei umfangreiche Datenbestände entstanden und wachsen kontinuierlich, welche allerdings oft Intellectual-Property (IP) und Datenschutz-Rahmenbedingungen unterliegen, die innerhalb dieses iterativen Entwicklungskreislaufes berücksichtigt werden müssen. Gegenüber konventionell rein rechtlich-strukturierten Kollaboration soll daher hier eine methodisch gesicherte dezentrale, verteilte, föderierte Entwicklung und Validierung von KI untersucht und entwickelt werden. Ziel ist die Steigerung der Effizienz eine erfolgreichen Kollaboration mit der Gruppen in CAIMed und externen Partnern durch die Möglichkeit einer technisch gesicherten, skalierbaren kollaborativer KI-Entwicklung. Der Fokus liegt hier auf Bilddatenbeständen der Digitalen Pathologie. Zentral ist hierbei nicht nur klassisch föderiert KI-Algorithmen (Deep-Learning) zu verteilen, sondern potenziell verteilte, aber primär (für die Daten-Bereitsteller) geschützte semantisch annotierte Datenbestände zu etablieren. Insbesondere wird so der Zugang zu einem erheblich größeren klinisch relevanten Datenpool möglich als bei reinen Open-Data Ansätzen. Insbesondere an semantisch strukturierten onkologischen Bilddaten (Pathologie, Radiologie) aus CAIMed werden diese technischen Schutz-Ansätze für dezentrale KI-Entwicklung untersucht. Hierzu werden aus den bestehenden umfangreichen onkologischen Datenbeständen digitale Patientenkollektive (z.B. CancerScout) extrahiert und durch automatische Datenflüsse onkologischer Bilddaten und ihrer semantischen Bedeutung für Diagnostik und Therapie dann für KI-Methoden Kollaborationspartner zum Training und zur fallbasierten Validierung in technisch geschützten föderierten Lernumgebungen über KI-Methoden aufgearbeitet und für Deep-Learning bereitgestellt. Hierfür werden u.a. High-Performance-Computing Ressourcen der GWDG zum maschinellen Lernen genutzt. Exemplarisch werden die klinischen Use-Cases wie Response-Prediction, Prognose und Biomarker-Analyse (z.B. Immuninfiltrate) bearbeitet.