5 Minuten
KI-Modell sagt Tausende Diagnosen Jahre vor ihrem Auftreten voraus
Wissenschaftler von Institutionen aus dem Vereinigten Königreich, Dänemark, Deutschland und der Schweiz berichteten über die Entwicklung eines Modells der künstlichen Intelligenz, das die Raten für mehr als 1.000 medizinische Erkrankungen Jahre im Voraus prognostizieren kann. Das System mit dem Namen Delphi-2M basiert auf transformerbasierten neuronalen Netzwerken — derselben Architektur, die auch in Verbraucher-Chatbots wie ChatGPT verwendet wird — und wurde in einer Arbeit in Nature beschrieben.
Delphi-2M wurde hauptsächlich mit longitudinalen Gesundheitsdaten des UK Biobank trainiert, einer großen biomedizinischen Forschungsressource mit detaillierten Gesundheits-, Gen- und Lebensstilinformationen von etwa 500.000 Teilnehmenden. Das Forscherteam bewertete die Leistung weiter, indem es das Modell mit fast zwei Millionen Patientendatensätzen aus Dänemarks nationaler Gesundheitsdatenbank validierte, was viele prädiktive Signale länderübergreifend replizierbar zeigte.
Wie das Modell funktioniert und wissenschaftlicher Kontext
Transformer-Modelle sind vor allem dafür bekannt, Sequenzen von Sprache zu verarbeiten, wobei sie Muster und Beziehungen zwischen Wörtern lernen. Die Forschenden wendeten diese Fähigkeit auf klinische Zeitreihen an: Jede Diagnose, jedes Testergebnis oder jeder medizinische Code in der Patientenakte wird zu einem geordneten Token, aus dem das Modell lernen kann. Wie Moritz Gerstung vom Deutschen Krebsforschungszentrum in der Publikation und in öffentlichen Äußerungen erklärte, ist das Verstehen von Diagnosefolgen "ein bisschen wie das Erlernen der Grammatik in einem Text" — das Modell erkennt, welche Ereignisse typischerweise anderen vorausgehen und welche Kombinationen ein erhöhtes zukünftiges Risiko signalisieren.
Das Team berichtet, dass Delphi-2M Personen mit deutlich höherem oder niedrigerem Risiko für Ereignisse wie Herzinfarkt identifizieren kann als herkömmliche Risiko-Rechner allein. Im Gegensatz zu Instrumenten, die auf einzelne Erkrankungen abzielen (zum Beispiel QRISK3 zur Abschätzung des kardiovaskulären Risikos in der Primärversorgung), zielt Delphi-2M darauf ab, eine krankheitsübergreifende, langfristige Prognose zu liefern: Tausende von Erkrankungen gleichzeitig, über Jahre statt Monate.
Das Modell verwendet außerdem eine breite Palette von Eingaben aus klinischen Verläufen, Laborwerten und kodierten Diagnosen. "Delphi-2M lernt die Muster in Gesundheitsdaten, vorausgehende Diagnosen, in welchen Kombinationen sie auftreten und in welcher Abfolge", schrieben die Autorinnen und Autoren, wodurch sie sogenannte „gesundheitsrelevante Vorhersagen" ermöglichen.

Validierung, Einschränkungen und ethische Überlegungen
Obwohl die ersten Ergebnisse vielversprechend sind, betonen die Autorinnen und Autoren sowie externe Gutachter, dass Delphi-2M noch nicht für den klinischen Einsatz bereit ist. Die Validierung an zwei großen Datensätzen stärkt das Vertrauen in die prädiktiven Signale des Modells, doch beide Datensätze weisen bekannte Verzerrungen bei Altersverteilung, ethnischer Repräsentation und lokalen Versorgungspraktiken auf. Peter Bannister, ein Forscher für Gesundheitstechnologie und Fellow bei der Institution of Engineering and Technology in Großbritannien, wies auf diese Einschränkungen hin und hob die Distanz zwischen einem Forschungsprototypen und einer Verbesserung der Routineversorgung hervor.
Co-Autor Tom Fitzgerald vom European Molecular Biology Laboratory betonte Systemeinsparungen und schlug vor, dass prädiktive Modelle dieses Typs helfen könnten, die Ressourcenverteilung in angespannten Gesundheitssystemen zu optimieren. Co-Autor Ewan Birney hob im Vergleich zu bestehenden klinischen Risikoinstrumenten den krankheitsagnostischen, mehrjährigen Umfang von Delphi-2M hervor: "Es kann alle Erkrankungen gleichzeitig und über einen langen Zeitraum abdecken."
Gustavo Sudre, ein Spezialist für medizinische KI am King’s College London, beschrieb die Arbeit als "einen wichtigen Schritt zu skalierbaren, interpretierbaren und — am wichtigsten — ethisch verantwortbaren prädiktiven Modellen." Interpretierbarkeit bleibt ein zentrales Forschungsziel, da viele große Modelle weiterhin ein inneres Verhalten zeigen, das für Expertinnen und Experten nur schwer vollständig zu erklären ist.
Mögliche Anwendungen und nächste Schritte
Bei weiterer Validierung und Integration in Versorgungswege könnten Modelle wie Delphi-2M die Präventivmedizin beeinflussen, indem sie Patienten für engmaschigere Überwachung, Lebensstilinterventionen oder frühere diagnostische Untersuchungen identifizieren. Gesundheitssysteme könnten aggregierte Vorhersagen nutzen, um Personalplanung, Diagnostikkapazitäten und gezielte Maßnahmen des öffentlichen Gesundheitswesens zu planen. Vor einer Einführung sind jedoch robuste externe Validierungen, prospektive klinische Studien, Fairness-Bewertungen über diverse Populationen hinweg und klare regulatorische Rahmenbedingungen erforderlich.
Verwandte Technologien
Diese Forschung überschneidet sich mit breiteren Entwicklungen in der medizinischen KI: elektronische Gesundheitsakten-Phänotypisierung, föderiertes Lernen für standortübergreifendes Training ohne Austausch roher Daten und erklärbare KI-Werkzeuge, die aufzeigen, welche Merkmale einzelne Risikovorhersagen beeinflussen.
Expertinnen- und Experteneinschätzung
Dr. Anna Reyes, Biomedizin-Datenwissenschaftlerin und Wissenschaftskommunikatorin, kommentiert: "Delphi-2M zeigt, wie Sequenzmodelle klinisch relevante Signale aus komplexen Patientenverläufen extrahieren können. Der eigentliche Test wird darin bestehen, diese Signale in umsetzbare und gerechte Interventionen zu übersetzen. Dazu sind sorgfältige prospektive Studien und eine enge Zusammenarbeit zwischen Klinikern, Datenwissenschaftlern und Ethikerinnen und Ethikern nötig, um zu vermeiden, dass bestehende Gesundheitsungleichheiten verstärkt werden."
Fazit
Delphi-2M stellt einen bemerkenswerten Fortschritt in der prädiktiven Medizin dar: ein transformerbasiertes KI-Modell, das Risiken für mehr als 1.000 Erkrankungen Jahre im Voraus abschätzen kann, indem es Muster in Patientenverläufen lernt. Die frühe Validierung an Datensätzen aus dem Vereinigten Königreich und Dänemark zeigt Potenzial, doch Autorinnen und Autoren sowie externe Fachleute warnen davor, dass verzerrte Daten, Interpretierbarkeitsprobleme und der Bedarf an prospektiven klinischen Tests bedeuten, dass die Technologie noch nicht routinemäßig einsetzbar ist. Werden diese Hürden überwunden, könnten krankheitsagnostische Vorhersagewerkzeuge Teil zukünftiger Präventionsstrategien und Gesundheitsplanung werden und die klinische Entscheidungsfindung ergänzen — nicht ersetzen.
Quelle: sciencealert
Kommentar hinterlassen