4 Minuten
Hintergrund: Die Bedeutung der Stimme bei Kehlkopfkrebs
Jährlich erkranken weltweit Hunderttausende an Kehlkopfkrebs. Im Jahr 2021 wurden global etwa 1,1 Millionen Fälle von Tumoren an Kehlkopf und angrenzenden Strukturen erfasst, wobei fast 100.000 Todesfälle registriert wurden. Die gängigen Diagnoseverfahren erfordern spezialisierte Methoden wie die Video-Nasenendoskopie und die Entnahme von Gewebeproben – bewährte, jedoch invasive Prozeduren, die zudem den Zugriff auf fachkundiges Personal voraussetzen.
Studienaufbau und Methodik
Ein Forscherteam der Oregon Health & Science University und der Portland State University untersuchte 12.523 Sprachaufnahmen von 306 Teilnehmenden aus Nordamerika, um herauszufinden, ob sich durch Veränderungen an den Stimmbändern – ob gut- oder bösartig – messbare Spuren im Klang der Stimme hinterlassen. Mithilfe von maschinellem Lernen extrahierten die Wissenschaftler akustische Merkmale und suchten nach Mustern, die maligne von benignen Veränderungen und anderen Stimmstörungen unterscheiden.
Zentrale Ergebnisse: Harmonic-to-Noise Ratio als Indikator
Im Zuge der Untersuchung traten charakteristische akustische Unterschiede vor allem bei männlichen Stimmen zutage. Besonders aufschlussreich war das Verhältnis von Harmonischen zu Rauschen (HNR), ein Maß, das das Verhältnis zwischen dem periodischen Klanganteil und dem unregelmäßigen Störsignal innerhalb der Stimme beschreibt. Die trainierten Modelle konnten mithilfe von HNR und verwandten Merkmalen Männer mit bösartigen Stimmbandveränderungen von jenen mit gutartigen Läsionen oder anderen Stimmerkrankungen unterscheiden – und das in einem Ausmaß, das menschlichen Ohren verborgen bleibt.
"Um von dieser Forschungsarbeit zu einem KI-System zur Erkennung von Stimmbandläsionen zu gelangen, würden wir die Modelle mit einer noch umfangreicheren, von Experten klassifizierten Sammlung von Sprachproben trainieren. Anschließend müsste geprüft werden, ob das System für beide Geschlechter gleich gut arbeitet", erläutert der Medizininformatiker Phillip Jenkins von der Oregon Health & Science University.

Einschränkungen: Geschlechtsunterschiede und Umfang der Datenbasis
Bei Frauen konnten im betrachteten Datensatz keine statistisch signifikanten akustischen Unterscheidungsmerkmale nachgewiesen werden. Das schließt nicht aus, dass sie existieren – vielmehr zeigt es, dass für ein universelles Screening größere, vielfältigere Datensätze sowie eine feinere Abstimmung der Modelle nötig sein werden.
Verwandte Technologien und Zukunftsaussichten
Sprachbasierte Diagnosewerkzeuge, die auf Sprachverarbeitung, digitaler Signalanalyse sowie maschinellem Lernen beruhen, werden heute bereits für verschiedene Anwendungen wie COVID-19-Screenings oder das Monitoring neurologischer Erkrankungen erprobt. Mit einem validierten Sprach-Screening-Tool für Stimmbandläsionen könnten auch Allgemeinmediziner, Telemedizin-Plattformen oder Bevölkerungsprogramme Patienten schneller zuordnen und Risikopersonen rascher zur HNO-Abklärung überweisen.
"Sprachbasierte Gesundheitstools werden bereits pilotiert. Aufbauend auf unseren Erkenntnissen schätze ich, dass vergleichbare Systeme zur Erkennung von Stimmbandveränderungen mit größeren Datensätzen und klinischer Bestätigung in den kommenden Jahren in die Pilotphase übergehen könnten", ergänzt Jenkins.
Klinische und ethische Aspekte
Bevor solche Werkzeuge eingesetzt werden, ist eine klinische Validierung über Geschlechter, verschiedene Altersgruppen, Sprachen und Aufnahmebedingungen nötig, um Verzerrungen zu vermeiden. Regulatorische Freigaben, Datenschutz für Sprachdaten sowie ein klarer Prozess für die Weiterleitung auffälliger Befunde sind elementar, damit aus akustischen Biomarkern sichere und gerechte öffentliche Gesundheitstools werden können.
Fazit
Die Analyse von Sprachaufnahmen mit maschinellem Lernen hat subtile akustische Marker – insbesondere das Verhältnis von Harmonischen zu Rauschen – entdeckt, mit denen sich bei Männern bösartige Stimmbandveränderungen identifizieren lassen. Auch wenn diese Ergebnisse als vorläufig zu sehen sind und spezifische Marker für Frauen in dieser Studie fehlen, eröffnet die Forschung aussichtsreiche Perspektiven für eine nicht-invasive und skalierbare Früherkennung von Kehlkopfkrebs. Mit umfangreicheren, präzise gelabelten Datensätzen, validiert in der klinischen Praxis und mit sorgfältiger Berücksichtigung von Gleichberechtigung und Datenschutz, könnten solche sprachbasierten Screening-Tools Diagnosen beschleunigen und die Lebensqualität von Betroffenen mit Kehlkopferkrankungen nachhaltig verbessern.
Quelle: frontiersin
Kommentare