Algorithmen für die medizinische Diagnostik
Ist das bei der Darmspiegelung entnommene Gewebe bösartig oder gutartig? Viele kennen das bange Warten auf die Ergebnisse der mikroskopischen Untersuchung. Die medizinische Begutachtung der meist stecknadelkopfgroßen Gewebeproben ist das Spezialgebiet von ausgebildeten Patholog_innen. Diese Fachärzte sind weltweit sehr gefragt und in manchen Ländern sogar Mangelware, weiß Prof. Dr. Christian Herta. Ihre anspruchsvolle Arbeit zu unterstützen, wäre also wünschenswert. Daran arbeitet der Datenwissenschaftler mit Kollegen und Nachwuchswissenschaftlern im Forschungsprojekt „deep.HEALTH“. Ziel ist es, künstliche Intelligenz zum Einsatz zu bringen und die medizinische Diagnostik sowie Forschung dadurch zu vereinfachen. Das Projekt ist im Centrum für Biomedizinische Bild- und Datenverarbeitung (cbmi) der HTW Berlin zuhause. Gefördert wird es vom Bundesministerium für Bildung und Forschung.
Das Arbeitsfeld Bilderkennung
Zwei Themenfelder haben sich die HTW-Wissenschaftler für ihre Arbeit ausgesucht: zum einen die Bilderkennung, zum anderen die Identifikation von Proteinsequenzen. Für die Bilderkennung gibt es eine Menge Anwendungspotenzial, denn die häufigsten Krankheiten, darunter Krebserkrankungen, produzieren die größten Bildmengen und somit die meiste Arbeit für Mediziner_innen. Nach echten Gewebeproben sucht man in den Räumen des cbmi im Technologie- und Gründerzentrum Spreeknie (TGS) in der Ostendstraße allerdings vergeblich. Gearbeitet wird ausschließlich mit digitalen Bildern aus der Berliner Charité. Deren Forschung verfügt anders als herkömmliche Arztpraxen über einen teuren Hochleistungsscanner, der Bilder in der achtzigfachen Auflösung von gewöhnlichen Fotos erzeugen kann, die für die präzise Erkennung von krankhaften Veränderungen nötig ist. Mit dementsprechend gewaltigen Datenmengen im Gigapixelbereich pro Datei müssen die Rechner bei der Weiterverarbeitung klarkommen.
Passende Daten sind eine Herausforderung
Bilddaten stehen Prof. Dr. Herta, einem Experten für Algorithmen und maschinelles Lernen, sowie seinem Kollegen Prof. Dr. Peter Hufnagl, dessen Fachgebiet die Bildverarbeitung in der Histopathologie ist, also zur Verfügung. Doch bei ihrer Verarbeitung mit Hilfe von künstlicher Intelligenz (KI), gibt es eine Reihe von Herausforderungen. Erstens braucht KI wirklich enorme Datenmengen, um lernen zu können. Da es viele verschiedene Gewebearten und Erkrankungen gibt, die keinesfalls in einen Topf geworfen werden dürfen, ist es besonders schwierig, passende Daten zu generieren. Zweitens müssen diese für den maschinellen Lernprozess gelabelt bzw. annotiert, das heißt mit Anmerkungen zum Bildinhalt versehen sein. Für die Krebsdiagnostik etwa bedeutet das, dass Mediziner_innen Tumorbereiche auf Gewebeschnitten markieren müssen, bevor die Bilder für das Training der Algorithmen genutzt werden können.
Erste Erkenntnisse liegen vor
Mit welchen Methoden es gelingt, die eigenen Datenbestände zu erweitern, hat das Team inzwischen untersucht und seine Erkenntnisse darüber, was funktioniert und was nicht sinnvoll ist, auch publiziert. Jetzt können Modelle in Gestalt von neuronalen Netzen gebaut und Parameter mithilfe der vorbereiteten Trainingsdaten justiert werden. „Man wird Algorithmen nicht für jede Spezialkrankheit trainieren können“, sagt Prof. Dr. Herta. Auch werden die auf KI basierenden Einschätzungen nie die ärztliche Expertise ersetzen können. Doch wenn die Systeme einmal ausgereift seien, lägen die Vorteile auf der Hand. Die Ergebnisse könnten den Histopatholog_innen quasi als Qualitätskontrolle zur Vermeidung von Fehlentscheidungen von Nutzen sein, wirft der Datenwissenschaftler einen Blick in die Zukunft. Womöglich liegen bei einer zunehmenden Digitalisierung pro Patient_in irgendwann auch so viele Daten vor, dass mittels KI eine Vorauswahl der Bilder getroffen werden kann, die sich Patholog_innen genauer anschauen, entwickelt er ein weiteres Zukunftsszenario.
Das Arbeitsfeld Identifizierung von DNA-Sequenzen
Beim zweiten Themenfeld, der Identifikation von DNA-Sequenzen, kommt der Bioinformatiker Prof. Dr. Piotr Wojciech Dabrowski ins Spiel. Neuronale Netze, die zur Verarbeitung von Abfolgen von Wörtern in natürlicher Sprache genutzt werden können, lassen sich auch auf Abfolgen von biologischen Molekülen wie diejenigen in DNA- oder Aminosäure-Sequenzen - also Erbinformation oder Proteine - anwenden Auch hier vermag ein Szenario die Herausforderung zu veranschaulichen: Maschinen könnten anhand von aus einer Patientenprobe ermittelten Genombruchstücken den Organismus, dem das Genom gehört, identifizieren. Handelt es sich um eine menschliche Sequenz, oder stammt sie von einem – vielleicht sogar bis dato unbekannten – Virus oder Bakterium, deutet somit auf die Ursache der Krankheit hin und erlaubt dadurch die Wahl der richtigen Behandlung?
KI wird in der Medizin irgendwann Alltag sein
Ob Klassifikation von DNA-Bruchstücken oder Bilderkennung: Das Projektteam arbeitet an einem der aktuell spannendsten Zukunftsthemen. Auch wenn schon einige KI-Systeme für die Medizin an Unikliniken erprobt werden, kommerziell umgesetzt sind viele davon noch nicht. „Doch früher oder später“, ist sich Prof. Dr. Herta sicher, wird die Künstliche Intelligenz auch in der Medizin zur Normalität gehören – um ihre Nutzer zu unterstützen und um hier und da vielleicht sogar Dinge zu finden, die selbst das geschulte Auge eines Arztes übersehen hat. Vielleicht hilft dabei das Know-how, das an der HTW Berlin aufgebaut wird, oder einer der Nachwuchswissenschaftler, die derzeit im Projekt „deep.HEALTH“ tätig sind. Gleich vier Promotionen sind in Arbeit. Die Qualifizierung des Ingenieurnachwuchses ist nämlich ebenfalls ein wichtiges Projektziel. Aus dem gleichnamigen Fördertopf des BMBF stammt die komplette Finanzierung.