KI-Modelle schneller zur Anwendung bringen
Die Freude über den Erfolg ist ihm noch anzumerken: Prof. Dr. Erik Rodner, Experte für Maschinelles Lernen und Data Science im Studiengang Ingenieurinformatik (FB 2) sowie Projektleiter der KI-Werkstatt an der HTW Berlin, hat im Dezember 2023 gemeinsam mit neun Wissenschaftler*innen der Berliner Hochschule für Technik (BHT) den Zuschlag für ein großes Forschungsprojekt erhalten. Das interdisziplinäre Team will die KI-Forschung zu sogenannten „Foundation Models“ vorantreiben. Dabei wird es von der Deutschen Forschungsgemeinschaft (DFG) fünf Jahre lang mit rund einer Million Euro pro Jahr gefördert. Wie es dazu kam und worum es genau geht, darüber spricht Prof. Dr. Rodner im Interview.
Wie kam es zu dieser Zusammenarbeit?
Prof. Dr. Erik Rodner: Die Kolleg*innen der BHT forschen schon lange gemeinsam an KI- und Robotikthemen. Als sie über einen Antrag für das Programm „Forschungsimpulse“ nachdachten, kamen sie auf mich zu, weil meine Expertise im Bereich Bildverarbeitung perfekt zu ihren Fachgebieten passte. Als „Berliner Initiative für Forschung im Bereich Foundation Models“ haben wir uns dann um die Fördermittel beworben. Über die Zusage haben wir uns sehr gefreut, schließlich zeigt dies auch noch einmal, dass wir uns als HAW durchaus intensiv und eigenständig an der Grundlagenforschung sowie Ausbildung von Wissenschaftlern beteiligen können. Richtig losgehen soll es im April 2024, die ersten Stellen werden gerade ausgeschrieben.
Worum geht es bei dem Forschungsprojekt?
Wir wollen herausfinden, wie sich KI-Systeme effizienter trainieren lassen. Effizienz bedeutet dabei: mit weniger Daten. Denn die Bereitstellung von Daten, mit deren Hilfe die KI lernt, also ihren Nutzen entfaltet, kann sehr aufwändig sein. Bei Sprachmodellen ist es vergleichsweise einfach, weil Texte und Informationen via Internet in großem Umfang zur Verfügung stehen. Nicht von ungefähr gibt es mit ChatGPT bereits ein sehr vielseitiges und leistungsstarkes KI-Modell.
In anderen Bereichen, beispielsweise bei der Bilderkennung, ist die Datenbereitstellung deutlich aufwändiger. Lassen Sie mich das an einem Beispiel der Augenheilkunde erklären, für das ich wissenschaftlich und praktisch tätig war. Wenn die KI dabei helfen soll, frühzeitig Erkrankungen des menschlichen Auges zu erkennen, beispielsweise die altersbedingte Makuladegeneration (AMD), dann muss sie zuvor sehr, sehr viele Aufnahmen von Augen gesehen haben, auf denen Anzeichen für eben diese AMD erkennbar sind. Und diese Aufnahmen müssen von kompetenten Augenärzt*innen, die über Wissen und große Erfahrung verfügen, sorgfältig analysiert und beschriftet worden sein. Das Erstellen dieser Annotationen, wie sie in der Fachsprache genannt werden, ist sehr aufwändig. Je weniger Annotationen ein KI-Modell benötigt, um qualitativ gleichwertige Einschätzungen abzugeben, desto besser. Das würde allen Beteiligten Arbeit, also Geld und Zeit sparen.
Wie lassen sich KI-Modelle trainieren?
Das geht heutzutage am besten mit Hilfe von sogenannten Foundation Models. Dieser Begriff ist schwer ins Deutsche zu übersetzen. Man könnte vielleicht von Basismodellen sprechen oder von Modellen, in denen bereits ein gewisses Fundament vorhanden ist. Foundation Models sind vortrainierte KI-Modelle, die bereits über ein Grundverständnis von Sprache und Bilddaten verfügen. Um solche Modelle selbst zu erstellen, würde man enorme Ressourcen brauchen, insbesondere gewaltige Rechnerkapazitäten. Die haben nur wenige Unternehmen oder sehr große Forschungsverbünde. Nebenbei bemerkt: Als ich 2011 promoviert wurde, gab es diese Modelle noch gar nicht. Damals war man schon froh, wenn es der Software gelang, eine Katze von einem Hund zu unterscheiden! Heute stehen viele Foundation Models frei zur Verfügung. Ziel unseres Forschungsprojektes in den nächsten fünf Jahren ist es, die Anpassung dieser Modelle für neue Aufgabenstellungen in vielerlei Hinsicht zu verbessern.
Welche Anwendungen haben Sie im Blick?
Im Fokus stehen die Bereiche Robotik, Quantitative Biologie und Prädiktive Medizin. Mein Spezialgebiet, also die Bildverarbeitung, ist dabei sowohl für die Robotik als auch für die medizinische Diagnostik von Bedeutung. Der Roboter muss erkennen können, was zu tun ist, Ärzt*innen und Forscher*innen wiederum benötigen Unterstützung bei der Auswertung von mikroskopisch angefertigten Bildern. Um interdisziplinär arbeiten zu können, haben wir jedes Arbeitspaket des Projekts mit mindestens zwei Wissenschaftler*innen besetzt. Ich selbst bin in verschiedene Arbeitspakete eingebunden. Dabei werden mich ein*e Promovend*in und studentische Hilfskräfte unterstützen. Die muss ich jetzt finden.
Gibt es beim Einsatz von KI-Modellen auch Risiken?
Selbstverständlich gehen mit der Nutzung von Foundation Models auch Risiken einher. Diese Modelle umfassen Milliarden von Zahlen und sind so komplex, dass keiner zu 100% verstehen kann, auf welcher Grundlage sie zu ihren Ergebnissen kommen. Aber das ist bei meinem Laptop ja auch so. Ich kann ihn nutzen, muss aber seine Funktionsweise nicht im Detail verstehen. Natürlich ist bei der medizinischen Diagnostik eine ganz andere Verantwortung im Spiel. Doch als Patient vertrauen Sie den ärztlichen Einschätzungen ja auch, obwohl sie nicht im Detail nachvollziehen können, wie sie zu ihren Urteilen gekommen sind. Deshalb ist es besonders wichtig, die Modelle sehr sorgfältig zu testen und zu analysieren.