Data Science zum Nutzen der Zivilgesellschaft

Ganz egal, nach welchem Forschungsprojekt man Prof. Dr. Helena Mihaljević befragt: Das Gespräch zieht darüber einen schnell in den Bann. Ihre Themen sind gesellschaftlich hochrelevant, die Darstellung verständlich und man gewinnt den beglückenden Eindruck, eine Wissenschaftlerin vor sich zu haben, der das Wohlergehen von Menschen am Herzen liegt. Weil sie für ihre Projekte Drittmittel in bemerkenswerter Höhe einwirbt, regelmäßig in internationalen Fachjournalen veröffentlicht, Vorträge auf hochrangigen Konferenzen hält und sich trotz enormem Arbeitspensum für den wissenschaftlichen Nachwuchs engagiert, wurde Prof. Dr. Mihaljević mit dem Forschungspreis 2024 der HTW Berlin ausgezeichnet.

Eine nicht wirklich absehbare Karriere

Mathematikstudium in Göttingen, Promotion in Liverpool, Tätigkeiten an der Uni Kiel, beim FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur sowie als Senior Data Scientist in der Wirtschaft, 2018 schließlich die Berufung als Professorin für Data Science an die HTW Berlin: Diese Karriere war nicht wirklich absehbar, als die elfjährige Helena Mihaljević mit Ihren Eltern vor dem Bosnienkrieg nach Deutschland floh und in der Förderklasse der Hauptschule völlig fremde Vokabeln paukte. „Im ersten Deutsch-Diktat hatte ich noch die Note 5“, erinnert sie sich lächelnd. Doch tatsächlich sei ihr das Lernen leichtgefallen, das Abitur steckte sie mit 18 in die Tasche.

Großes gesellschaftspolitisches Interesse

„Für das Studium der Mathematik habe ich mich auch aufgrund ihrer Klarheit und Eindeutigkeit entschieden“, sagt sie. Doch ihr gesellschaftspolitisches Interesse sei immer schon groß gewesen. Jetzt, wo die Welt abdrifte und sich in manchen Ländern faschistoide Tendenzen zeigten, hält es Prof. Dr. Mihaljević für wichtiger denn je, die Zivilgesellschaft zu stärken. Die sei in der Regel unterfinanziert und technisch schlecht ausgestattet. Die passenden Themen fand die Wissenschaftlerin ohne Mühe. „In der Mathematikforschung war ich zwangsläufig sehr spezialisiert“, sagt sie. Doch die Angewandte Forschung biete viele Möglichkeiten, Know-how gesellschaftlich fruchtbar zu machen.

Verschwörungstheorien mit KI identifizieren

Prof. Dr. Mihaljević entwickelt beispielsweise Datensätze und trainiert Modelle, um die wachsende Anzahl von Verschwörungstheorien im Internet zu identifizieren. „Solche Erzählungen finden sich nicht nur in abgeschotteten Telegram-Kanälen, sondern auch in moderaten Online-Bereichen, beispielsweise in Kommentarspalten von Zeitungen oder im Videoportal Youtube“, sagt sie. Die Massen an Verschwörungsmythen mit Hilfe von Maschinellem Lernen zu erkennen und computerlinguistisch zu analysieren, sei ein wichtiger Beitrag zur Entwicklung und Umsetzung zivilgesellschaftlicher Gegenstrategien. Ihr eigenes Projekt sei dabei recht klein gewesen, und v.a. die Erstellung geeigneter Datensätze und Annotationswerkzeuge kam dabei zu kurz. Was mit deutlich mehr Ressourcen auf die Beine gestellt werden kann, hat die HTW-Wissenschaftlerin in dem internationalen und interdisziplinären Forschungsprojekt „Decoding Antisemitism“ an der TU Berlin erlebt, in das sie ebenfalls involviert war. Dabei entstand u.a. ein 500 Seiten starkes Lexikon mit antisemitischen Stereotypen, dessen Content große Sprachmodelle in die Lage versetzen kann, antisemitische Kommentare und die ihnen zugrundeliegende Stereotype und Tropen effizienter zu erkennen. „Die Einbindung einer umfassenden Wissensbasis könnte die algorithmischen Verfahren für diverse Hass-Phänomene erheblich optimieren“, sagt Prof. Dr. Mihaljević.

Sensible Mobilitätsdaten anonymisieren

Auch mit Mobilitätsdaten hat sie sich ausführlich beschäftigt. Wie sensibel diese sind, hat die Forschung längst gezeigt. „Es genügen vier räumlich-zeitliche Punkte, um bis zu 95 Prozent der Personen in relevanten Mobilitätsdatensätzen eindeutig zu identifizieren“, macht Prof. Dr. Mihaljević die Relevanz des Themas deutlich. Mobilitätsdaten erlaubten Rückschlüsse unter anderem auf den Wohnort, den Gesundheitsstatus oder politische und religiöse Praktiken. Deshalb bedürfe es guter Anonymisierungstechniken. Dabei stellt sich jedoch die Frage, wie nützlich (und sicher) die „anonymisierten“ Daten für anschließende Datenanalysen und Modelle sind. Im Rahmen des BMBF-Projekts freeMove hat sich das HTW-Team einschlägige Verfahren angeschaut und festgestellt, dass wahlweise die Anonymisierung nicht hinreichend ist oder die Daten an Nützlichkeit verlieren. Die wissenschaftliche Mitarbeiterin Alexandra Kapp zeigte beispielsweise im Rahmen ihrer Doktorarbeit, dass die derzeit gehypte Methode namens Synthetisierung nicht der heilige Gral sei, wenn man Nützlichkeit aus einer Praxis-Perspektive definiert.

Straßenbeläge für die Verkehrsplanung kategorisieren

Nicht minder spannend ist das dritte Beispiel für die Forschung von Prof. Dr. Mihaljević. Im Projekt „SurfaceAI“ geht es um die Qualität von Straßenbelägen. Das klingt womöglich trivial, ist aber in vielerlei Hinsicht relevant: für Radfahrer*innen, Menschen im Rollstuhl oder für Kommunen, die eine solide Datengrundlage für ihre Verkehrsplanung benötigen. Weil umfassende Datenquellen bis heute fehlen, entwickelte das Team von Prof. Dr. Mihaljević Modelle auf der Basis von offenen Bilddatensätzen wie Mapillary, welche die Beschaffenheit von Straßenbelägen kategorisieren. Das Projekt ist bald abgeschlossen, dann können Interessierte die Software herunterladen und nutzen. „Das kann für die Berliner Senatsverwaltung, die den Radwegeausbau priorisieren möchte, genauso nützlich sein wie für Navigations-Apps, die Routenempfehlungen geben“, fasst sie zusammen.

Fördermitteln von verschiedenen Institutionen

Ausdrücklich gewürdigt hat das Komitee des HTW-Forschungspreises, dass es Prof. Dr. Mihaljević gelingt, Fördermittel von unterschiedlichen Institutionen einzuwerben. Das Spektrum reicht vom Bundesministerium für Bildung und Forschung über das Bundesministerium für Digitales und Verkehr bis zur Berliner Senatskanzlei Wissenschaft und Forschung.  „Es waren und sind tatsächlich viele verschiedene Projekte“, bestätigt die Wissenschaftlerin. Für sie selbst ist das notwendigerweise mit viel Antragsarbeit verbunden. „Glücklicherweise unterstützt das Kooperationszentrum Wissenschaft-Praxis der Hochschule bei dem Prozess“, freut sie sich.

Die Betreuung des Teams ist ihr wichtig

Die meisten Fördermittel fließen in Projektstellen von wissenschaftlichen Mitarbeiter*innen. „Deren Betreuung ist mir sehr wichtig, aber sie kostet auch viel Zeit“, sagt sie ganz offen. Denn um den Nachwuchs und die Projekte fachlich kompetent begleiten zu können, muss sie auch auf der operativen Ebene einsteigen, also bei Bedarf selbst Daten erfassen und mitprogrammieren. Andererseits: „Die Arbeit im Team macht viel größeren Spaß, und meine Mitarbeiter*innen sind allesamt sehr kompetent und engagiert“, betont sie. Da nimmt es nicht Wunder, dass sie das Preisgeld in Höhe von 6.000 Euro nicht zuletzt dafür nutzen will, dem einen oder anderen im Team die gemeinsame Teilnahme an Konferenzen zu ermöglichen.