DFKI übersetzt für die EU Zwei Studentinnen trainieren EU-Software
Saarbrücken · Das DFKI in Saarbrücken hat einen Online-Übersetzer entwickelt. Damyana Gateva und Anastasija Amann hatten entscheidenden Anteil.
Sie haben ihr Studium noch nicht beendet, arbeiten aber schon an einem großen Projekt mit, das in Zusammenhang mit der EU-Ratspräsidentschaft Deutschlands steht. Die Master-Studentinnen Anastasija Amann, 24, und Damyana Gateva, 34, sind Teil eines Teams von IT-Spezialisten am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken, welches das im Juli veröffentlichte Übersetzungssystem EU Council Presidency Translator entwickelt hat. Mit dem Programm können Texte in die 24 Amtssprachen der Europäischen Union übersetzt werden (wir haben berichtet).
Unter der Leitung von Cristina España i Bonet und Professor Josef van Genabith arbeiten seit April ein halbes Duzend Informatiker des DFKI und der Saar-Uni an dem neuen Übersetzungssystem, dessen Basis ein Programm der Künstlichen Intelligenz (KI) bildet. Die Computerlinguistinnen Amann und Gateva, die beide Language Science and Technologie im Master studieren, hatten die Aufgabe, die KI zu trainieren. „Einem System für maschinelle Übersetzung muss man zum Trainieren Texte zeigen. Und wenn es neue Themen behandeln soll, braucht man auch neue Texte“, erklärt Gateva.
„Meine Aufgabe war dabei, Artikel in mehreren Sprachen zum Thema Corona und zu anderen aktuellen Nachrichten im Internet zu suchen – beispielsweise bei der Deutschen Welle oder auf anderen Seiten, die mehrsprachig publizieren.“ Amann hat fertige Textsammlungen aus dem Internet heruntergeladen, denn es gelte genau aufpassen, mit welchen Informationen maschinelle Übersetzungssystemen trainiert werden.
Zur Arbeit am EU Council Presidency Translator kamen die Studentinnen über Cristina España i Bonet, erzählen sie. „Ich hatte ein Seminar bei ihr“, berichtet Gateva. Sie sei dabei der Empfehlung einer Freundin gefolgt und habe die Dozentin schließlich auch gebeten, ihre Masterarbeit zu betreuen. So kam sie schließlich als wissenschaftliche Hilfskraft ans DFKI. Dabei war die Computerlinguistik nicht die erste Wahl der Studentin. Gateva hat zunächst in Freiburg einen Magister in Skandinavistik, Germanistik und Englisch gemacht. „Dann bin ich nach Saarbrücken gezogen, weil ich mich gefragt habe: ‚Was mache ich danach?’ Und Linguistik hat mir richtig gut gefallen. Ich wollte mich nicht nur theoretisch damit beschäftigen.“
An der Universität des Saarlands hätte sie mit ihrem Abschluss direkt in den Master starten können. Da sie aber nie zuvor mit Programmierung zu tun gehabt habe, hat sie zunächst den Bachelor in Computerlinguistik gemacht. An der Saar-Universität sind derzeit 158 Studenten in den Fächern Computerlinguistik und Language, Science and Technology eingeschrieben.Sie sei am Anfang unsicher gewesen, ob sie sich das Studium zutraue, sagt die gebürtige Bulgarin. Mittlerweile sei sie aber sehr glücklich mit ihrer Entscheidung.
Ihre Kommilitonin Anastasija Amann hat ihren Bachelor ebenfalls in Saarbrücken gemacht. Ein Juniorstudium habe sie auf die Idee gebracht. „Ich habe als Schülerin Anglistik-Vorlesungen besucht und dabei gemerkt, dass mir die am besten gefallen.“ Die Saarländerin hat sich zunächst über Studiengänge informiert, die mit Sprachwissenschaft zu tun haben. „Dabei ist mir Computerlinguistik aufgefallen.“ Mit ihrer Entscheidung war die 24-Jährige aus Kleinblittersdorf so glücklich, dass sie nach dem Bachelor den Master angehängt an. Auch sie hat die Projektleiterin in einer Vorlesung kennengelernt: „Ich war im Ausland und musste mich um mein Masterthema kümmern. Weil mir die Multilingualität so gut gefällt, habe ich mich an die Vorlesung in maschineller Übersetzung erinnert und Cristina España i Bonet angeschrieben.“ So habe sich dann auch für sie der Hiwi-Job am DFKI ergeben.
Nicht nur die Arbeit am DFKI sei sehr praxisnah, ihr Studium stehe dem in Nichts nach. „Wir lernen sehr früh, zu programmieren“, berichtet Anastasija. Das sei aber nicht alles. „Aus vielen verschiedenen Disziplinen ist etwas dabei“, erklärt sie. „Die Computerlinguistik besteht aus mehreren Bereichen: Linguistik, Mathematik, Künstliche Intelligenz und Informatik.“ Auch Psycholinguistik gehöre dazu. Bereits in den ersten beiden Semestern im Bachelor habe sie gelernt mit der Programmiersprache Python zu arbeiten und auf dieser Basis dann auch die ersten eigenen Anwendungen entwickelt.
In Saarbrücken lernen die Computerlinguisten eine Programmiersprache pro Semester. Für Neulinge sei das besser als von allem ein wenig zu lernen, ist Gateva überzeugt. Auch für Quereinsteiger im Master sei ihr Studiengang geeignet, weil es gemeinsame Kurse mit den Bachelorstudenten gebe.
Maschinelles Übersetzen gehöre ebenfalls zum Studium. Amann, die für ein Semester auf der Mittelmeerinsel Malta studiert hat, sagt: „Andere Studiengänge sind ein wenig theoretisch. Bei uns gibt es sehr viel Praxis.“ Auch Gateva teilt die Erfahrung. Wie breit gefächert die Lerninhalte seien und wie hoch der theoretische Anteil dabei sei, sei von Uni zu Uni verschieden.
Für ihr Studium können die beiden durch die Projektarbeit am Forschungszentrum einiges mitnehmen. „Am DFKI gibt es viele Programmieraufgaben“, erklärt Amann. „Die meisten aus unserem Studiengang finden hier einen Hiwi-Job, aber auch an anderer Stelle an der Uni und bei Firmen in Saarbrücken. Das ist ein guter Standort für Computerlinguisten.“ Gateva ergänzt: „Das war auch ein Grund, warum ich hierherkam.“ Bei ihrem jüngsten Projekt habe sie den Umgang mit Programmen erlernt, die Webseiten analysieren. Sie werden auch Webcrawler genannt. „Wenn die Tools nicht genau das tun, was ich möchte, muss ich sie anpassen.“
Hakt es dann trotzdem bei einem Arbeitsschritt, stehen die Studentinnen nicht allein da. Die Projektleiterin stehe ihnen immer hilfreich zur Seite. Aber auch bei den wöchentlichen Gruppentreffen gebe es Unterstützung, berichtet Gateva. Die Konferenzen werden während der Corona-Pandemie per Videochat organisiert. Dort berichten alle Mitarbeiter über ihre aktuellen Projekte und helfen sich bei Problemen.
Pläne für die Zeit nach dem Studium gibt es auch schon. „Ich will in die Industrie gehen“, sagt Amann. „Ich könnte mir zwar auch vorstellen in der Forschung zu arbeiten, aber zuerst will ich in die Industrie, damit ich Berufserfahrung sammeln kann.“
https://www.presidencymt.eu