| 14:46 Uhr

Zwei Millionen Euro Förderung
Computer sollen sehen lernen

Informatik-Professor Christian Theobalt arbeitet am Saarbrücker Max-Planck-Institut an Zukunftsthemen wie Virtuelle Realität und Künstliche Intelligenz.
Informatik-Professor Christian Theobalt arbeitet am Saarbrücker Max-Planck-Institut an Zukunftsthemen wie Virtuelle Realität und Künstliche Intelligenz. FOTO: Oliver Dietze / Uni
Saarbrücken. „Intelligente“ Maschinen brauchen leistungsfähige Sensoren. Forscher der Saar-Uni wollen sie alltagstauglich machen. Von Peter Bylda
Peter Bylda

Künstliche Intelligenz (KI) wird in den kommenden Jahren eines der Top-Themen der IT-Welt. Computer, die nach dem Vorbild des menschlichen Gehirns funktionieren, sollen ihre Umwelt erkennen und mit ihr interagieren können. Da genügt es allerdings nicht, dass nur die Software „intelligent“ ist. Damit ein Computerprogramm weiß, was in der Umwelt des Rechners geschieht, auf dem es läuft, braucht es völlig neue Sensoren. Deren wichtigster ist die Kamera. Sie soll aus der Szene, die das Objektiv gerade im Blick hat, mathematische Modelle aller sichtbaren Gegenstände und Personen erzeugen. Erst diese Übersetzung in die Sprache der Mathematik ermöglicht es der Logik eines Computerhirns, seine Umwelt zu verstehen. Mit anderen Worten: Die KI soll sehen lernen.



Diese Aufgabe packt nun Professor Christian Theobalt vom Max-Planck-Institut für Informatik in Saarbrücken mit finanzieller Unterstützung der Europäischen Union an. Theobalt hat für dieses Projekt vom EU-Forschungsrat den mit zwei Millionen Euro dotierten Wissenschaftspreis EU Consolidator Grant erhalten. Der Professor der Saar-Universität entwickelt Softwareverfahren, die es einem Computer mit Hilfe einer einzigen, handelsüblichen Kamera ermöglichen sollen, beliebige Alltagsszenen dreidimensional zu erfassen.Dabei soll es keine Rolle spielen, wie viele Menschen oder Objekte sich gerade durchs Bild bewegen oder sich gegenseitig vorübergehend verdecken.

Solche Verfahren der Bildanalyse gelten als extrem schwierig. Weil sie mit heute verfügbarer Technik nur mit immensem Hardwareaufwand im Labor zu realisieren sind und nur mit einer begrenzten Zahl von Personen im Bild zurechtkommen, sind zum Beispiel für Videoanimationen in der Filmindustrie komplizierte Studioaufbauten nötig, in denen zahlreiche Kameras optische Daten aus vielen Blickwinkeln liefern. Die werden anschließend in wochenlanger Arbeit am Computer Bild für Bild zu einer Animation zusammengefügt. Die Saarbrücker Technik soll dagegen überall, unter allen Lichtbedingungen und in Echtzeit funktionieren.

Für den Saarbrücker Informatiker ist es bereits der zweite EU-Forschungspreis. Im Jahr 2013 erhielt Christian Theobalt einen damals mit 1,5 Millionen Euro dotierten ERC Starting Grant. Auch damals ging es um Bildanalyse, allerdings aus einem anderen Blickwinkel. Ziel des Forschungsprojekts vor vier Jahren war unter anderem die Entwicklung mathematischer Verfahren, die real wirkende Computeranimationen mit natürlichen Lichtverhältnissen erzeugen können. Das neue Projekt zum Maschinellen Sehen geht nun weit übers Computerkino hinaus. Auch wenn es sich dabei um reine Grundlagenforschung handelt, sieht Christian Theobalt Möglichkeiten für Computersteuerungen autonomer Fahrzeuge, bei Systemen der Virtuellen Realität, der sogenannten Telepräsenz, bei Robotersteuerungen, in der Sportwissenschaft und der Medizin – grundsätzlich bei allen Anwendungen, bei denen ein Computer verstehen muss, was in der Welt um ihn herum gerade vorgeht.

Das gelte auch deshalb als wissenschaftliche Herausforderung, erklärt der Saarbrücker Informatiker, weil dabei die üblichen Trainingsmethoden Neuronaler Netzwerke nicht angewendet werden können, mit denen die Künstliche Intelligenz arbeitet. Diese Netzwerke ahmen die Arbeitsweise des menschlichen Gehirns nach. Dabei lernen Computersysteme ähnlich wie ein Kind. Viele hunderttausend Mal werden ihnen zunächst in einer Trainingsphase Gegenstände, die seine Kameras später richtig einordnen sollen, unter unterschiedlichen Blickwinkeln und bei wechselnden Beleuchtungsverhältnissen präsentiert. Wenn die Trefferquote dabei hoch genug wird, gilt das Training als abgeschlossen. Doch was unter Laborbedingungen in eng begrenzten Einsatzgebieten funktioniert, taugt fürs Projekt KI-Auge nicht. Wer kann schließlich schon vorhersagen, wohin die Optik im wirklichen Leben als Nächstes blicken wird und was sie dort zu sehen bekommt? Das Computersystem des digitalen Auges müsse deshalb selbstlernend sein und ein grundlegendes optisches Verständnis dafür entwickeln können, was seine Sensoren gerade an Videodaten aufnehmen, erklärt Christian Theobalt. Die Informatiker des Saarbrücker Max-Planck-Instituts haben nun fünf Jahre Zeit, um dieses Ziel zu erreichen.