| 20:31 Uhr

Wissen
Vokabeln auf der Waage der Wissenschaft

„Schon gefrühstückt?“ – Ein menschlicher Hörer versteht diese Frage sofort. Ein Computerprogramm hätte damit unter Umständen Schwierigkeiten. An der Saar-Uni untersuchen Wissenschaftler um Professorin Elke Teich in einem  Sonderforschungsbereich die Informationsdichte von Texten.
„Schon gefrühstückt?“ – Ein menschlicher Hörer versteht diese Frage sofort. Ein Computerprogramm hätte damit unter Umständen Schwierigkeiten. An der Saar-Uni untersuchen Wissenschaftler um Professorin Elke Teich in einem Sonderforschungsbereich die Informationsdichte von Texten. FOTO: Iris Maria Maurer
Saarbrücken. An der Saar-Universität untersuchen 30 Wissenschaftler in einem Sonderforschungsbereich die Informationsdichte von Texten. Von Peter Bylda
Peter Bylda

Wer kennt es nicht, dieses Gefühl totaler Hilflosigkeit, das sich bei der Lektüre einer Bedienungsanleitung einstellen kann – wenn diese zum Beispiel ein elektronisches Gerät beschreibt, das partout nicht so will, wie es soll. Da soll etwas installiert, partitioniert oder sonstwie konfiguriert werden. Doch auch nach wiederholter Konsultation der Anleitung und dem zehnten in die Tastatur gehämmerten Versuch erscheint auf dem Monitor der lapidare Hinweis „Falsche oder unvollständige Eingabe“. Damit ist klar: Der Verfasser dieser Betriebsanleitung und der Benutzer dieses Gerätes verstehen sich nicht.


Wer einen komplizierten Sachverhalt vielen Menschen erklären will, steht vor einem Problem. Er muss es allen recht machen, dem Anfänger wie dem Könner. Doch das ist ein Ding der Unmöglichkeit. Amateure wollen eine detaillierte Erklärung, Profis die aufs Wesentliche reduzierte Kurzversion. Bedienungsanleitungen versuchen den Kompromiss – und scheitern. Ideal wäre eine Anleitung, die sich am Vorwissen des jeweiligen Lesers orientiert. Im digitalen Zeitalter wäre diese Personalisierung im Prinzip kein Problem, doch bedarf es dafür eines Maßstabs, einer Skala der Verständlichkeit, der maximal zumutbaren Informationsdichte.

Welche Menge an Informationen kann ein Mensch zum Zeitpunkt X zum Thema Y in der Situation Z aufnehmen und verstehen? Mit dieser Frage befassen sich Linguisten der Saar-Universität. Sie untersuchen die Informationsdichte von Texten und Äußerungen in einem eigens dafür eingerichteten Sonderforschungsbereich (SFB). „Informationsdichte und sprachliche Kodierung“ lautet der Titel des SFB, den Professor Elke Teich leitet. Trotz vieler linguistischer Forschungsprojekte in der Sprachdatenverarbeitung und zu Verfahren der Künstlichen Intelligenz gebe es hier noch viel zu erforschen, erklärt die Anglistin. So sieht das auch die Deutsche Forschungsgemeinschaft. Sie hat den 2014 eingerichteten Saarbrücker SFB gerade um vier Jahre verlängert (wir haben berichtet). Die Saar-Universität erhält dafür rund elf Millionen Euro.



Im Saarbrücker SFB wollen 30 Wissenschaftler unter anderem untersuchen, wie Kinder lernen und wie sie mit Begriffen umgehen, die sie nie zuvor gehört haben. Das könnte zu neuen Verfahren führen, mit denen der Stand der sprachlichen Entwicklung beurteilt werden kann. Auch das Thema Mehrsprachigkeit spielt eine Rolle und die Frage, wie sich Menschen in Gesprächen an ihre Partner anpassen. „Das bekommen Menschen völlig unbewusst hin“, erklärt Elke Teich. „Wir versuchen dabei im Gespräch unwillkürlich, die Informationsdichte konstant auf einem Pegel zu halten, um unsere Partner weder zu langweilen noch zu überfordern.“

Wie schaffen Menschen das? Sie nutzen Kontextwissen, wie die Forscher sagen, achten also nicht nur darauf, was sie sagen, sondern auch darauf, wen sie unter welchen Umständen ansprechen. So kann die hingeschlenzte Bitte „Gib mir das bitte herüber“ denselben Informationsgehalt haben wie der Satz „Könntest Du mir bitte das Notizheft aus der rechten, oberen Schublade des Schreibtisches geben?“ Ein menschlicher Gesprächspartner kann die Frage „Schon gefrühstückt?“ problemlos verstehen, obwohl da die Zeitangabe fehlt. Ein Computerprogramm wird dagegen erst die Langfassung „Haben Sie heute schon gefrühstückt?“ korrekt interpretieren.

Ein anderes Projekt im SFB konzentriert sich auf die Wissenschaftssprache vergangener Jahrhunderte. Die Forscher werten dazu eine Sammlung von Texten der Royal Society of London der Jahre 1650 bis 1900 aus, berichtet Elke Teich. In dieser Zeit habe es gewaltige Veränderungen gegeben, erklärt die Anglistin. Bis zur Mitte des 18. Jahrhunderts seien wissenschaftliche Texte wie gesprochen notiert worden. Erst später habe sich eine Schriftsprache entwickelt, die es ermöglichte, Informationen sprachlich kompakter zu formulieren. Ihre Informationsdichte ist gewachsen.

Ein Sonderforschungsbereich betreibt Grundlagenforschung. Doch bei wissenschaftlichen Projekten, an denen die Informatik beteiligt ist, ist es von den Grundlagen bis zur Anwendung meist nicht weit. Die Forschung zur Informationsdichte könnte helfen, die maschinelle Sprachdatenverarbeitung zu verbessern. Wovon wiederum Programme zur Sprachsteuerung, zur Übersetzung und zur Steuerung von Suchmaschinen profitieren könnten. Auswirkungen auf den Computeralltag könnte schließlich ein Projekt haben, in dem die Wissenschaftler in Experimenten über Hirnstrommessungen bei Versuchspersonen die Informationsdichte von Youtube-Videos ermitteln wollen. Die Kurzfilme gibt es bekanntlich zu fast allen Themen, vom Abwasch bis zur korrekten Benutzung von Zahnseide.

Am SFB nimmt eine Arbeitsgruppe Anleitungen zum Computerspiel Minecraft unter die Lupe. In diesem Aufbauspiel geht es ums Überleben in einer digitalen Klötzchenwelt, in der sich jeder Spieler zunächst einmal eine virtuelle Existenz aufbauen muss. Es gibt tausende Youtube-Videos für jeden Schwierigkeitsgrad. Anfänger lernen, wie sie die ersten Schritte im digitalen Dschungelcamp überleben, Profis erfahren, wie sie in aussichtsloser Lage digitalen Monstern entrinnen können. Über die Analyse derartiger Videos wollen die SFB-Wissenschaftler Verfahren entwickeln, die es Computersystemen ermöglichen, vollautomatisch Bedienungsanleitungen zu beliebigen Themen zu erzeugen. Und die könnten dann auch – und damit wären wir zurück beim Eingangsbeispiel – das Vorwissen der Nutzer zum gewählten Thema berücksichtigen. Wenn’s klappt, dürfte die Fehlermeldung „Falsche oder unvollständige Eingabe“ künftig seltener zu sehen sein.