21.03. 2013

Bedeutet die Einführung des Semantischen Webs eine Verbesserung der maschinellen Übersetzung?

“Das Internet von heute dreht sich um Dokumente, das Semantische Web um Wörter und wie diese miteinander verbunden sind.”

Aber was genau bedeutet das?

Bisher erkennen Computer nur wie man was sagt (Syntax), aber nicht die Bedeutung der Wörter (Semantik). Wenn man eine Suchmaschine verwendet, werden tausende von Dokumenten gescannt, die die Wörter oder Sätze beinhalten, nach denen gesucht wird. Dieser Prozess der Wortübereinstimmung ist eine Suche auf niedrigem Niveau. Wenn man die Suche allerdings im Semantischen Web durchführen würde, könnte man zusammengehörende Begriffe und deren Beziehung zu einander ausfindig machen.

Beispielsweise kann man anstatt des Wetters am Wochenende (es wird kalt bleiben … Brrr …) nach etwas anderem suchen: “In welchem Zusammenhang steht das Wetter mit der Geburtenrate?”. Das Konzept des Semantischen Webs könnte nicht nur die Beziehung zwischen dem Wetter und Geburtenraten herstellen. Es kann noch viel mehr… Es könnte auf alles angewendet werden, was man sich nur vorstellen kann: Menschen, Orte, Musik, Filme, Veranstaltungen, Organisationen, einfach alles. 
Wenn man den semantischen Kontext in Webseiten einbezieht, könnten Suchmaschinen genauer werden,  da sie sich nicht nur auf Schlüsselwörter in Webseiten beziehen sondern auch auf ihre semantische Bedeutung.

Aber könnte das Semantische Web wirklich vorteilhaft für die Qualität von maschinellen Übersetzungen sein?

Maschinelle Übersetzungen, wie z.B. Google Translate, sind genauer, wenn sie auf einen bestimmten Bereich ausgerichtet sind. Wenn man einen Computer nur auf rechtliche oder finanzielle Begriffe ‘trainiert’, ist die Qualität der Ergebnisse im Gegensatz zu allgemeinen maschinellen Übersetzungsmaschinen meistens besser.

Computer mit semantischem Web könnten den Kontext der Metadaten innerhalb der Webseite erkennen und mit Hilfe der richtigen Software kann dieser Kontext basierend auf dem Markup an Übersetzungsmaschinen weitergeleitet werden. Also, mit vielen schon vorhandenen maschinellen Cloud-Übersetzungen und Webseiten mit semantischen Markups sowie einigen cleveren Routings, könnte dann jeder Satz auf dieser Seite entsprechend seines semantischen Markups und Kontexts  qualitativ hochwertiger übersetzt werden.

Es klingt wie Science Fiction, aber Studien in diesem Bereich haben bereits begonnen. Im Jahr 2012 haben zwei deutsche Wissenschaftler, Harriehausen-Mühlbauer und Heuss, einen Forschungsbericht veröffentlicht (“Semantic Web-based Machine Translation”) und darauf hingewiesen, dass es vor allem bei Übersetzungen oft entscheidend ist, dass der Quelltext richtig verstanden werde, da sonst Mehrdeutigkeiten auftreten können und diese zu einer unverständlichen Übersetzung führen.

Die Idee des Semantischen Webs wurde zuerst von Tim Berners Lee, Erfinder des World Wide Webs, HTTP und HTML, vorgestellt. Vor einigen Jahren wurden von den großen Suchmaschinen wie Google, Yahoo! und Bing ein Startpunkt entwickelt. Die Webseite www.schema.org besteht aus Listen von Elementen mit Codes, welche es Computern ermöglicht, die Bedeutung des Kontexts einer Webseite zu verstehen. Ein kürzlich veröffentlichter Econsultancy Artikel behauptet, dass der Google Knowledge Graph der erste Schritt zu einem Semantischen Web ist.

Wenn Sie gerade erst anfangen, sich über das Semantische Web zu informieren, finden Sie eventuell dieses Video hilfreich: