Show notes
Computer können ja bekanntlich fast alles - doch beim Übersetzen stoßen sie schnell an ihre Grenzen.
Aber selbst das will Google ihnen nun beibringen. Sprachwissenschaftler bleiben skeptisch.
Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt", schrieb der Philosoph Ludwig Wittgenstein. Im Internet erscheinen Grenzen als Konstrukte von gestern - alles ist abrufbar, überall, zu jeder Zeit.
Doch dessen Fähigkeiten lassen zu wünschen übrig. „Übersetze mich nicht" wird zu „Do not sit down", der Adventsklassiker „Macht hoch die Tür" zu „Power up the door".
Computer können uns den Weg durch die Wildnis weisen, täuschend echt klingende Aufsätze schreiben und unsere Freunde auf Fotos erkennen. Trotzdem hapert es mit den Übersetzungen. Entwickler versuchen nun, das zu ändern. Einige glauben, die digitalen Dolmetscher könnten sogar so gut werden wie menschliche.
„Übersetzungsprogramme funktionieren deshalb nicht einwandfrei, weil natürliche Sprache sehr komplex ist", sagt Uta Seewald-Heeg, Professorin für Computerlinguistik an der Hochschule Anhalt. „Das Besondere an der natürlichen Sprache ist, dass wir unentwegt neue Sätze bilden können und auch solche, die vorher noch nie jemand ausgesprochen hat."
Um die Systeme offen zu halten für die unendlichen Weiten der Sprache, müssen auch die Programme unbeschränkt aus den vorhandenen Teilen kombinieren können.
Das Unternehmen, das die Weiten des Internets ordnet und auffindbar macht, ist Google. Nun will es auch die Grenzen der Sprache auflösen: mit dem Übersetzungsprogramm Google Translate.
Solche regelbasierten Systeme werden heute beispielsweise in der technischen Dokumentation, also etwa für Montageanleitungen und Online-Hilfetexte, eingesetzt, oder für Rückmeldungen von Reisenden auf Bewertungsseiten.
Eine davon nutzt die Programme von Igor Jourist, Geschäftsführer der Promt GmbH. „Es ist sehr wichtig, dass man für den Bereich, aus dem man einen Text übersetzen möchte, ein spezielles Vokabular hat", sagt er. So habe man den Programmen Fachvokabular aus der Reisebranche beigebracht. Zumindest dafür sind Menschen notwendig.
„Die Algorithmen suchen aus einer Reihe von Texten unbekannte, aber häufige Begriffe heraus", sagt Jourist. „Und dann sagt ein Mitarbeiter der Maschine, was das für Wörter sind: ein Verb, ein Substantiv oder ein Name, der nicht übersetzt werden soll." Das Wichtigste aber sei die Entwicklung von Algorithmen nach der Grammatik einer Sprache.
Unsinns-Übersetzung auf Reiseportal
Es ist einfach auf dem von Jourist belieferten Reise-Portal eine Unsinns-Übersetzung zu finden. „Übernachten Sie nicht in einem Studentenwohnheim wohnen, sollten Sie sich im Klaren sein schwierige pricing, beobachten Sie Ihre Wertsachen", heißt es über ein Resort. Was läuft falsch - trotz programmierter Grammatik, speziellen Wörterbüchern und ausgefeilten Algorithmen?
„Mit Regeln kann man Sprache sehr genau und sehr gut beschreiben", sagt Uta Seewald-Heeg, „aber es sind sehr viele Regeln und einige davon beeinflussen sich gegenseitig." Das Grundproblem ist die Komplexität der Sprache.
Die Grammatik bestimmt die Übersetzung - ist sie nicht eindeutig, kann kein Programm eindeutig übersetzen. Komplexere Grammatik erfordert mehr Regeln, bringt aber auch mehr Klarheit
Der Satz „Der Mann sah das Mädchen mit dem Fernglas" zeigt im Deutschen nicht an, ob das Fernglas eine Sehhilfe des Mannes oder ein Accessoire des Mädchens ist. In anderen Sprachen müsste dies jedoch eindeutig sein, um es richtig übersetzen zu können.
Google nutzt für seine Übersetzungen ein statistisches System, das auf großen Mengen von Daten basiert. „Wir suchen Websites, die es in mehreren Sprachen gibt, und legen diese Übersetzungen unserem Programm zugrunde. Das können Hilfeseiten von Software-Anbietern sein, aber auch Reise-Websites, Online-Shops oder Nachrichten-Seiten", sagt Hughes.
Auf der...
Aber selbst das will Google ihnen nun beibringen. Sprachwissenschaftler bleiben skeptisch.
Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt", schrieb der Philosoph Ludwig Wittgenstein. Im Internet erscheinen Grenzen als Konstrukte von gestern - alles ist abrufbar, überall, zu jeder Zeit.
Doch dessen Fähigkeiten lassen zu wünschen übrig. „Übersetze mich nicht" wird zu „Do not sit down", der Adventsklassiker „Macht hoch die Tür" zu „Power up the door".
Computer können uns den Weg durch die Wildnis weisen, täuschend echt klingende Aufsätze schreiben und unsere Freunde auf Fotos erkennen. Trotzdem hapert es mit den Übersetzungen. Entwickler versuchen nun, das zu ändern. Einige glauben, die digitalen Dolmetscher könnten sogar so gut werden wie menschliche.
„Übersetzungsprogramme funktionieren deshalb nicht einwandfrei, weil natürliche Sprache sehr komplex ist", sagt Uta Seewald-Heeg, Professorin für Computerlinguistik an der Hochschule Anhalt. „Das Besondere an der natürlichen Sprache ist, dass wir unentwegt neue Sätze bilden können und auch solche, die vorher noch nie jemand ausgesprochen hat."
Um die Systeme offen zu halten für die unendlichen Weiten der Sprache, müssen auch die Programme unbeschränkt aus den vorhandenen Teilen kombinieren können.
Das Unternehmen, das die Weiten des Internets ordnet und auffindbar macht, ist Google. Nun will es auch die Grenzen der Sprache auflösen: mit dem Übersetzungsprogramm Google Translate.
Solche regelbasierten Systeme werden heute beispielsweise in der technischen Dokumentation, also etwa für Montageanleitungen und Online-Hilfetexte, eingesetzt, oder für Rückmeldungen von Reisenden auf Bewertungsseiten.
Eine davon nutzt die Programme von Igor Jourist, Geschäftsführer der Promt GmbH. „Es ist sehr wichtig, dass man für den Bereich, aus dem man einen Text übersetzen möchte, ein spezielles Vokabular hat", sagt er. So habe man den Programmen Fachvokabular aus der Reisebranche beigebracht. Zumindest dafür sind Menschen notwendig.
„Die Algorithmen suchen aus einer Reihe von Texten unbekannte, aber häufige Begriffe heraus", sagt Jourist. „Und dann sagt ein Mitarbeiter der Maschine, was das für Wörter sind: ein Verb, ein Substantiv oder ein Name, der nicht übersetzt werden soll." Das Wichtigste aber sei die Entwicklung von Algorithmen nach der Grammatik einer Sprache.
Unsinns-Übersetzung auf Reiseportal
Es ist einfach auf dem von Jourist belieferten Reise-Portal eine Unsinns-Übersetzung zu finden. „Übernachten Sie nicht in einem Studentenwohnheim wohnen, sollten Sie sich im Klaren sein schwierige pricing, beobachten Sie Ihre Wertsachen", heißt es über ein Resort. Was läuft falsch - trotz programmierter Grammatik, speziellen Wörterbüchern und ausgefeilten Algorithmen?
„Mit Regeln kann man Sprache sehr genau und sehr gut beschreiben", sagt Uta Seewald-Heeg, „aber es sind sehr viele Regeln und einige davon beeinflussen sich gegenseitig." Das Grundproblem ist die Komplexität der Sprache.
Die Grammatik bestimmt die Übersetzung - ist sie nicht eindeutig, kann kein Programm eindeutig übersetzen. Komplexere Grammatik erfordert mehr Regeln, bringt aber auch mehr Klarheit
Der Satz „Der Mann sah das Mädchen mit dem Fernglas" zeigt im Deutschen nicht an, ob das Fernglas eine Sehhilfe des Mannes oder ein Accessoire des Mädchens ist. In anderen Sprachen müsste dies jedoch eindeutig sein, um es richtig übersetzen zu können.
Google nutzt für seine Übersetzungen ein statistisches System, das auf großen Mengen von Daten basiert. „Wir suchen Websites, die es in mehreren Sprachen gibt, und legen diese Übersetzungen unserem Programm zugrunde. Das können Hilfeseiten von Software-Anbietern sein, aber auch Reise-Websites, Online-Shops oder Nachrichten-Seiten", sagt Hughes.
Auf der...

