Meta übersetzt mit der KI SeamlessM4T fast 100 Sprachen
Die Erforschung und Weiterentwicklung von Künstlicher Intelligenz treibt besonders die großen Tech-Konzerne um. Nun stellt Meta mit SeamlessM4T einen KI-Übersetzer vor, der nahezu 100 Sprachen übersetzen kann.
Ob Google Übersetzer oder DeepL – Plattformen, die diverse Sprachen übersetzen, sind aus dem Internet kaum noch wegzudenken. Auch Facebook-Mutter Meta will Übersetzungen weiterentwickeln und hat dafür nun die KI SeamlessM4T vorgestellt.
Der Konzern wolle mit seinem „grundlegenden multimodalen Modell“ für die Übersetzung von Sprachen „Die Welt näher zusammenbringen“, heißt es im Blogpost zur Veröffentlichung der KI.
Contents
Was kann SeamlessM4T von Meta?
Der Name SeamlessM4T steht als Abkürzung für „Massively Multilingual and Multimodal Machine Translation“. Meta selbst bezeichnet die KI als „ein grundlegendes mehrsprachiges und multitaskingfähiges Modell, das Sprache und Text nahtlos übersetzt und transkribiert“. Das Modell ist derzeit als Demo verfügbar.
Die KI könne dabei fast 100 Sprachen automatisch erkennen sowie geschriebene und gesprochene Sprache schriftlich übersetzen. In 36 Sprachen, darunter Englisch, kann SeamlessM4T die Übersetzung sogar per Sprachausgabe übermitteln. Auch kann die Software den Wechsel von Sprachen erkennen – selbst, wenn der Wechsel mitten in einem Satz stattfindet.
SeamlessM4T ist frei verfügbar
Für nicht kommerzielle Zwecke macht Meta seinen KI-Übersetzer frei verfügbar. Der Konzern wolle Forscher:innen und Entwickler:innen so die Möglichkeit geben, auf der bereits geleisteten Arbeit aufzubauen.
Dafür stellt das Tech-Unternehmen auch die Metadaten des Übersetzungsdatensatzes SeamlessAlign zur Verfügung. Dieser umfasse nach Angaben von Meta insgesamt 270.000 Stunden an ausgewerteten Sprach- und Textalignments und sei somit der „bisher größten offenen multimodalen Übersetzungsdatensatz“.
Wie geht Meta mit Bias-Problemen um
Wie andere KI-Systeme besteht auch bei SeamlessM4T das Risiko, dass das Modell die Eingabe „falsch wiedergibt oder toxische oder ungenaue Ergebnisse erzeugt“.
Auch seien geschlechterspezifische Verzerrungen möglich. Laut den Testdaten von Meta neige SeamlessM4T dazu, Wörter in die männliche Form zu übersetzen oder schlechter zu übersetzen, wenn zuvor eine weibliche Form verwendet wurde.
Meta wolle im Bereich Sicherheit weiter forschen und SeamlessM4T so „kontinuierlich verbessern“. Das Ziel sei, solche Fälle bei der Nutzung der KI zu reduzieren.
Auch interessant: