KI erkennt viele afrikanische Sprachen nichtCEFR B1
20. Apr. 2026
Adaptiert nach Guest Contributor, Global Voices • CC BY 3.0
Foto von Zulfugar Karimov, Unsplash
Künstliche Intelligenz entscheidet heute oft, welche Beiträge in sozialen Medien sichtbar bleiben oder gelöscht werden. Forschende und Moderatoren berichten von einer Lücke zwischen den Sprachen, die Menschen sprechen, und denen, die diese KI‑Werkzeuge verarbeiten können. Bereket Tsegay vom Kenya‑Hub von TikTok sagte, er habe viele Videos gesehen, die er nicht verstand, weil sie in lokalen Sprachen waren.
Eine Studie aus 2025 zeigte, dass nur 42 afrikanische Sprachen in großen Sprachmodellen vorkommen und nur vier Sprachen einigermaßen konsistent behandelt werden: Amharisch, Swahili, Afrikaans und Malagasy. Die starke Ausrichtung auf englische Trainingsdaten führt zu Fehlalarmen und zu Versäumnissen, wodurch schädliche Inhalte in ressourcenarmen Sprachen unentdeckt bleiben.
Konkrete Fälle zeigen die Folgen: Ein kenianischer Creator verlor im Februar 2025 seinen Account, wurde aber später wiederhergestellt. Zwischen Januar und März 2025 entfernte TikTok mehr als 450.000 Videos aus Kenia und sperrte über 43.000 Konten; bis zum zweiten Quartal stieg die Zahl der Entfernungen auf 592.000. Forschungsgruppen wie AfricaNLP und Teams in Pretoria, Nairobi und Addis Ababa arbeiten an Datensätzen, und politische Initiativen auf kontinentaler und nationaler Ebene wurden gestartet.
Schwierige Wörter
- künstliche Intelligenz — Computerprogramm, das Aufgaben wie Menschen entscheidet
- moderator — Person, die Beiträge in Medien prüftModeratoren
- Sprachmodell — Computerprogramm, das Sprache verarbeitet und lerntSprachmodellen
- Trainingsdaten — Daten, mit denen ein Modell trainiert wird
- Fehlalarm — falscher Alarm, der unnötig oder falsch istFehlalarmen
- Versäumnis — etwas Wichtiges, das nicht erledigt wurdeVersäumnissen
- ressourcenarm — mit wenig Geld oder Materialien ausgestattetressourcenarmen
- wiederherstellen — etwas, das verloren war, zurückbringenwiederhergestellt
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Haben Sie in sozialen Medien Beiträge in lokalen Sprachen gesehen? Welche Probleme kann automatische Moderation dabei verursachen?
- Was könnte Plattformen helfen, Inhalte in weniger verbreiteten Sprachen besser zu erkennen? Nennen Sie ein oder zwei Ideen.
- Wie wichtig ist es Ihrer Meinung nach, dass Forschungsgruppen in mehreren afrikanischen Städten an Sprachdaten arbeiten? Begründen Sie kurz.
Verwandte Artikel
Wahl in Bangladesch: Künstliche Intelligenz und Desinformation
Bei der Nationalwahl in Bangladesch spielte künstliche Intelligenz eine zentrale Rolle. Studien und Faktenprüfer fanden viele gefälschte Bilder, Videos und manipulierte Zitate, die den Wahlkampf und die öffentliche Wahrnehmung beeinflussten.
Warum Abgeordnete persönliche Angriffe nutzen
Eine Studie untersucht, warum manche Abgeordnete öffentliche Beleidigungen verwenden und welchen Nutzen sie daraus ziehen. Die Forschenden zeigen, dass persönliche Angriffe mehr Medienaufmerksamkeit bringen, aber nicht mehr Spenden oder höheren legislativen Erfolg.