AIと英語中心の格差 (日本語, レベル B1)

スタンフォード大学人間中心人工知能研究所（HAI）が2025年に発表した論文は、多くの人気の大規模言語モデルが英語以外での性能が低いと指摘しました。研究は、オンラインが英語で支配されていることと、開発者が英語データに頼る傾向が格差の原因だとしています。

研究者らは、GoogleやMetaが一部関わった公共のモデルも含め、世界の多数派のニーズに合わない応答を生成することがあると述べます。報道では、クルド語やスワヒリ語を話す何百万もの人々が実質的に優先されていないと書かれています。

さらに、Wiredはタミル語でメールを書かせると英語が混ざったまとまりのない下書きが出る例を示しました。MIT Technology Reviewは、低リソース言語のウェブデータに機械翻訳の誤りが多いと報告し、誤りが学習データに取り込まれる問題も指摘しています。

難しい単語

大規模言語モデル — 大量のテキストで学ぶ言語モデル

性能 — 機械やソフトの動きの良さ

格差 — 扱いや状況に違いがあること

優先する — 先に大事にすること

優先されていない

低リソース言語 — 利用できるデータが少ない言語

機械翻訳 — コンピューターが自動で翻訳すること

学習データ — モデルを学ぶための入力情報

生成する — 新しい文章や応答を作る行為

ヒント：記事中の強調表示された単語にマウスオーバー／フォーカス／タップすると、その場で簡単な意味が表示されます。

ディスカッション用の質問

自分の母語は大規模言語モデルで十分に扱われていると思いますか？理由を述べてください。

研究が指摘する格差を減らすために、どんな取り組みが必要だと思いますか？具体例を一つ挙げてください。

機械翻訳の誤りが学習データに取り込まれると、どんな影響が出ると思いますか？自分の考えを書いてください。

南アフリカの研究者ジェイミー・リー・ジャニュアリーは第75回リンダウ会議で、ナノテクノロジーを使った高感度バイオセンサー研究を発表しました。目的は結核やがんなどの早期検出です。

レベル

ソーシャルメディアは支援やつながりを作る一方、ヘイトや誤情報、現実世界への害も広げる。Metaの方針変更や生成AIの登場など、設計と管理が結果を左右する。

レベル

Africa Wiki WomenはWikipediaなどでアフリカの女性に関する情報を増やすグループです。トレーニングやメンタリングで参加を促し、International Women’s Day 2026に共同設立者のインタビューが掲載されました。

レベル

ブラジルでAIを使い同意のない性的画像を作る事例が相次いでいます。独立系研究機関Internetlabは被害の拡大を指摘し、規制や教育の必要性を訴えています。

レベル

カリフォルニア大学サンタバーバラ校の研究チームが、光で画像を作りその光を触覚に変える表示技術を開発しました。成果は学術誌「Science Robotics」に掲載されました。

レベル

AIと英語中心の格差^{CEFR B1}