アングル：シンガポールが「東南アジア」ＡＩモデル開発、格差是正狙う

発行済 2024-02-12 08:00

© Reuters. 　２月８日、「チャットＧＰＴ」などの生成ＡＩ（人工知能）が基盤とする「大規模言語モデル（ＬＬＭ）」は、大半が英語を軸に作られており、東南アジアなどの言語ではうまく動作しな

Rina Chandran

[シンガポール　８日　トムソン・ロイター財団] - 「チャットＧＰＴ」などの生成ＡＩ（人工知能）が基盤とする「大規模言語モデル（ＬＬＭ）」は、大半が英語を軸に作られており、東南アジアなどの言語ではうまく動作しないことが多い。生成ＡＩの出現によって教育や仕事、統治のあり方が大きく変わる中、こうしたＡＩ格差によって取り残されるのを避けようと、シンガポールなどで独自の生成ＡＩの開発が始まっている。

シンガポール政府が主導して設立されたＡＩ推進機関、ＡＩシンガポールはこのほど、東南アジアの言語や文化的規範で訓練したＡＩモデル「SEA-LION（Southeast Asian Languages in One Network）」を開発した。

ＡＩシンガポールのＡＩ製品担当シニアディレクター、レスリー・テオ氏によると、ＳＥＡ─ＬＩＯＮはベトナム語、タイ語、インドネシア語など１１の東南アジア言語のデータで訓練されたオープンソースモデルで、同地域の企業、政府、学界にとってより低コストで効率的な選択肢となる。「大手のＬＬＭと競おうとしているわけではない。大手の足りないところを補い、もっと私たちに合ったものにしようとしている」とテオ氏は語る。

世界には７０００を超える言語がある。言語によるＡＩ格差を埋めるための開発は、世界各地で進んでいる。

インドは現地言語のデータ群の作成に取り組み、アラブ首長国連邦（ＵＡＥ）はアラビア語の生成ＡＩツールを開発。中国、日本、ベトナムでも現地言語のＡＩモデルが開発されている。

オクラホマ州立大学コミュニケーション学部の準教授、ヌウリアンティ・ジャリ氏は「こうしたモデルは、大手ハイテク企業によって寡占されている世界のＡＩ経済に、各地域の人々がより公平に参加するのに役立つ」と評価。地域言語によるＬＬＭは各地域が技術面で自立するのに役立ち、欧米のＬＬＭへの依存を減らすことは、こうした地域のプライバシーの向上に資する上、特定の国や地域の利益にも合致すると言う。

＜検証と選別＞

一度に複数の言語のテキストで訓練した多言語モデルは、より多くのデータがある「高リソース言語」とデータの少ない「低リソース言語」の間にある意味や文法のつながりを推測することが可能だと研究者は指摘する。こうしたモデルは顧客対応チャットボットにおける翻訳から、ソーシャルメディア上に低リソース言語で投稿されたヘイトスピーチ（憎悪表現）の監視まで、さまざまに応用できる。

テオ氏によると、SEA-LIONはデータに占める東南アジア言語の比率が約１３％と、他の全ての主要ＬＬＭよりも高い。中国語の比率は９％強で英語は約６３％だ。

多言語モデルは、翻訳テキストなど、間違っている可能性のある質の低いデータで訓練されている場合が多いため、ＡＩシンガポールはSEA-LIONの訓練に使用するデータについて「慎重に」検証や選別を行っているという。

＜データの偏り＞

一方、現地言語でＬＬＭを構築する国や地域が増えるにつれて、オンライン上で支配的な意見だけがモデル上で再生産されるのではないかと専門家は警戒している。権威主義的な政府や厳しいメディア検閲がある国、市民社会が整っていない国でこうした点は特に問題になり得る。

例えば中国のソーシャルメディア・プラットフォームは天安門事件や政府批判を検閲しており、東南アジアの一部の国は、人を惑わすと当局が判断したコンテンツを制限する法律を制定している。「こうしたデータに基づいてモデルを訓練することで、偏った、偏見に満ちた、不完全な、さらには誤解を招くストーリーを根付かせてしまう危険性がある」とジャリ氏は言う。

例えば、インドネシアのスハルト元大統領について質問したところ、米メタ・プラットフォームズのＬＬａＭＡ（ラマ）２と米オープンＡＩのＧＰＴ―４はスハルト氏の人権問題についての記録に触れたが、SEA-LIONはその功績に焦点を当てた。

米国の非営利団体センター・フォー・デモクラシー・アンド・テクノロジーの政策アナリスト、アリヤ・バティア氏は「ある政府について好意的な記事だけで訓練した場合、そのモデルは政府が良い面ばかりだという世界観を採用し、反対意見を置き去りにしてしまう可能性が高い」と問題点を指摘した。

「現地言語のＬＬＭは、その言語を話す人々の言語的・文化的ニュアンスをより良く反映するかもしれないが、世界全体についての情報は少ないかもしれない。政府が支援するモデルでは歴史修正主義的な見方が植え付けられ、民主主義的な価値観が損なわれる恐れがある」という。

これに対し、裕福でリベラルな欧米民主主義国家から「不釣り合いに大きな影響」を受けている欧米のＬＬＭに全面的に依存すれば、文化的価値観、政治的信条、社会規範についてさまざまな偏見を永続させることになるとＡＩシンガポールは反論している。

テオ氏は「こうしたＬＬＭには米西海岸特有のバイアスがあり、『意識高い系』に寄り過ぎている。われわれの文化を代表するものではない」とした上で、「私たちの視点が唯一だと言っているわけではない。バランスを取ろうとしているだけだ」と付け加えた。

全てのコメントを見る (0)0

名前	現在値	変動%	出来高
三菱重工業	2,197.5	-1.41%	42.42M
サンリオ	4,938.0	+6.28%	18.58M
フジクラ	5,322.0	+0.80%	13.97M
アドバンテスト	8,240.0	+0.37%	13.35M
レーザーテック	16,440.0	-0.87%	7.42M
東京エレクトロン	23,310.0	-1.81%	4.68M
ディスコ	40,600.0	-2.80%	4.54M

名前	現在値	変動%	出来高
ウェルスナビ	1,358.00	+28.36%	281.60K
GlobeIng	5,760.00	+27.15%	1.81M
BTM	2,254.00	+21.57%	50.40K
ラストワンマイル	2,517.00	+18.06%	286.60K
テクノマセマティカル	660.0	+17.86%	441.70K
日本パワーファスニング	661.0	+17.83%	3.68M
Institute for Qshu Pioneers of	1,570.00	+17.08%	8.58M

名前	現在値	変動%	出来高
日本電解	73.00	-83.30%	13.92M
カヤバ	2,443.0	-50.60%	142.60K
デジタリフト	792.00	-22.50%	302.60K
ユニチカ	194.0	-20.16%	11.58M
しんふあほーるでぃんぐす・りみてっど	2,230.0	-18.32%	4.41K
AR Advanced Technology	1,360.00	-11.11%	50.90K
ランド	8.0	-11.11%	77.26M

人気銘柄の動向

名前	現在値	変動%	出来高
三菱UFJフィナンシャル・グループ	1,792.0	+1.33%	39.57M
トヨタ自動車	2,551.5	-2.13%	24.50M
日産自動車	358.9	-4.01%	84.62M
ウェルスナビ	1,358.00	+28.36%	281.60K
三菱重工業	2,197.5	-1.41%	42.42M

更に表示する

当社アプリをインストールQRコードを写真で撮ってアプリをインストール

リスク開示書: 金融商品や仮想通貨の取引は投資金額を失う高いリスクがあります。仮想通貨の価格は非常にボラティリティーが高く、金融、規制、政治など、外的な要因に影響を受けることがあります。また信用取引はリスクが高いことを十分に理解してください。
金融商品または仮想通貨の取引をする前に、金融市場での取引に関わるリスクやコストについて十分に理解し、専門家の助言を求めたり、ご自身の投資目的や経験値、リスク選好等を注意深く検討することを推奨いたします。
Fusion Media によるこのウェブサイトのデータが、必ずしもリアルタイムおよび正確ではないということをご了承ください。またデータや価格が、必ずしも市場や取引所からではなく、マーケットメーカーにより提供されている場合があります。その為、価格は気配値であり、実際の市場価格とは異なる可能性があります。Fusion Media および当ウェブサイトへのデータの提供者は、当ウェブサイトに含まれる情報を利用したすべての損失に対して一切の責任を負わないものとします。
Fusion Media およびデータ提供者による事前の書面の許可なしに、当ウェブサイト上のデータを使用、保存、複製、表示、変更、送信、配信することを禁じます。すべての知的財産権は当ウェブサイト上のデータの提供者、または取引所が有します。
Fusion Media は当ウェブサイトに表示される広告により報酬を得ることがあります。
上記内容は英語版を翻訳したものであり、英語版と日本語版の間に不一致がある時は英語版が優先されます。

人気のある検索

別の検索をお試しください

アングル：シンガポールが「東南アジア」ＡＩモデル開発、格差是正狙う

最新のコメント

人気銘柄の動向