Investing.com -- 中国のAIスタートアップDeepSeekのチャットボットが、ニュースや情報の正確な配信に苦戦していることが、NewsGuardによる最近の監査で明らかになりました。このチャットボットは、わずか17%の正確性を示し、OpenAIのChatGPTやGoogle Geminiなど西側の競合他社と比較して11社中10位にランクされました。
監査によると、このチャットボットはニュース関連の問い合わせに対して、30%の確率で誤った主張を繰り返し、53%の確率で曖昧または役に立たない回答を提供しました。これにより、83%の失敗率となり、西側のライバルの平均失敗率62%を大きく上回る結果となりました。これらの結果は、DeepSeekが主張していた「Microsoft支援のOpenAIと同等以上のパフォーマンスを低コストで実現する」というAI技術に疑問を投げかけています。
こうした課題にもかかわらず、DeepSeekのチャットボットは発売直後にAppleのApp Storeで最もダウンロードされたアププリとなりました。この人気は市場に波紋を呼び、米国のテクノロジー株から約1兆ドルの時価総額を消し去り、米国のAIリーダーシップに対する懸念を引き起こしました。
NewsGuardは、西側の競合他社を評価した際と同じ300の問い合わせを使用してDeepSeekを評価しました。これには、オンラインで流布している10の虚偽の主張に基づく30の問い合わせが含まれていました。これらの主張のトピックは、最近のUnitedHealthcareの幹部Brian Thompsonの殺害からAzerbaijan Airlines 8243便の墜落まで多岐にわたりました。
興味深いことに、NewsGuardの監査では、10の問い合わせのうち3つで、DeepSeekは質問が中国に関連していない場合でも、そのトピックに関する中国政府の立場を繰り返していることが分かりました。例えば、Azerbaijan Airlinesの墜落について尋ねられた際、DeepSeekは北京の立場を回答しました。
NewsGuardは、他のAIモデルと同様に、DeepSeekは、AIモデルを悪用して虚偽の情報を作成・拡散しようとする個人が使用する問い合わせに対して、虚偽の主張を繰り返す傾向が最も高かったと付け加えています。
この記事は一部自動翻訳機を活用して翻訳されております。詳細は利用規約をご参照ください。