DeepSeekのAIチャットボット、ニュース配信の正確性で低評価

編集者Louis Juricic
発行済 2025-01-30 00:06
© Reuters.

Investing.com -- 中国のAIスタートアップDeepSeekのチャットボットが、ニュースや情報の正確な配信に苦戦していることが、NewsGuardによる最近の監査で明らかになりました。このチャットボットは、わずか17%の正確性を示し、OpenAIのChatGPTやGoogle Geminiなど西側の競合他社と比較して11社中10位にランクされました。

監査によると、このチャットボットはニュース関連の問い合わせに対して、30%の確率で誤った主張を繰り返し、53%の確率で曖昧または役に立たない回答を提供しました。これにより、83%の失敗率となり、西側のライバルの平均失敗率62%を大きく上回る結果となりました。これらの結果は、DeepSeekが主張していた「Microsoft支援のOpenAIと同等以上のパフォーマンスを低コストで実現する」というAI技術に疑問を投げかけています。

こうした課題にもかかわらず、DeepSeekのチャットボットは発売直後にAppleのApp Storeで最もダウンロードされたアププリとなりました。この人気は市場に波紋を呼び、米国のテクノロジー株から約1兆ドルの時価総額を消し去り、米国のAIリーダーシップに対する懸念を引き起こしました。

NewsGuardは、西側の競合他社を評価した際と同じ300の問い合わせを使用してDeepSeekを評価しました。これには、オンラインで流布している10の虚偽の主張に基づく30の問い合わせが含まれていました。これらの主張のトピックは、最近のUnitedHealthcareの幹部Brian Thompsonの殺害からAzerbaijan Airlines 8243便の墜落まで多岐にわたりました。

興味深いことに、NewsGuardの監査では、10の問い合わせのうち3つで、DeepSeekは質問が中国に関連していない場合でも、そのトピックに関する中国政府の立場を繰り返していることが分かりました。例えば、Azerbaijan Airlinesの墜落について尋ねられた際、DeepSeekは北京の立場を回答しました。

NewsGuardは、他のAIモデルと同様に、DeepSeekは、AIモデルを悪用して虚偽の情報を作成・拡散しようとする個人が使用する問い合わせに対して、虚偽の主張を繰り返す傾向が最も高かったと付け加えています。

この記事は一部自動翻訳機を活用して翻訳されております。詳細は利用規約をご参照ください。

最新のコメント

当社アプリをインストール
リスク開示書: 金融商品や仮想通貨の取引は投資金額を失う高いリスクがあります。仮想通貨の価格は非常にボラティリティーが高く、金融、規制、政治など、外的な要因に影響を受けることがあります。また信用取引はリスクが高いことを十分に理解してください。
金融商品または仮想通貨の取引をする前に、金融市場での取引に関わるリスクやコストについて十分に理解し、専門家の助言を求めたり、ご自身の投資目的や経験値、リスク選好等を注意深く検討することを推奨いたします。
Fusion Media によるこのウェブサイトのデータが、必ずしもリアルタイムおよび正確ではないということをご了承ください。またデータや価格が、必ずしも市場や取引所からではなく、マーケットメーカーにより提供されている場合があります。その為、価格は気配値であり、実際の市場価格とは異なる可能性があります。Fusion Media および当ウェブサイトへのデータの提供者は、当ウェブサイトに含まれる情報を利用したすべての損失に対して一切の責任を負わないものとします。
Fusion Media およびデータ提供者による事前の書面の許可なしに、当ウェブサイト上のデータを使用、保存、複製、表示、変更、送信、配信することを禁じます。すべての知的財産権は当ウェブサイト上のデータの提供者、または取引所が有します。
Fusion Media は当ウェブサイトに表示される広告により報酬を得ることがあります。
上記内容は英語版を翻訳したものであり、英語版と日本語版の間に不一致がある時は英語版が優先されます。
© 2007-2025 - Fusion Media Limited. 無断複写・転載を禁じます