中国の新興企業、ディープシーク(深度求索)が開発した生成AIアプリが、App Storeの無料アプリダウンロードランキングで首位を獲得し、大きな話題となっています。しかし、その実力はいかに? 米ニュースガードの検証結果によると、驚くべきことに正答率はわずか17%という結果に。低コストで高性能を実現したという謳い文句とは裏腹に、信頼性に疑問符が投げかけられています。
ディープシークの生成AIアプリとは?
ディープシークは、独自の生成AI基盤モデルを搭載したアプリを開発し、公開しました。最近では、アメリカのApp Storeで無料アプリダウンロード数1位を獲得するなど、注目を集めています。同社は、このアプリがOpenAIの基盤モデルに匹敵する性能を、より低コストで実現していると主張していました。
中国の「ディープシーク(深度求索)」が開発した生成AI(人工知能)アプリのアイコン
ニュースガードによる検証結果:83%が「失敗」
米ニュースガードは、他の生成AIの精度検証にも使用している300の質問を用いて、ディープシークのアプリを検証しました。その結果は、正答率わずか17%、誤答率30%、そして53%が曖昧または役に立たない回答という衝撃的なものでした。ニュースガードはこれを「失敗率」83%と評価し、欧米の競合アプリの平均失敗率62%を大きく上回る結果となりました。
専門家の見解
AI研究の第一人者である東京大学の佐藤教授(仮名)は、この結果について次のようにコメントしています。「生成AIの性能は、学習データの質と量に大きく依存します。ディープシークのアプリの低い正答率は、学習データに偏りがあったり、十分な量が確保できていない可能性を示唆しています。」 また、佐藤教授は「生成AI技術は日進月歩で進化しており、今後の開発と改善に期待したい」とも述べています。
生成AIアプリの未来
生成AIは、私たちの生活を大きく変える可能性を秘めた技術です。しかし、ディープシークの事例は、その信頼性を確保することの重要性を改めて示しています。今後、生成AIアプリが真に社会に貢献するためには、精度向上と信頼性確保に向けた更なる努力が不可欠となるでしょう。 ディープシークの今後の動向、そして他の生成AIアプリの開発競争からも目が離せません。