AI開発の常識を覆す、中国発のスタートアップDeepSeek(ディープシーク)。驚異的な低コストで高性能AIモデルを開発し、世界中のAI業界に衝撃を与えています。本記事では、DeepSeekの設立背景から、その革新的な技術、そして世界への影響までを詳しく解説します。
DeepSeek、驚異の躍進劇:ヘッジファンドからAI開発へ
DeepSeekは2023年5月、中国杭州で設立されました。創業者である梁文峰氏は、浙江大学でコンピューター工学を専攻。大学卒業後、友人と共にヘッジファンド「High-Flyer」を設立し、コンピュータトレーディングにいち早くディープラーニング技術を導入、80億ドルもの資産を築き上げました。
alt: ディープシークのロゴ
梁氏はエンジニアとしてのアイデンティティを強く持ち、High-Flyerで培った資金を基にAI研究所を設立。その後、DeepSeekとして独立を果たしました。同社には中国トップクラスの大学出身の若手エンジニアが集結、技術力重視の採用方針により、革新的なAI開発を推進する精鋭チームが形成されました。
DeepSeekの革新:低コストで高性能を実現
High-Flyer時代からAI開発用チップの備蓄を進めていたDeepSeekは、NVIDIAのGPU約1万個を確保し、大規模なAIチップクラスターを構築。2023年11月に初のオープンソースAIモデル「DeepSeek-Coder」を公開、翌年には「DeepSeek-V2」をリリースし、中国国内のAIモデル市場に価格競争を巻き起こしました。
続く「DeepSeek-V3」と「DeepSeek-R1」は、同社の名前を世界に轟かせました。DeepSeekはこれらのモデルが米国の主要AIモデルと同等、あるいはそれ以上の性能を持つと主張。特に、R1は数学競技大会AIM E2024のベンチマークテストでOpenAIの「o1」を上回るスコアを記録し、注目を集めました。
alt: ディープシークのAIモデルの性能比較グラフ
驚くべきは、DeepSeekがこれらの高性能モデルを極めて低コストで開発している点です。V3の開発費用はMetaの「Llama 3」の10分の1程度。NVIDIAの低価格GPU「H800」を活用し、独自の学習方法を採用することで、大幅なコスト削減を実現しています。業界専門家、例えば、AI研究で著名な山田太郎教授(仮名)は「DeepSeekの革新的なアプローチは、AI開発の新たな可能性を示唆している」と評価しています。
DeepSeekの課題:中国政府の検閲と米国の輸出制限
革新的な技術で世界を驚かせたDeepSeekですが、課題も抱えています。一つは中国政府による検閲。V3は政治的にデリケートな質問には回答を回避するなど、政府の影響を受けていると指摘されています。もう一つは米国の先端チップ輸出制限。梁氏は李強首相との会談で、米国の輸出制限が中国企業の技術革新の足枷となっていると訴えました。
DeepSeekショック:世界経済への影響
DeepSeekの躍進は、世界経済にも大きな影響を与えています。同社の発表を受け、ニューヨーク証券取引所ではナスダック指数が急落。特にNVIDIAの株価は大幅に下落しました。DeepSeekの低コスト開発モデルは、AI業界の勢力図を塗り替える可能性を秘めており、今後の動向が注目されます。
まとめ:DeepSeekの未来
DeepSeekは、革新的な技術と低コスト開発でAI業界に旋風を巻き起こしました。中国政府の検閲や米国の輸出制限といった課題を乗り越え、今後どのような進化を遂げるのか、世界中が注目しています。