Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。

著者 : Caleb Mar 16,2025

Deepseekの新しいチャットボットは、驚くほど有能なAIを誇っています。シンプルでありながら興味深い声明を紹介しています。

このAIはすぐに主要なプレーヤーになり、Nvidiaの株価が大幅に低下しています。その成功は、いくつかの革新的な技術を組み込んだアーキテクチャとトレーニング方法のユニークな組み合わせに由来しています。

  • マルチトークン予測(MTP):従来の単語ごとの予測とは異なり、MTPは複数の単語を同時に予測し、精度と効率の両方を大幅に改善します。
  • 専門家(MOE)の混合:このアーキテクチャは、複数のニューラルネットワークを活用して、入力、トレーニングの加速、パフォーマンスの向上を処理します。 Deepseek V3は256のネットワークを利用して、トークンごとに8つをアクティブにします。
  • マルチヘッドの潜在的注意(MLA): MLAは、キー文のコンポーネントに繰り返し焦点を当て、重要な詳細が見逃されないようにし、入力のより微妙な理解につながります。

DeepSeekテスト

画像:Ensigame.com

中国のヘッジファンドのハイフライヤーの子会社であるDeepseekは、当初、2048 GPUを使用して600万ドルで強力なDeepseek V3ニューラルネットワークを訓練したと主張しました。ただし、セミアンアリシスにより、はるかに多くのインフラストラクチャが明らかになりました。10,000H800、10,000 H100、および追加のH20を含む約50,000のNVIDIAホッパーGPUが、複数のデータセンターに分布しています。これは、サーバー投資が約16億ドルで、運用費用は9億4,400万ドルと推定されます。

Deepseek V3

画像:Ensigame.com

クラウドコンピューティングに依存している多くのスタートアップとは異なり、DeepSeekはデータセンターを所有しており、より多くの制御とイノベーションの実装を高めることができます。その自己資金によるステータスは、敏ility性と意思決定をさらに強化します。同社の才能へのコミットメントも注目に値し、一部の研究者は年間130万ドル以上を稼ぎ、中国の主要な大学からのトップ卒業生を集めています。したがって、最初の600万ドルの数値は、トレーニング前のGPUコストのみを反映しており、5億ドルを超える総投資額を大幅に過小評価しています。

deepseek

画像:Ensigame.com

Deepseekの無駄のない構造は、より大きな官僚的企業と比較して効率的なイノベーションを可能にしますが、その成功は、実質的な投資、技術的ブレークスルー、非常に熟練したチームに紛れもなくリンクされています。したがって、「革新的な予算」請求には、重要な資格が必要です。それにもかかわらず、Deepseekのコストは競合他社よりも大幅に低いままです。たとえば、DeepseekはChatGPTのChatGPT4Oの1億ドルと比較して、R1に500万ドルを費やしました。

deepseek

画像:Ensigame.com

Deepseekのストーリーは、資金提供された独立したAI企業が確立された巨人と効果的に競争する可能性を強調しています。ただし、この急速に進化する分野では、実質的な投資、最先端の技術、卓越した才能が成功のための重要な要素であるという現実を強調しています。