Deepseek'in karşılanabilirliği bir efsanedir: Devrimci AI aslında 1,6 milyar dolara mal oldu

Yazar : Caleb Mar 16,2025

Deepseek'in yeni sohbet botu şaşırtıcı derecede yetenekli bir yapay zeka ile övünüyor ve kendini basit ama ilgi çekici bir ifadeyle tanıştırıyor: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz."

Bu AI hızla önemli bir oyuncu haline geldi ve hatta Nvidia'nın hisse senedi fiyatında önemli düşüşlere neden oldu. Başarısı, birkaç yenilikçi teknolojiyi içeren benzersiz bir mimari ve eğitim yöntem kombinasyonundan kaynaklanmaktadır:

  • Çoklu Tahmini Tahmin (MTP): Geleneksel kelime tahmininin aksine, MTP aynı anda birden fazla kelimeyi tahmin ederek hem doğruluğu hem de verimliliği önemli ölçüde artırır.
  • Uzmanların Karışımı (MOE): Bu mimari, girdiyi işlemek, eğitimi hızlandırmak ve performansı artırmak için birden fazla sinir ağından yararlanır. Deepseek V3 256 ağ kullanır ve her jeton için sekiz etkinleştirilir.
  • Çok Baş Gizli Dikkat (MLA): MLA defalarca önemli cümle bileşenlerine odaklanır ve önemli ayrıntıların kaçırılmamasını sağlar ve girdinin daha nüanslı bir şekilde anlaşılmasına yol açar.

Deepseek Testi

Resim: ensigame.com

Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olan Deepseek, başlangıçta güçlü Deepseek V3 sinir ağını 2048 GPU kullanarak sadece 6 milyon dolarlık eğittiğini iddia etti. Bununla birlikte, semianaliz çok daha önemli bir altyapı ortaya çıkarmıştır: 10.000 H800, 10.000 H100s ve ek H20'ler dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'ları birden fazla veri merkezine dağıtılmıştır. Bu, yaklaşık 1,6 milyar dolarlık bir sunucu yatırımına ve 944 milyon dolar olarak tahmin edilen operasyonel giderlere dönüşüyor.

Deepseek V3

Resim: ensigame.com

Bulut bilişimine dayanan birçok girişimin aksine, Deepseek veri merkezlerinin sahibidir, daha fazla kontrol ve daha hızlı inovasyon uygulaması sağlar. Kendini finanse edilen statüsü çevikliği ve karar almayı daha da artırır. Şirketin yetenek konusundaki taahhüdü de dikkat çekicidir, bazı araştırmacılar yılda 1.3 milyon doların üzerinde kazanır ve önde gelen Çin üniversitelerinden en iyi mezunları çeker. Bu nedenle, ilk 6 milyon dolarlık rakam, sadece eğitim öncesi GPU maliyetlerini yansıtıyor ve toplam yatırımı 500 milyon doları aşan önemli ölçüde yetersiz temsil ediyor.

Deepseek

Resim: ensigame.com

Deepseek'in yalın yapısı, daha büyük, daha bürokratik şirketlere kıyasla verimli bir inovasyona izin verirken, başarısı inkar edilemez bir şekilde önemli yatırım, teknolojik atılımlar ve yüksek vasıflı bir ekiple bağlantılıdır. Bu nedenle "devrimci bütçe" iddiası önemli niteliklere ihtiyaç duyar. Bununla birlikte, Deepseek'in maliyetleri rakiplerden önemli ölçüde daha düşüktür. Örneğin, Deepseek, Chatgpt'in ChatGpt4o için 100 milyon dolarına kıyasla R1'e 5 milyon dolar harcadı.

Deepseek

Resim: ensigame.com

Deepseek'in hikayesi, iyi finanse edilmiş, bağımsız bir AI şirketinin yerleşik devlerle etkili bir şekilde rekabet etme potansiyelini vurgular. Bununla birlikte, önemli yatırım, en son teknoloji ve olağanüstü yeteneklerin bu hızla gelişen alanda başarı için temel bileşenler olduğu gerçeğinin altını çizmektedir.