L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo

Autore : Caleb Mar 16,2025

Il nuovo chatbot di Deepseek vanta un'intelligenza artificiale sorprendentemente capace, presentandosi con la semplice ma intrigante affermazione: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti."

Questa intelligenza artificiale è diventata rapidamente un giocatore importante, causando anche calo significativi del prezzo delle azioni di Nvidia. Il suo successo deriva da una combinazione unica di metodi di architettura e formazione, che incorpora diverse tecnologie innovative:

  • Previsione multi-token (MTP): a differenza della previsione tradizionale di parole per parola, MTP prevede contemporaneamente più parole, migliorando significativamente sia l'accuratezza che l'efficienza.
  • Miscela di esperti (MOE): questa architettura sfrutta molteplici reti neurali per elaborare l'input, l'accelerazione della formazione e aumentare le prestazioni. DeepSeek V3 utilizza 256 reti, attivando otto per ogni token.
  • Attenzione latente multi-testa (MLA): MLA si concentra ripetutamente sui componenti della frase chiave, garantendo che i dettagli cruciali non siano persi, portando a una comprensione più sfumata dell'input.

Test di DeepSeek

Immagine: Ensigame.com

DeepSeek, una consociata dell'Hedge Fund cinese High-Flyer, inizialmente ha affermato di aver formato la sua potente rete neurale di DeepSeek V3 per soli $ 6 milioni utilizzando 2048 GPU. Tuttavia, la semianalisi ha rivelato un'infrastruttura molto più sostanziale: circa 50.000 GPU della tramoggia Nvidia, tra cui 10.000 H800, 10.000 H100 e ulteriori H20, distribuiti su più data center. Ciò si traduce in un investimento server di circa $ 1,6 miliardi e le spese operative stimate in $ 944 milioni.

DeepSeek V3

Immagine: Ensigame.com

A differenza di molte startup che si basano sul cloud computing, DeepSeek possiede i suoi data center, fornendo un maggiore controllo e un'implementazione più rapida dell'innovazione. Il suo stato autofinanziato migliora ulteriormente l'agilità e il processo decisionale. Anche l'impegno dell'azienda nei confronti del talento è notevole, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, attirando i migliori laureati dalle principali università cinesi. La cifra iniziale di $ 6 milioni, pertanto, riflette solo i costi della GPU pre-allenamento e significativamente sottorappresentanti l'investimento totale superiore a $ 500 milioni.

Deep -Week

Immagine: Ensigame.com

Mentre la struttura snella di Deepseek consente un'innovazione efficiente rispetto alle aziende più grandi e burocratiche, il suo successo è innegabilmente legato a investimenti sostanziali, scoperte tecnologiche e un team altamente qualificato. Il reclamo del "bilancio rivoluzionario", pertanto, richiede una qualifica significativa. Tuttavia, i costi di Deepseek rimangono significativamente più bassi rispetto ai concorrenti. Ad esempio, DeepSeek ha speso $ 5 milioni in R1, rispetto ai $ 100 milioni di Chatgpt per Chatgpt4o.

Deep -Week

Immagine: Ensigame.com

La storia di Deepseek evidenzia il potenziale di una società di intelligenza artificiale indipendente ben finanziata per competere efficacemente con i giganti affermati. Tuttavia, sottolinea anche la realtà che investimenti sostanziali, tecnologia all'avanguardia e talenti eccezionali sono ingredienti chiave per il successo in questo campo in rapida evoluzione.