Die Erschwinglichkeit von Deepseek ist ein Mythos: Die revolutionäre KI kostet tatsächlich 1,6 Milliarden US -Dollar für die Entwicklung
Deepseeks neuer Chatbot bietet eine überraschend fähige KI und stellt sich mit der einfachen, aber faszinierenden Aussage vor: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten, die Sie sogar überraschen könnte."
Diese KI ist schnell zu einem wichtigen Spieler geworden und führt sogar zu erheblichen Rückgängen des Nvidia -Aktienkurs. Der Erfolg beruht auf einer einzigartigen Kombination aus Architektur- und Trainingsmethoden mit mehreren innovativen Technologien:
- Multi-Token-Vorhersage (MTP): Im Gegensatz zur herkömmlichen Wort für Wortvorhersage prognostiziert MTP mehrere Wörter gleichzeitig und verbessert sowohl die Genauigkeit als auch die Effizienz signifikant.
- Mischung von Experten (MOE): Diese Architektur nutzt mehrere neuronale Netze, um Input zu verarbeiten, Schulungen zu beschleunigen und die Leistung zu steigern. Deepseek V3 verwendet 256 Netzwerke und aktiviert acht für jedes Token.
- Multi-Head Latent Achtung (MLA): MLA konzentriert sich wiederholt auf wichtige Satzkomponenten und stellt sicher, dass entscheidende Details nicht übersehen werden, was zu einem nuancierteren Verständnis der Eingabe führt.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft des Chinesischen Hedgefonds-High-Flyer, behauptete zunächst, sein leistungsstarkes Neuralnetz von Deepseek V3 für nur 6 Millionen US-Dollar mit 2048 GPUs ausgebildet zu haben. Die semianalyse ergab jedoch eine weitaus umfangreichere Infrastruktur: ca. 50.000 NVIDIA Hopper -GPUs, einschließlich 10.000 H800, 10.000 H100s und zusätzliche H20S, die über mehrere Datenzentren verteilt sind. Dies führt zu einer Serverinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten, die auf 944 Mio. USD geschätzt werden.
Bild: Ensigame.com
Im Gegensatz zu vielen Startups, die sich auf Cloud Computing verlassen, besitzt Deepseek seine Rechenzentren und bietet eine größere Kontrolle und eine schnellere Implementierung von Innovationen. Sein selbstfinanzierter Status verbessert die Beweglichkeit und Entscheidungsfindung weiter. Das Engagement des Unternehmens für Talente ist ebenfalls bemerkenswert. Einige Forscher verdienen jährlich über 1,3 Millionen US -Dollar und ziehen Top -Absolventen der führenden chinesischen Universitäten an. Der anfängliche Wert von 6 Mio. USD spiegelt daher nur die GPU-Kosten vor der Training wider und unterwirft die Gesamtinvestition von mehr als 500 Mio. USD erheblich.
Bild: Ensigame.com
Während Deepseeks Lean -Struktur im Vergleich zu größeren, bürokratischeren Unternehmen effiziente Innovationen ermöglicht, ist ihr Erfolg unbestreitbar mit erheblichen Investitionen, technologischen Durchbrüchen und einem hochqualifizierten Team verbunden. Die Behauptung des "revolutionären Haushalts" benötigt daher erhebliche Qualifikation. Trotzdem bleiben die Kosten von Deepseek deutlich niedriger als die Konkurrenten. Zum Beispiel gab Deepseek 5 Millionen US -Dollar für R1 aus, verglichen mit Chatgpts 100 Millionen US -Dollar für Chatgpt4O.
Bild: Ensigame.com
Die Geschichte von Deepseek unterstreicht das Potenzial eines gut finanzierten, unabhängigen KI-Unternehmens, effektiv mit etablierten Riesen zu konkurrieren. Es unterstreicht jedoch auch die Realität, dass erhebliche Investitionen, modernste Technologien und außergewöhnliche Talente wichtige Bestandteile für den Erfolg in diesem sich schnell entwickelnden Bereich sind.








