Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang

Pengarang : Caleb Mar 16,2025

Chatbot baru Deepseek mempunyai AI yang berkebolehan, memperkenalkan dirinya dengan pernyataan yang mudah namun menarik: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda."

AI ini dengan cepat menjadi pemain utama, bahkan menyebabkan penurunan yang ketara dalam harga saham Nvidia. Kejayaannya berpunca daripada gabungan unik seni bina dan kaedah latihan, menggabungkan beberapa teknologi inovatif:

  • Ramalan Multi-Token (MTP): Tidak seperti ramalan kata-kata tradisional, MTP meramalkan pelbagai perkataan secara serentak, dengan ketara meningkatkan ketepatan dan kecekapan.
  • Campuran Pakar (MOE): Senibina ini memanfaatkan pelbagai rangkaian saraf untuk memproses input, mempercepatkan latihan dan meningkatkan prestasi. DeepSeek V3 menggunakan 256 rangkaian, mengaktifkan lapan untuk setiap token.
  • Perhatian Laten Multi-Head (MLA): MLA berulang kali memberi tumpuan kepada komponen kalimat utama, memastikan butiran penting tidak terlepas, yang membawa kepada pemahaman yang lebih nuanced tentang input.

Ujian DeepSeek

Imej: ensigame.com

Deepseek, anak syarikat dana lindung nilai Cina yang tinggi, pada mulanya mendakwa telah melatih rangkaian saraf Deepseek V3 yang kuat untuk hanya $ 6 juta menggunakan 2048 GPU. Walau bagaimanapun, semianalisis mendedahkan infrastruktur yang jauh lebih besar: kira -kira 50,000 GPU NVIDIA Hopper, termasuk 10,000 H800s, 10,000 H100s, dan H20 tambahan, diedarkan di pelbagai pusat data. Ini diterjemahkan kepada pelaburan pelayan kira -kira $ 1.6 bilion dan perbelanjaan operasi yang dianggarkan sebanyak $ 944 juta.

DeepSeek V3

Imej: ensigame.com

Tidak seperti banyak pemula yang bergantung kepada pengkomputeran awan, DeepSeek memiliki pusat datanya, memberikan kawalan yang lebih besar dan pelaksanaan inovasi yang lebih cepat. Status yang dibiayai sendiri terus meningkatkan ketangkasan dan membuat keputusan. Komitmen syarikat terhadap bakat juga terkenal, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, menarik graduan teratas dari universiti -universiti China yang terkemuka. Oleh itu, angka awal $ 6 juta hanya mencerminkan kos GPU pra-latihan dan secara signifikan di bawah jumlah pelaburan melebihi $ 500 juta.

Deepseek

Imej: ensigame.com

Walaupun struktur Lean Deepseek membolehkan inovasi yang cekap berbanding dengan syarikat birokrasi yang lebih besar, kejayaannya tidak dapat dinafikan dikaitkan dengan pelaburan yang besar, terobosan teknologi, dan pasukan yang sangat mahir. Oleh itu, tuntutan "belanjawan revolusioner" memerlukan kelayakan yang signifikan. Walau bagaimanapun, kos DeepSeek kekal jauh lebih rendah daripada pesaing. Sebagai contoh, DeepSeek membelanjakan $ 5 juta pada R1, berbanding $ 100 juta untuk ChatGPT4O.

Deepseek

Imej: ensigame.com

Kisah DeepSeek menyoroti potensi syarikat AI yang dibiayai dengan baik untuk bersaing dengan gergasi yang mantap. Walau bagaimanapun, ia juga menggariskan realiti bahawa pelaburan yang besar, teknologi canggih, dan bakat yang luar biasa adalah bahan-bahan utama untuk berjaya dalam bidang yang berkembang pesat ini.