ความสามารถในการจ่ายของ Deepseek เป็นตำนาน: AI ปฏิวัติจริง ๆ แล้วมีค่าใช้จ่าย 1.6 พันล้านเหรียญสหรัฐในการพัฒนา
Chatbot ใหม่ของ Deepseek มี AI ที่มีความสามารถอย่างน่าประหลาดใจแนะนำตัวเองด้วยคำพูดที่เรียบง่าย แต่น่าสนใจ: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ"
AI นี้ได้กลายเป็นผู้เล่นหลักอย่างรวดเร็วแม้จะทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมีนัยสำคัญ ความสำเร็จของมันเกิดจากการผสมผสานที่เป็นเอกลักษณ์ของสถาปัตยกรรมและวิธีการฝึกอบรมผสมผสานเทคโนโลยีนวัตกรรมหลายอย่าง:
- การทำนายแบบมัลติเทน (MTP): ซึ่งแตกต่างจากการทำนายคำต่อคำแบบดั้งเดิม MTP คาดการณ์หลายคำพร้อมกันปรับปรุงทั้งความแม่นยำและประสิทธิภาพอย่างมีนัยสำคัญ
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): สถาปัตยกรรมนี้ใช้ประโยชน์จากเครือข่ายประสาทหลายแห่งเพื่อประมวลผลอินพุตเร่งการฝึกอบรมและเพิ่มประสิทธิภาพ Deepseek V3 ใช้ 256 เครือข่ายเปิดใช้งานแปดสำหรับแต่ละโทเค็น
- ความสนใจแฝงหลายหัว (MLA): MLA มุ่งเน้นไปที่ส่วนประกอบประโยคสำคัญซ้ำ ๆ เพื่อให้แน่ใจว่ารายละเอียดที่สำคัญไม่พลาดนำไปสู่ความเข้าใจที่เหมาะสมยิ่งขึ้นของอินพุต
รูปภาพ: Ensigame.com
Deepseek ซึ่งเป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงจีนที่สูงกว่าอ้างว่าได้ฝึกอบรมเครือข่ายประสาท Deepseek V3 ที่ทรงพลังเพียง 6 ล้านเหรียญสหรัฐโดยใช้ GPU ในปี 2048 อย่างไรก็ตาม Semianalysis เปิดเผยโครงสร้างพื้นฐานที่สำคัญยิ่งกว่า: ประมาณ 50,000 Nvidia Hopper GPU รวมถึง 10,000 H800S, 10,000 H100s และ H20 เพิ่มเติมกระจายไปทั่วศูนย์ข้อมูลหลายแห่ง สิ่งนี้แปลว่าการลงทุนเซิร์ฟเวอร์ประมาณ 1.6 พันล้านเหรียญสหรัฐและค่าใช้จ่ายในการดำเนินงานประมาณ $ 944 ล้าน
รูปภาพ: Ensigame.com
ซึ่งแตกต่างจาก startups จำนวนมากที่อาศัยอยู่ในคลาวด์คอมพิวติ้ง Deepseek เป็นเจ้าของศูนย์ข้อมูลให้การควบคุมที่มากขึ้นและการใช้นวัตกรรมที่เร็วขึ้น สถานะที่ได้รับการสนับสนุนตนเองช่วยเพิ่มความคล่องตัวและการตัดสินใจ ความมุ่งมั่นของ บริษัท ที่มีต่อความสามารถก็มีความโดดเด่นเช่นกันโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีดึงดูดผู้สำเร็จการศึกษาชั้นนำจากมหาวิทยาลัยจีนชั้นนำ ดังนั้นตัวเลขเริ่มต้นที่ 6 ล้านดอลลาร์จึงสะท้อนให้เห็นถึงค่าใช้จ่าย GPU ก่อนการฝึกอบรมก่อนและมีการแสดงผลการลงทุนทั้งหมดเกินกว่า 500 ล้านดอลลาร์อย่างมีนัยสำคัญ
รูปภาพ: Ensigame.com
ในขณะที่โครงสร้างลีนของ Deepseek ช่วยให้นวัตกรรมมีประสิทธิภาพเมื่อเทียบกับ บริษัท ที่มีขนาดใหญ่ขึ้นและมีระบบราชการมากขึ้นความสำเร็จของมันคือการเชื่อมโยงอย่างปฏิเสธไม่ได้กับการลงทุนที่สำคัญการพัฒนาทางเทคโนโลยีและทีมที่มีทักษะสูง ดังนั้นการเรียกร้อง "งบประมาณปฏิวัติ" จึงต้องการคุณสมบัติที่สำคัญ อย่างไรก็ตามค่าใช้จ่ายของ Deepseek ยังคงต่ำกว่าคู่แข่งอย่างมีนัยสำคัญ ตัวอย่างเช่น Deepseek ใช้จ่าย $ 5 ล้านใน R1 เมื่อเทียบกับ $ 100 ล้านของ CHATGPT สำหรับ CHATGPT4O
รูปภาพ: Ensigame.com
เรื่องราวของ Deepseek เน้นถึงศักยภาพของ บริษัท AI ที่ได้รับการสนับสนุนและได้รับการสนับสนุนอย่างดีเพื่อแข่งขันกับยักษ์ใหญ่ที่จัดตั้งขึ้นอย่างมีประสิทธิภาพ อย่างไรก็ตามมันยังเน้นย้ำความเป็นจริงที่ว่าการลงทุนที่สำคัญเทคโนโลยีที่ทันสมัยและความสามารถพิเศษเป็นส่วนผสมสำคัญสำหรับความสำเร็จในสาขาที่พัฒนาอย่างรวดเร็วนี้








