Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Tác giả : Caleb Mar 16,2025

Chatbot mới của Deepseek tự hào có một AI có khả năng đáng ngạc nhiên, tự giới thiệu với tuyên bố đơn giản nhưng hấp dẫn: "Xin chào, tôi đã được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên."

AI này đã nhanh chóng trở thành một người chơi chính, thậm chí gây ra sự sụt giảm đáng kể về giá cổ phiếu của NVIDIA. Thành công của nó bắt nguồn từ sự kết hợp độc đáo giữa kiến ​​trúc và phương pháp đào tạo, kết hợp một số công nghệ sáng tạo:

  • Dự đoán đa điểm (MTP): Không giống như dự đoán từng từ truyền thống, MTP dự báo đồng thời nhiều từ, cải thiện đáng kể cả độ chính xác và hiệu quả.
  • Hỗn hợp các chuyên gia (MOE): Kiến trúc này tận dụng nhiều mạng lưới thần kinh để xử lý đầu vào, tăng tốc đào tạo và tăng hiệu suất. DeepSeek V3 sử dụng 256 mạng, kích hoạt tám mạng cho mỗi mã thông báo.
  • Sự chú ý tiềm ẩn đa đầu (MLA): MLA liên tục tập trung vào các thành phần câu chính, đảm bảo không bỏ lỡ các chi tiết quan trọng, dẫn đến sự hiểu biết nhiều sắc thái hơn về đầu vào.

DeepSeek Test

Hình ảnh: Ensigame.com

Deepseek, một công ty con của Quỹ phòng hộ Trung Quốc High Flyer, ban đầu tuyên bố đã đào tạo mạng lưới thần kinh Deepseek V3 mạnh mẽ của mình chỉ với 6 triệu đô la sử dụng GPU 2048. Tuy nhiên, bán phân giải cho thấy cơ sở hạ tầng đáng kể hơn nhiều: khoảng 50.000 GPU phễu NVIDIA, bao gồm 10.000 H800, 10.000 H100 và H20 bổ sung, được phân phối trên nhiều trung tâm dữ liệu. Điều này có nghĩa là đầu tư máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động ước tính là 944 triệu đô la.

Deepseek v3

Hình ảnh: Ensigame.com

Không giống như nhiều công ty khởi nghiệp dựa vào điện toán đám mây, Deepseek sở hữu các trung tâm dữ liệu của mình, cung cấp quyền kiểm soát lớn hơn và triển khai đổi mới nhanh hơn. Tình trạng tự tài trợ của nó giúp tăng cường hơn nữa sự nhanh nhẹn và ra quyết định. Cam kết của công ty đối với tài năng cũng đáng chú ý, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, thu hút sinh viên tốt nghiệp hàng đầu từ các trường đại học hàng đầu Trung Quốc. Do đó, con số 6 triệu đô la ban đầu chỉ phản ánh chi phí GPU trước khi đào tạo và đánh giá thấp đáng kể tổng số tiền đầu tư vượt quá 500 triệu đô la.

Deepseek

Hình ảnh: Ensigame.com

Mặc dù cấu trúc tinh gọn của Deepseek cho phép đổi mới hiệu quả so với các công ty lớn hơn, quan liêu hơn, thành công của nó không thể phủ nhận với đầu tư đáng kể, đột phá công nghệ và một nhóm có tay nghề cao. Yêu cầu "Ngân sách cách mạng", do đó, cần trình độ đáng kể. Tuy nhiên, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh. Ví dụ, Deepseek đã chi 5 triệu đô la cho R1, so với 100 triệu đô la của TATGPT cho TATGPT4O.

Deepseek

Hình ảnh: Ensigame.com

Câu chuyện của Deepseek nhấn mạnh tiềm năng của một công ty AI độc lập được tài trợ tốt để cạnh tranh hiệu quả với những người khổng lồ đã thành lập. Tuy nhiên, nó cũng nhấn mạnh thực tế rằng đầu tư đáng kể, công nghệ tiên tiến và tài năng đặc biệt là những thành phần quan trọng để thành công trong lĩnh vực phát triển nhanh chóng này.