DeepSeek의 경제성은 신화입니다. 혁명 AI는 실제로 개발하는 데 16 억 달러가 들었습니다.

작가 : Caleb Mar 16,2025

DeepSeek의 새로운 챗봇은 놀랍게도 유능한 AI를 자랑하며 간단하면서도 흥미로운 진술을 소개합니다. "안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 답을 얻을 수 있습니다."

이 AI는 빠르게 주요 선수가되었으며 Nvidia의 주가가 상당한 하락을 일으켰습니다. 성공은 몇 가지 혁신적인 기술을 통합 한 건축 및 교육 방법의 고유 한 조합에서 비롯됩니다.

  • MTP (Multi-Token Prediction) : 전통적인 단어 별 예측과 달리 MTP는 여러 단어를 동시에 예측하여 정확도와 효율성을 크게 향상시킵니다.
  • 전문가 (MOE)의 혼합 : 이 아키텍처는 여러 신경망을 활용하여 입력을 처리하고 교육을 가속화하고 성능을 향상시킵니다. DeepSeek V3는 256 개의 네트워크를 사용하여 각 토큰 당 8 개를 활성화합니다.
  • MLA (Multi-Head Prentent Attention) : MLA는 주요 문장 구성 요소에 반복적으로 중점을 두어 중요한 세부 사항을 놓치지 않도록하여 입력에 대한 미묘한 이해로 이어집니다.

Deepseek 테스트

이미지 : ensigame.com

중국 헤지 펀드 High-Flyer의 자회사 인 Deepseek은 처음에는 강력한 Deepseek V3 Neural Network를 2048 GPU를 사용하여 6 백만 달러에 불과했다고 주장했습니다. 그러나 Semianalysis는 여러 데이터 센터에 분포 된 10,000 H800, 10,000 H100 및 추가 H20을 포함하여 약 50,000 NVIDIA HOPPER GPU를 포함하여 훨씬 더 실질적인 인프라를 나타 냈습니다. 이는 약 16 억 달러의 서버 투자와 9 억 9,400 만 달러로 추정되는 운영 비용으로 이어집니다.

Deepseek V3

이미지 : ensigame.com

DeepSeek은 클라우드 컴퓨팅에 의존하는 많은 신생 기업과 달리 데이터 센터를 소유하여 더 큰 제어력과 더 빠른 혁신 구현을 제공합니다. 자체 자금 지원 상태는 민첩성과 의사 결정을 더욱 향상시킵니다. 이 회사의 인재에 대한 약속은 또한 주목할 만하며, 일부 연구자들은 매년 130 만 달러 이상을 벌어 중국 대학에서 최고 졸업생을 끌어 들이고 있습니다. 따라서 초기 6 백만 달러의 수치는 사전 훈련 GPU 비용을 반영하고 총 투자가 5 억 달러를 초과하는 과소 평가합니다.

Deepseek

이미지 : ensigame.com

DeepSeek의 린 구조는 더 큰 관료적 회사에 비해 효율적인 혁신을 허용하지만, 성공은 실질적인 투자, 기술 혁신 및 고도로 숙련 된 팀과 관련이 없습니다. 따라서 "혁명 예산"청구는 상당한 자격이 필요합니다. 그럼에도 불구하고 DeepSeek의 비용은 경쟁 업체보다 훨씬 저렴합니다. 예를 들어, DeepSeek은 Chatgpt의 chatgpt4o에 대한 1 억 달러에 비해 R1에 5 백만 달러를 소비했습니다.

Deepseek

이미지 : ensigame.com

Deepseek의 이야기는 기존 거인들과 효과적으로 경쟁 할 수있는 잘 자금을 지원하고 독립적 인 AI 회사의 잠재력을 강조합니다. 그러나 그것은 또한 상당한 투자, 최첨단 기술 및 탁월한 인재가 빠르게 진화하는 분야에서 성공하기위한 핵심 요소라는 현실을 강조합니다.