Доступность DeepSeek - это миф: революционный ИИ на самом деле стоит 1,6 миллиарда долларов на разработку
Новый чат -бот DeepSeek может похвастаться удивительно способным ИИ, представляя себя простым, но интригующим утверждением: «Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас».
Этот ИИ быстро стал крупным игроком, даже вызывая значительные падения цен на акции NVIDIA. Его успех связан с уникальным сочетанием архитектуры и методов обучения, включающего несколько инновационных технологий:
- Multi-Token Production (MTP): в отличие от традиционного прогнозирования слов за словесное слово, MTP прогнозирует несколько слов одновременно, значительно повышая как точность, так и эффективность.
- Смесь экспертов (MOE): эта архитектура использует несколько нейронных сетей для обработки ввода, ускорения обучения и повышения производительности. DeepSeek V3 использует 256 сети, активируя восемь для каждого токена.
- Многопользовательское скрытое внимание (MLA): MLA неоднократно фокусируется на компонентах ключевых предложений, гарантируя, что важные детали не пропущены, что приводит к более нюансированному пониманию ввода.
Изображение: Ensigame.com
Deepseek, дочерняя компания китайского хедж-фонда, первоначально утверждала, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов с использованием 2048 графических процессоров. Тем не менее, полуанализа выявил гораздо более существенную инфраструктуру: приблизительно 50 000 графических процессоров Nvidia, включая 10 000 H800, 10 000 H100 и дополнительные H20, распределенные по нескольким центрам обработки данных. Это приводит к инвестициям в сервер в размере примерно 1,6 миллиарда долларов, а эксплуатационные расходы оцениваются в 944 миллиона долларов.
Изображение: Ensigame.com
В отличие от многих стартапов, полагающихся на облачные вычисления, Deepseek владеет своими центрами обработки данных, обеспечивая больший контроль и более быструю реализацию инноваций. Его самофинансируемый статус еще больше повышает ловкость и принятие решений. Приверженность компании талантам также заметна, когда некоторые исследователи зарабатывают более 1,3 миллиона долларов в год, привлекая лучших выпускников из ведущих китайских университетов. Первоначальный показатель в 6 миллионов долларов США, следовательно, отражает только предварительные затраты на графический процессор и значительно недооценивает общую сумму инвестиций, превышающих 500 миллионов долларов.
Изображение: Ensigame.com
В то время как Lean Structure Deepseek позволяет эффективно инновациям по сравнению с более крупными, более бюрократическими компаниями, ее успех, несомненно, связан с существенными инвестициями, технологическими прорывами и высококвалифицированной командой. Следовательно, требование «революционного бюджета» требует значительной квалификации. Тем не менее, затраты DeepSeek остаются значительно ниже, чем конкуренты. Например, Deepseek потратил 5 миллионов долларов на R1 по сравнению с Catgpt 100 миллионов долларов на Chatgpt4o.
Изображение: Ensigame.com
История Deepseek подчеркивает потенциал хорошо финансируемой независимой компании ИИ для эффективной конкуренции с известными гигантами. Тем не менее, это также подчеркивает реальность того, что существенные инвестиции, передовые технологии и исключительные таланты являются ключевыми ингредиентами для успеха в этой быстро развивающейся области.








