Стартап DeepSeek обошел Nvidia, использовав на 95% меньше чипов для достижения скорости

Конкурент Nvidia утверждает, что DeepSeek установил мировой рекорд, достигнув первой в отрасли производительности с использованием на 95% меньшего количества чипов. Китайский стартап в сфере ИИ DeepSeek очень быстро завоевал популярность в 2025 году, благодаря своей модели открытого исходного кода R1, созданной для выполнения сложных аналитических задач, которая показала результаты на уровне лучших моделей в отрасли, оставаясь более экономически эффективной.

Компания SambaNova Systems, основанная в 2017 году экспертами из Sun/Oracle и Стэнфордского университета, объявила о том, что она, по ее утверждению, осуществила самое быстрое развёртывание языка DeepSeek-R1 с 671 миллиардом параметров на сегодняшний день.

Компания заявляет, что достигла 198 токенов в секунду на пользователя, используя всего 16 специализированных чипов, заменив 40 стоек с 320 графическими процессорами Nvidia, которые обычно были бы необходимы.

"С помощью чипа SN40L RDU, SambaNova предоставляет самую быструю платформу для работы с DeepSeek," сказал Родриго Лиан, генеральный директор и соучредитель SambaNova. "Скорость увеличится до 5 раз быстрее, чем скорость последних GPU на одной стойке - и к концу года мы предложим capacidad DeepSeek-R1 в 100 раз больше."

Хотя графические процессоры Nvidia традиционно использовались для обработки крупных задач ИИ, SambaNova утверждает, что их конфигурируемая архитектура передачи данных предлагает более эффективное решение. Компания утверждает, что их оборудование обеспечивает в три раза большую скорость и в пять раз большую эффективность по сравнению с ведущими графическими процессорами при сохранении полной мощи рассуждений DeepSeek-R1.

"DeepSeek-R1 - одна из самых современных моделей ИИ, но ее полный потенциал был ограничен неэффективностью графических процессоров," сказал Лиан. "Сегодня это меняется. Мы приносим следующий крупный прорыв - сокращая расходы на вывод и снижая потребность в оборудовании с 40 стоек до лишь одной - чтобы представить DeepSeek-R1 на самых быстрых скоростях, эффективно."

Джордж Кэмерон, соучредитель компании по оценке ИИ Artificial Analysis, сказал, что его компания "независимо протестировала облачное развёртывание SambaNova полной модели DeepSeek-R1 Mixture of Experts с 671 миллиардом параметров на скорости более 195 токенов/с, что является самой быстрой выходной скоростью, которую мы когда-либо измеряли для DeepSeek-R1. Высокие выходные скорости особенно важны для моделей рассуждений, поскольку эти модели используют токены выходных рассуждений для повышения качества своих ответов. Высокие выходные скорости SambaNova поддержат использование моделей рассуждений в чувствительных к задержкам случаях применения."

DeepSeek-R1 671B теперь доступен на SambaNova Cloud с доступом к API для избранных пользователей. Компания быстро увеличивает свою мощность и надеется достичь 20 000 токенов в секунду общих показателей стойки "в ближайшем будущем."

Стартап DeepSeek обошел Nvidia, использовав на 95% меньше чипов для достижения скорости

Похожие материалы