Nvidia выпускает "суперчипы", чтобы выжать из AI все соки

18.03.2025, 20:45:47ИТ
Nvidia выпускает "суперчипы", чтобы выжать из AI все соки

Nvidia анонсировала Blackwell Ultra GB300 и Vera Rubin, свои новые "суперчипы" для искусственного интеллекта. Теперь компания зарабатывает по $2,300 каждые секунды благодаря революции AI. Ее бизнес в области центров обработки данных настолько гигантский, что даже сетевое оборудование приносит больше денег, чем игровые графические процессоры. Теперь компания представляет AI графические процессоры, которые, как она надеется, помогут сохранить свое лидерство: Blackwell Ultra GB300, который начнет поставляться во второй половине этого года, Vera Rubin, который появится во второй половине следующего года, и Rubin Ultra, который выйдет во второй половине 2027 года.

В этом году Blackwell Ultra не совсем такой, каким мы его ожидали, когда Nvidia заявила в прошлом году, что начнет производство новых чипов AI с годовой периодичностью – быстрее, чем когда-либо. Но сегодня Nvidia быстро перешла от Blackwell Ultra на презентации GDC, чтобы представить свою следующую архитектуру, Vera Rubin, полная стойка которой должна предложить производительность в 3.3 раза выше, чем у аналогичной Blackwell Ultra.

Nvidia не делает это простым делом: необходимо понять, насколько Blackwell Ultra лучше оригинального Blackwell. На предварительной встрече с журналистами Nvidia раскрыла, что один Ultra чип предложит те же 20 пет флопс AI-производительности, как и Blackwell, но теперь с 288 ГБ памяти HBM3e вместо 192 ГБ. Тем временем, кластер Blackwell Ultra DGX GB300 “Superpod” предложит те же 288 ЦП, 576 ГП и 11.5 эксафлопс вычислений FP4, что и версия Blackwell, но с 300 ТБ памяти вместо 240 ТБ.

В основном, Nvidia сравнила свой новый Blackwell Ultra с H100 – чипом 2022 года, который изначально построил состояние Nvidia в сфере AI и который, вероятно, многие компании захотят обновить. Nvidia утверждает, что этот чип предлагает 1.5x большую FP4 инференцию и может значительно ускорить «AI reasoning» – NVL72 кластер может запускать интерактивную копию DeepSeek-R1 671B, которая может предоставить ответы всего за десять секунд вместо 1.5 минут, как у H100. Nvidia говорит, что это связано с тем, что он может обрабатывать 1,000 токенов в секунду, в десять раз больше, чем у чипов Nvidia 2022 года.

Но одна интригующая особенность заключается в том, что некоторые компании смогут купить один чип Blackwell Ultra: Nvidia анонсировала настольный компьютер под названием DGX Station с одним GB300 Blackwell Ultra, 784 ГБ унифицированной системной памяти, встроенной сетевой мощностью 800 Гбит/с от Nvidia и обещанными 20 пет флопс AI-производительности. Asus, Dell и HP присоединятся к Boxx, Lambda и Supermicro в продаже версий настольного компьютера.

Nvidia также предложит одну стойку под названием GB300 NVL72, которая предлагает 1.1 эксафлопс FP4, 20 ТБ памяти HBM, 40 ТБ «быстрой памяти», 130 ТБ/с ширины полосы NVLink и 14.4 ТБ/с на сетевом уровне.

Но Vera Rubin и Rubin Ultra могут значительно улучшить эту производительность, когда они появятся в 2026 и 2027 годах. Rubin имеет 50 пет флопов FP4, увеличившись с 20 пет флопов в Blackwell. Rubin Ultra будет иметь чип, фактически состоящий из двух соединенных GPU Rubin, с удвоенной производительностью в 100 пет флопов FP4 и почти в четыре раза большей памятью в 1 ТБ.

Полная стойка NVL576 Rubin Ultra заявляет, что предлагает 15 эксафлопс FP4 инференции и 5 эксафлопс FP8 тренировки, и, как утверждает Nvidia, это 14x производительности стойки Blackwell Ultra, которая будет поставляться в этом году. Получите другие спецификации, увеличив изображения ниже:

Nvidia заявляет, что уже поставила чипов Blackwell на сумму 11 миллиардов долларов; только четыре главных покупателя приобрели 1.8 миллиона чипов Blackwell до сих пор в 2025 году.

Nvidia продвигает эти новые чипы – и все свои AI чипы – как жизненно важные для будущего вычислений. И пытается сегодня аргументировать, что компаниям будет нужно все больше и больше вычислительной мощности, а не меньше, как некоторые предполагали после того, как DeepSeek потряс инвесторское мнение и отправил акции Nvidia вниз. На конференции Nvidia GPU Technology основатель и CEO Дженсен Хуанг говорит, что индустрии нужно «в 100 раз больше, чем мы думали, нам нужно было в это время в прошлом году», чтобы справиться с спросом.

Хуанг говорит, что следующая архитектура Nvidia после Vera Rubin, ожидаемая в 2028 году, будет названа Фейнманом – предположительно в честь Ричарда Фейнмана, знаменитого теоретического физика. Он отметил, что некоторые из семьи известной астронома Веры Рубин были в аудитории сегодня.

Поделиться