ИИ-процессор H100 от Nvidia сделал ее многомиллиардной компанией, которая может стоить больше, чем Alphabet и Amazon. Впрочем, компания не намерена останавливаться и собирается расширить свое лидерство с помощью нового графического процессора Blackwell B200 и «суперчипа» GB200.
Nvidia утверждает, что новый графический процессор B200 обеспечивает производительность до 20 петафлопс в FP4 благодаря 208 миллиардам транзисторов. Кроме того, по словам компании, GB200, объединяющий два таких GPU с одним процессором Grace, может обеспечить 30-кратное увеличение производительности при работе с LLM-выводами, а также существенно повысить эффективность. По словам Nvidia, новый процессор снижает стоимость и энергопотребление до 25 раз по сравнению с H100.
Для обучения модели с 1,8 триллиона параметров ранее потребовалось бы 8000 графических процессоров Hopper и 15 мегаватт энергии, утверждает Nvidia. Сегодня это могут сделать 2 000 графических процессоров Blackwell, потребляя всего четыре мегаватта.
Одним из ключевых улучшений является движок трансформации второго поколения, который удваивает вычисления, пропускную способность и размер модели, используя четыре бита для каждого нейрона вместо восьми. Второе ключевое отличие появляется только при соединении огромного количества этих GPU: коммутатор NVLink нового поколения позволяет 576 GPU общаться друг с другом с пропускной способностью 1,8 терабайта в секунду в обоих направлениях.
Разумеется, Nvidia рассчитывает на то, что компании будут покупать большое количество этих GPU, и упаковывает их в более крупные конструкции, такие как GB200 NVL72, который объединяет 36 CPU и 72 GPU в одной стойке с жидкостным охлаждением, обеспечивая в общей сложности 720 петафлопс производительности обучения ИИ или 1 440 петафлопс вычислений. Внутри стойки проложено почти четыре километра кабелей.
Компания утверждает, что Amazon, Google, Microsoft и Oracle уже планируют использовать стойки NVL72 в своих облачных сервисах, хотя пока неясно, сколько именно стоек они купят.