Nvidia демонстрирует возможности инференса с помощью Rubin CPX Preview

Прочитано: 463 раз(а)


Хотя король графических процессоров доминирует в области обучения искусственного интеллекта, его будущая доля на рынке центров обработки данных будет зависеть от вывода, который требует иного набора вычислительных инструментов.

 Компания Nvidia расхвалила преимущества вывода своих новых и планируемых к выпуску графических процессоров, поскольку она готовится к переходу от интенсивных рабочих нагрузок по обучению ИИ к более разнообразным потребностям вывода в центрах обработки данных.

Компания Nvidia доминирует на рынке решений для обучения искусственного интеллекта благодаря своим передовым графическим процессорам. Но по мере перехода к задачам логического вывода, где для прогнозирования используются обученные модели, различные сценарии использования потребуют разнообразных кремниевых решений.

Компания Rubin CPX, крупнейший производитель графических процессоров из Санта-Клары, штат Калифорния, представила новый класс графических процессоров, предназначенных для обработки большого объёма контекстной информации. Это позволит системам искусственного интеллекта обрабатывать программный код с объёмом в миллионы токенов и генерировать видео.

Новые устройства также обещают энергоэффективность и высокую производительность для задач вывода, с токенами в размере 5 миллиардов долларов США на каждые 100 миллионов долларов США инвестиций.

Rubin CPX будет работать на новой платформе Nvidia Vera Rubin NVL 144 CPX.

Компания заявила, что ее новая платформа центра обработки данных на базе графических процессоров Blackwell Ultra и готовящихся к выпуску Vera Rubin позволит справиться с самыми требовательными рабочими нагрузками.

Переход к выводу

По мере изменения рыночной конъюнктуры компания Nvidia, вероятно, столкнётся с растущей конкуренцией за своё доминирующее положение на рынке центров обработки данных со стороны компаний, специализирующихся на различных задачах вывода. В связи с этим производитель делает ставку на свои топовые графические процессоры, чтобы обеспечить производительность, необходимую для архитектуры LLM Mixture of Experts (MoE), которая управляет так называемыми « фабриками искусственного интеллекта ».

По данным отчета Markets and Markets, в 2025 году мировой рынок ИИ-инференции оценивался в 106 миллиардов долларов США, а к 2030 году, по прогнозам, он вырастет до 255 миллиардов долларов США .

«Мне нравится, как Nvidia склоняется к логическому выводу, потому что именно в этом направлении движется рынок», — рассказал в интервью Data Center Knowledge Мэтт Кимбалл, вице-президент и главный аналитик Moor Insights & Strategy.

«Рубин — настоящий зверь… точно так же, как Блэквелл был настоящим зверем по сравнению с Хоппером. Вы говорите о том, чтобы сделать вывод более быстрым и масштабным, [и] открыть эти самые окна токенов».

Но, по словам Кимбалла, продукт не ориентирован на среднестатистического корпоративного игрока. «Мы берём Rubin и создаём специализированную часть для вывода, которая действительно ориентирована на высокотехнологичные решения», — сказал он, добавив, что гипермасштабируемые компании и крупные предприятия, вероятно, составят основную часть клиентов Rubin.

«[Rubin CPX] открывает новые возможности для премиум-применения, такие как интеллектуальные системы кодирования и генерация видео», — заявил Шар Нарасимхан, директор по маркетингу ИИ и графических процессоров для центров обработки данных в Nvidia. «Это значительно повысит производительность и эффективность фабрик ИИ».

Повышение производительности вывода Blackwell Ultra

Компания Nvidia также поделилась результатами тестов своей стоечной системы Blackwell Ultra-powered GB300 NVL72 , которая показала в 1,4 раза больше результатов DeepSeek-R1, чем ее предшественница.

Компания заявила, что система также установила рекорды по всем новым тестам производительности центров обработки данных, добавленным в пакет MLPerf Inference v5.1, включая Llama 3.1 405B Interactive, Llama 3.1 8B и Whisper.

«Я очень доволен этими показателями», — заявил Дэйв Сальваторе, директор по продуктам для ускоренных вычислений Nvidia, на пресс-конференции. «И мы ожидаем, что эти показатели со временем будут расти по мере дальнейшей оптимизации программного обеспечения Blackwell Ultra».

По словам Nvidia, результаты тестов Blackwell Ultra демонстрируют потенциал оборудования для повышения производительности фабрик ИИ, увеличения доходов и снижения стоимости владения.

Nvidia демонстрирует возможности инференса с помощью Rubin CPX Preview



Новости партнеров