Nvidia представила платформу искусственного интеллекта Vera Rubin

Генеральный директор Nvidia Дженсен Хуанг представил платформу искусственного интеллекта Groq на пять стоек для агентного анализа, повысил прогноз выручки до 1 триллиона долларов к 2027 году и наметил путь развития орбитальных центров обработки данных.

Компания Nvidia представила инфраструктурную платформу искусственного интеллекта Vera Rubin, вертикально интегрированную систему, предназначенную для обеспечения работы всех этапов развития ИИ, включая следующую волну агентного вывода. Компания также представила планы по расширению своей инфраструктуры ИИ на орбиту, обозначив путь к созданию будущих центров обработки данных в космосе.

Генеральный директор Nvidia Дженсен Хуанг представил дорожную карту развития во время двухчасовой презентации в SAP Center в Сан-Хосе, открывшей конференцию GTC 2026, сочетая масштабное технологическое видение с оптимистичным финансовым прогнозом. В прошлом году он прогнозировал продажи в размере 500 миллиардов долларов до 2026 года благодаря успеху графических процессоров Blackwell и Rubin , а теперь повысил этот прогноз до 1 триллиона долларов до 2027 года, сославшись на стремительно растущую экономическую эффективность инференции.

«Наконец, ИИ способен выполнять продуктивную работу, и поэтому наступил переломный момент в области вывода», — сказал Хуанг участникам GTC. «Теперь ИИ должен думать. А чтобы думать, он должен делать выводы. Теперь ИИ должен делать . А чтобы делать, он должен делать выводы. Каждый раз, когда ему приходится рассуждать… чтобы генерировать токены, ему приходится делать выводы. Сейчас это уже далеко за пределами обучения».

Хуанг сказал, что спрос на вычислительные ресурсы вырос в 10 000 раз за последние два года, а использование, вероятно, увеличилось в 100 раз. «Это чувство, которое испытывают все», — сказал он. «Это чувство, которое испытывает каждый стартап. Это чувство, которое испытывает OpenAI. Это чувство, которое испытывает Anthropic… Если бы они просто смогли увеличить мощности, они могли бы генерировать больше токенов, [и] их доходы выросли бы».

Пятиуровневая платформа для агентного ИИ

Vera Rubin — это самая комплексная на сегодняшний день система от Nvidia, объединяющая пять стоечных систем в единый суперкомпьютер для искусственного интеллекта. Это также первый продукт, в который интегрирован Groq после лицензионного соглашения Nvidia от декабря 2025 года , что позволяет использовать процессоры Groq с низкой задержкой для выполнения вычислений в реальном времени с большим контекстом.

По словам руководителей Nvidia, платформа Vera Rubin включает в себя:

Стойки для графических процессоров NVL72, объединяющие 72 графических процессора Rubin и 36 центральных процессоров Vera;

Стойки для процессоров Vera с 256 жидкостно охлаждаемыми процессорами Vera, предназначенные для задач агентного искусственного интеллекта и обучения с подкреплением;

Стойки ускорителей вывода Nvidia Groq 3 LPX с 256 LPU-процессорами для агентных систем с низкой задержкой и большим контекстом;

Стеллажи для хранения данных BlueField-4 DPU; и

Сетевые стойки Spectrum-6 SPX Ethernet с конфигурацией, поддерживающей коммутацию либо Quantum-X800 InfiniBand, либо Spectrum-X Ethernet.

«Когда мы думаем о Vera Rubin, мы представляем себе всю систему целиком, вертикально интегрированную с помощью программного обеспечения, расширенную от начала до конца и оптимизированную как единая гигантская система», — сказал Хуанг.

Аналитик Мэтт Кимбалл из Moor Insights & Strategy охарактеризовал эту конструкцию как преднамеренное разделение, учитывающее разнообразие рабочих нагрузок при выполнении вычислений.

«Вычисления — это не универсальная задача, подходящая для всех», — сказал Кимбалл изданию. «Они ненавязчиво признают, что их графические процессоры не являются решением для каждой отдельной задачи, особенно в случае с агентным ИИ. Именно поэтому они используют Groq в своих системах».

Эта стратегия отражает стремление Nvidia выйти на быстрорастущий рынок решений для машинного обучения, где усиливающаяся конкуренция между крупными облачными провайдерами и стартапами, специализирующимися на разработке специализированных чипов, становится всё более острой.

Внутри платформы Веры Рубин

Иэн Бак, вице-президент Nvidia по гипермасштабным и высокопроизводительным вычислениям, заявил во время брифинга для СМИ, что Vera Rubin создана для ускорения четырех этапов развития ИИ: масштабного предварительного обучения, тонкой настройки после обучения, масштабирования на этапе тестирования (которое применяет дополнительные вычислительные ресурсы на этапе вывода для повышения качества рассуждений) и нового этапа, который он назвал «агентным масштабированием», на котором системы ИИ взаимодействуют с другими системами и инструментами ИИ.

Бак изложил несколько заявлений о своих характеристиках:

Стойки с графическими процессорами NVL72 позволяют обучать модели, используя в четыре раза меньше графических процессоров по сравнению с предыдущей платформой Blackwell, и обеспечивают в 10 раз более высокую пропускную способность на ватт при в десять раз меньшей стоимости токена.

Стойки Groq 3 LPX, развернутые совместно с NVL72, ускоряют декодирование за счет совместного вычисления каждого слоя для каждого выходного токена, повышая скорость генерации ответов для агентных систем. Доступность стоек Groq 3 LPX запланирована на вторую половину 2026 года.

Процессоры Vera — преемники Nvidia Grace — обеспечивают вдвое большую энергоэффективность и втрое большую пропускную способность памяти на ядро по сравнению с процессорами x86, а их поступление в продажу запланировано на вторую половину 2026 года. Бак подчеркнул, что графические процессоры и центральные процессоры играют взаимодополняющие роли в рабочих процессах агентов, при этом центральные процессоры обрабатывают такие задачи, как вызов инструментов, SQL-запросы и компиляция кода.

В стойках хранения BlueField-4 STX представлена архитектура хранения данных, изначально разработанная для искусственного интеллекта, которая, по утверждению Nvidia, обеспечивает в четыре раза большую производительность на ватт; Nvidia предоставляет эталонную архитектуру для внедрения партнерами по хранению данных.

Пятая стойка, Spectrum-6 SPX, обеспечивает низколатентное и высокоскоростное соединение между стойками, объединяя всю систему.

Карл Фройнд, основатель и главный аналитик Cambrian AI Research, заявил, что интеграция Groq важна, но ее более широкое значение носит стратегический характер.

«Я думаю, что более важная новость заключается в фундаментальном сдвиге, который Nvidia вносит, чтобы занять лидирующие позиции в области агентного ИИ», — сказал Фройнд изданию. Пятистоечная архитектура, добавил он, позволяет клиентам адаптировать инфраструктуру, сопоставляя рабочие нагрузки с наиболее подходящими процессорами и сетями.

Экономическое обоснование: больше токенов, больше уровней

В ходе основного доклада Хуан привел финансовые аргументы в пользу Vera Rubin, используя гипотетическую фабрику ИИ мощностью 1 ГВт. Он отметил, что услуги ИИ обычно имеют многоуровневую ценовую политику — например, бесплатный, средний, высокий и премиум — и заявил, что на каждом уровне Vera Rubin может генерировать больше токенов, чем предыдущие системы Blackwell и Hopper.

Хуанг заявил, что объединение стоек Vera Rubin со стойками Groq LPX создает возможность получения годового дохода в размере 300 миллиардов долларов — вдвое больше, чем у одной только Vera Rubin, и в 10 раз больше, чем у Blackwell. Это также позволяет создать дополнительный сверхвысокий уровень обслуживания, что может принести дополнительный доход компаниям, занимающимся искусственным интеллектом. В целом, по его словам, на заводе мощностью 1 ГВт генерация токенов может вырасти с примерно 2 миллионов токенов в секунду на системе Hopper до около 700 миллионов токенов в секунду на системе Vera Rubin. Это увеличение в 350 раз снижает стоимость одного токена, одновременно повышая пропускную способность.

Аналитики предупредили, что сценарии роста выручки зависят от спроса покупателей на премиальные уровни. Аналитик Futurum Group Брендан Берк отметил, что предполагаемая цена ультра-уровня в 150 долларов за миллион токенов представляет собой 50-кратный скачок по сравнению со средним уровнем в 3 доллара за миллион токенов.

«Компания по-прежнему зависит от клиентов, работающих на уровне приложений, чтобы оправдать 50-кратное повышение цены токенов, которое Дженсен обозначил как цель объединения систем Rubin и Groq», — сказал Берк изданию.

Вывод инфраструктуры искусственного интеллекта на орбиту

Компания Nvidia также представила предварительные результаты работы над космическим модулем Nvidia Vera Rubin, работающим на базе графического процессора Rubin, что является частью долгосрочной концепции орбитальных центров обработки данных . Хуанг отметил, что технологии Nvidia уже используются на спутниках, но создание центров обработки данных в космосе сопряжено с уникальными трудностями.

«Мы работаем с нашими партнерами… Конечно, в космосе нет теплопроводности и конвекции, есть только излучение, поэтому нам нужно выяснить, как охлаждать эти системы в космосе», — отметил он, добавив, что инженеры Nvidia сосредоточены на решении этой проблемы.

Фройнд назвал космические амбиции «амбициозными», но отметил, что они могут стать весьма привлекательными, если удастся преодолеть проблемы с задержкой сигнала, учитывая энергетические потребности наземных центров обработки данных и потенциал использования обильной солнечной энергии в космосе.

Дополнительные объявления GTC

Компания Nvidia также представила эталонный проект Vera Rubin DSX AI Factory, призванный помочь операторам в создании фабрик искусственного интеллекта, и выпустила Nvidia Omniverse DSX Blueprint для создания физически точных цифровых двойников таких предприятий.

В сфере программного обеспечения Nvidia объявила о выпуске Nvidia Dynamo 1.0, программной платформы для выполнения задач искусственного интеллекта, описываемой как операционная система для фабрик ИИ. Компания также представила стек NemoClaw для платформы агентов OpenClaw, а также Nemotron Coalition — инициативу, объединяющую разработчиков открытых моделей для развития открытых моделей посредством обмена опытом, данными и вычислительными ресурсами.

Аналитики заявили, что объявления GTC в целом оправдали ожидания.

«Компания Nvidia оправдала завышенные ожидания, связанные с новым чипом для обработки данных Groq 3, поддержкой как масштабируемой, так и расширяемой оптики, а также открытыми агентскими платформами, подтвердив при этом колоссальный прирост производительности платформ Blackwell и Rubin», — сказал Берк.