CoreWeave расширяет облачную платформу для ИИ с помощью Nvidia B300

Прочитано: 103 раз(а)


Поставщик облачных услуг в области ИИ объединяет инфраструктуру графических процессоров нового поколения с новыми инструментами разработки, направленными на ускорение перехода от обучения моделей к ИИ в промышленных масштабах.

На этой неделе на конференции Nvidia GTC компания CoreWeave представила масштабное расширение своей облачной платформы, ориентированной на искусственный интеллект, призванное помочь предприятиям быстрее переходить от обучения моделей к развертыванию в производственной среде, с особым акцентом на системы искусственного интеллекта следующего поколения и рабочие нагрузки обучения с подкреплением.

Компания объявила о выпуске общедоступной инфраструктуры на базе платформы Nvidia HGX B300, а также набора интегрированных возможностей разработки и мониторинга, созданных с помощью Weights & Biases, платформы для отслеживания экспериментов в области машинного обучения.

Этот шаг отражает более широкую рыночную тенденцию, поскольку организации переходят от крупномасштабного обучения к непрерывному совершенствованию моделей и высокопроизводительному выводу данных . «Переход CoreWeave к выводу данных — активизация ИИ — это хорошо», — сказал Мэтт Кимбалл, вице-президент и главный аналитик Moor Insights & Strategy. «Вывод данных, где реализуется ценность ИИ, только начинает набирать обороты и может быть на порядки масштабнее, чем обучение».

Кимбалл добавил: «Экономический эффект от ИИ проявляется на этапе вывода. Память, пропускная способность межсоединений и эффективность имеют такое же значение, как и вычислительные мощности».

Стивен Сопко, аналитик-резидент HyperFrame Research, заявил, что исследование его компании за первый квартал показывает, что 30% организаций уже масштабно внедрили ИИ, а 64% ожидают сделать это в течение шести месяцев. «Именно на эту волну спроса ориентируется CoreWeave», — сказал Сопко. «Мы еще много услышим о Vera Rubin, но это объявление указывает на то, что необходимые ресурсы существуют уже сегодня».

Создан для логического мышления в рамках искусственного интеллекта и обработки больших объемов данных

В основе расширения платформы Coreweave лежит инфраструктура, построенная на базе Nvidia HGX B300, входящей в последнее поколение графических процессоров, использующих архитектуру Nvidia Blackwell. Платформа ориентирована на быстро развивающийся набор рабочих нагрузок, возникающих в сфере крупномасштабного обучения, обучения с подкреплением и обработки больших объемов данных.

По данным компании, системы на базе B300 обеспечивают более высокую производительность для логического вывода и обработки данных в рамках искусственного интеллекта, а также расширяют объем памяти, позволяя командам запускать большие модели на меньшем количестве узлов. 

Каждый развернутый узел HGX включает восемь графических процессоров, обеспечивая плотные параллельные вычисления для распределенного обучения ИИ и обслуживания моделей. Внутри узла технология межсоединений Nvidia NVLink обеспечивает высокоскоростную связь между графическими процессорами и совместное использование памяти, уменьшая задержку как во время обучения, так и во время вывода результатов.

Серверы объединены в кластерах с помощью сетевой технологии Nvidia Quantum-X800 InfiniBand, обеспечивающей сверхнизкую задержку связи между узлами. Высокоскоростные соединения становятся все более важными, поскольку моделям ИИ требуются тысячи графических процессоров, работающих вместе в распределенных кластерах.

Компания Coreweave заявила, что каждый узел предлагает до 2,1 ТБ памяти HBM3e, что позволяет разработчикам обучать и запускать модели, содержащие более 100 миллиардов параметров, с меньшим количеством графических процессоров и сниженными накладными расходами на передачу данных.

Для управления тепловыми нагрузками в плотных кластерах ИИ серверы HGX B300 используют жидкостное охлаждение , что помогает поддерживать максимальную производительность при высоких нагрузках.

Сокращение разрыва между обучением и производством

Помимо обновления оборудования, CoreWeave демонстрирует новые программные рабочие процессы, упрощающие уточнение и развертывание моделей искусственного интеллекта.

Новые возможности Weights & Biases представляют собой подход, который компании описывают как «обучение с подкреплением без использования среды», позволяющий агентам ИИ совершенствоваться непосредственно на основе производственных данных, а не полагаться исключительно на имитационные среды.

«Мне нравится, что CoreWeave делает акцент на программном обеспечении, которое позволяет моделям обучаться на основе реальных пользователей, — сказал Кимбалл. — Это повышает точность и эффективность».

Такой подход позволяет моделям непрерывно обучаться на основе реальных моделей использования и анализа производительности, что потенциально может ускорить циклы разработки корпоративных приложений искусственного интеллекта. В CoreWeave заявили, что такие рабочие процессы могут сократить циклы обучения и снизить затраты на вывод результатов, сохраняя при этом качество модели.

Поддержка автономных и физических систем искусственного интеллекта

Компания также представила новые инструменты, предназначенные для робототехники и разработки решений на основе искусственного интеллекта.

Благодаря обновленным функциям отслеживания экспериментов и многомодального мониторинга, команды разработчиков робототехники могут сравнивать результаты обучения, результаты моделирования и видеоданные в едином рабочем пространстве. Эти инструменты призваны упростить экспериментирование и ускорить итерации для физических систем.

Компания CoreWeave также представила мобильное приложение для мониторинга процесса обучения моделей в режиме реального времени, предоставляющее инженерам удаленный доступ к информации и возможность раннего выявления проблем.

«Также интересно наблюдать за тем, какой акцент делается на робототехнике», — отметил Кимбалл. «Этот рынок развивается быстрее, чем мы думаем».

Методы вывода информации набирают обороты

Это объявление отражает ключевой поворот в инфраструктуре ИИ: узким местом является уже не только нехватка графических процессоров, но и сложность развертывания и эксплуатации систем ИИ в производственной среде. Сочетая оборудование нового поколения с интегрированными рабочими процессами разработки и оценки, CoreWeave позиционирует свою платформу для нового класса автономных агентов и непрерывно обучающихся систем, которые, как ожидается, будут способствовать следующему этапу внедрения ИИ в корпоративной среде.

По мере внедрения приложений ИИ в производство спрос на выполнение задач вывода растет, что подталкивает поставщиков облачных услуг к созданию инфраструктуры, оптимизированной для непрерывного обслуживания крупномасштабных моделей, а не для эпизодических запусков обучения.

Обнаружена уязвимость в аппаратном обеспечении облачных серверов, используемом чипами AMD и Intel



Новости партнеров