Генеральный директор Nvidia поделился видением капитального ремонта центров обработки данных

Прочитано: 85 раз(а)


Акции Nvidia резко выросли на прошлой неделе после того, как генеральный директор Дженсен Хуанг заявил, что предвидит капитальный ремонт оборудования центров обработки данных на сумму 1 триллион долларов благодаря ускоренным вычислениям и генеративному искусственному интеллекту.

Nvidia продемонстрировала значительный рост на 24,7% на прошлой неделе , частично благодаря заявлению генерального директора Дженсена Хуанга за день до резкого скачка акций, в котором подчеркивается необходимость замены устаревшего оборудования центров обработки данных новыми чипами по мере того, как все больше компаний интегрируют ИИ.

«Компьютерная индустрия переживает два одновременных перехода — ускоренные вычисления и генеративный ИИ, — сказал Хуанг во время отчета Nvidia о прибылях и убытках за второй квартал 24 мая. ускоренные вычисления, поскольку компании стремятся применять генеративный ИИ в каждом продукте, услуге и бизнес-процессе » .

Устаревшее оборудование заменят: но какой ценой?

Однако есть вопросы по поводу масштабов и стоимости этих замен. Хотя внедрение ИИ может потребовать некоторых обновлений оборудования или специализированных процессоров для оптимальной производительности, стоимость и масштабы таких замен зависят от конкретных требований каждой компании. Предприятия должны оценивать потребности и затраты в каждом конкретном случае.

Брэдли Шиммин, отраслевой аналитик данных и ИИ в группе технологических исследований и консалтинга Omdia, признает, что компании могут извлечь выгоду из тенденции генеративного ИИ, которая может потребовать новых подходов к аппаратному ускорению. Однако Шиммин не полностью поддерживает мнение Хуанга о том, что центры обработки данных должны заменить все оборудование.

«Для многих случаев использования, особенно тех, которые связаны с высокими требованиями к обучению моделей, компании будут стремиться сократить расходы и ускорить время выхода на рынок, инвестируя в новейшее и лучшее аппаратное ускорение ИИ», — сказал Шиммин. «Тем не менее, прямо сейчас наблюдается противоположная тенденция, когда исследователи учатся делать больше с меньшим количеством моделей с меньшим количеством параметров, тщательно отобранными наборами данных и более разумным обучением / точной настройкой с использованием PEFT [эффективная точная настройка параметров] и LoRa, например.»

Финансовые препятствия и физические ограничения центра обработки данных

Помимо физических ограничений центров обработки данных, любое стремление к увеличению плотности транзисторов в центрах обработки данных не обходится без препятствий. Строительство фабрик обходится дорого, особенно в сочетании с растущими расходами на передовые узлы. Руководители центров обработки данных должны решать эти финансовые проблемы, стремясь удовлетворить постоянно растущий спрос на более совершенную инфраструктуру центров обработки данных.

По мере того, как индустрия центров обработки данных продолжает развиваться, поиск экономически эффективных решений для достижения плотности транзисторов наряду с сохранением сотрудников будет иметь решающее значение для операторов центров обработки данных.

Расширение экосистем и архитектур микросхем

Шиммин отметил, что производители чипов также спешат поддерживать варианты использования генеративного ИИ на небольших целевых платформах, например, усилия Samsung по запуску полномасштабных моделей на чипе и в телефоне. Это указывает на то, что общая экосистема будет расширяться за счет различных типов микросхем и конфигураций развертывания, включая внутреннее обучение и выводы на периферии или в устройстве. Многочиповые архитектуры, такие как RISC-V, FPGA, графические процессоры и специализированные решения, такие как AWS Trainium и Inferentium, будут играть важную роль в этой развивающейся среде.

«Легко увидеть, что вся экосистема взорвется», — сказал Шиммин.

ИИ стал центром внимания инвесторов и управления инфраструктурой центров обработки данных из-за растущих требований к масштабу ИИ. Это связано с безудержным успехом различных моделей GPT OpenAI.

Но создание мощных моделей языка или изображений — это то, на что способны лишь немногие компании. В прошлом можно было увидеть значительные улучшения с помощью моделей меньшего масштаба для работы с системами размером с центр обработки данных. Чтобы продолжать раздвигать границы технологий, компаниям придется инвестировать в лучшее и более совершенное оборудование, что придает большое значение заявлению Хуанга.

Карл Фройнд, основатель и главный аналитик Cambrian-AI Research, заявил в заявлении Data Center Knowledge , что никогда не поставит на то, что Дженсен ошибается.

«Он непревзойденный провидец», — сказал Фройнд. «Дженсен годами говорил, что центр обработки данных будет ускорен, и это происходит. В зависимости от процессора на сегмент графических процессоров приходится максимальная доля дохода в размере 46,1% в 2021 году ».

Однако инвесторы Nvidia, возможно, захотят умерить свои ожидания постоянного роста доходов. Подразумевается, что масштабирование уже остановилось и скоро выйдет на плато. Хотя внедрение искусственного интеллекта может потребовать обновления оборудования или специализированных процессоров для оптимальной производительности, степень замены, вероятно, будет варьироваться в зависимости от компании. Ожидается, что по мере развития технологической экосистемы оптимизация и усовершенствования моделей искусственного интеллекта предложат альтернативные решения, которые уравновешивают требования к оборудованию.

Сэм Альтман, генеральный директор OpenAI , который недавно попросил Конгресс рассмотреть предложения по регулированию ИИ , сказал, что дальнейшее развитие ИИ не будет происходить за счет увеличения моделей.

«Я думаю, что мы находимся в конце эпохи, когда будут такие гигантские, гигантские модели», — сказал Альтман аудитории на мероприятии, состоявшемся в Массачусетском технологическом институте в начале апреля, как сообщает Wired . «Мы сделаем их лучше другими способами».

Генеральный директор Nvidia поделился видением капитального ремонта центров обработки данных



Новости партнеров