Узнайте, как серверы на базе графических процессоров трансформируют центры обработки данных с помощью возможностей параллельной обработки, необходимых для современных рабочих нагрузок.
Вы не можете обучать и управлять большинством типов рабочих нагрузок ИИ без графических процессоров или графических процессоров. Но вы также не можете развернуть графические процессоры без серверов для их размещения. Вот почему разговоры о будущем графических процессоров внутри центров обработки данных должны учитывать не только то, как компании будут приобретать, настраивать и питать сами графические процессоры, но и то, как они будут строить серверную инфраструктуру, где будут находиться графические процессоры.
Для этого давайте рассмотрим, что представляет собой сервер на базе графического процессора, сосредоточившись на том, чем он отличается от традиционных серверов и что это означает для роли графических процессоров в центрах обработки данных.
Что такое GPU-сервер?
Сервер GPU — это просто сервер, оснащенный одним или несколькими GPU. Обычно серверы GPU размещают рабочие нагрузки, требующие огромных объемов параллельной вычислительной мощности. Поскольку GPU идеально подходят для параллельной обработки, они отлично подходят для таких вариантов использования, как обучение моделей ИИ, которые работают лучше всего, когда рабочие нагрузки могут выполнять много операций одновременно.
Серверы GPU включают центральные процессоры (ЦП). ЦП необходим для выполнения традиционных вычислительных задач, таких как запуск операционной системы, которая управляет сервером. Но сервер GPU предлагает вычислительные ресурсы GPU в дополнение к традиционному ЦП.
Растущая роль серверов GPU в центрах обработки данных
До бума генеративного ИИ серверы GPU редко можно было найти внутри центров обработки данных. Вместо этого большинство серверов центров обработки данных были традиционными устройствами, вычислительные ресурсы которых предоставлялись только центральными процессорами, которые отлично справляются с большинством типов традиционных рабочих нагрузок, таких как хостинг веб-сайтов и баз данных.
Однако по мере роста спроса на инфраструктуру, способную поддерживать обучение и вывод моделей ИИ, возможность размещения серверов на базе графических процессоров становится все более важной для центров обработки данных.
Серверы GPU против серверов CPU
Во многих отношениях серверы GPU похожи на традиционные серверы, включающие только CPU. Они часто имеют тот же размер, помещаются в стандартные серверные стойки и требуют тех же типов сетевых и силовых подключений.
Однако серверы на базе GPU имеют несколько важных отличий:
-
Больше слотов расширения : Традиционные серверы обычно включают в себя относительно немного слотов расширения, которые технические специалисты могут использовать для подключения графических процессоров и других специализированных аппаратных устройств к материнской плате сервера. Это связано с тем, что большинство традиционных серверов не используют много дополнительных карт. Но поскольку предоставление способа подключения графических процессоров является важным для сервера GPU, серверам GPU нужны слоты расширения — часто больше, чем вы найдете в традиционном сервере. Некоторые серверы GPU имеют достаточно слотов для размещения до 10 отдельных графических процессоров.
-
Повышенные потребности в питании : графические процессоры потребляют много электроэнергии. Это означает, что серверы с графическими процессорами должны быть способны выдавать больше энергии, чем типичный сервер, работающий только на центральном процессоре. Способ подачи питания на графические процессоры может различаться. В некоторых случаях оно поступает через материнскую плату сервера, но высокопроизводительные корпоративные графические процессоры иногда имеют выделенные соединения питания. В любом случае, однако, сервер с графическим процессором (и стойка, в которой он размещен) должен иметь возможность выдавать достаточно общей входящей энергии для поддержания работы графических процессоров.
-
Большая охлаждающая способность : высокое энергопотребление сочетается с высокой теплоотдачей. В результате серверы GPU должны быть особенно искусны в рассеивании тепла. Вероятно, им потребуются более продвинутые решения для охлаждения, чем традиционные вентиляторы.
Подготовка центров обработки данных для серверов GPU
Поскольку серверы GPU обычно могут размещаться в традиционных серверных стойках, они не представляют особых проблем для операторов центров обработки данных с точки зрения физического пространства. Но центрам обработки данных может потребоваться внести изменения в других областях для размещения GPU.
Самая большая, пожалуй, в сфере питания. Как отмечалось выше, серверам GPU обычно требуется больше энергии. Для операторов центров обработки данных это означает не только обеспечение того, чтобы объекты могли поставлять достаточно общей мощности для поддержания работы серверов GPU. Инвестиции в устойчивые источники энергии также могут быть приоритетом для компаний, которые хотят избежать подрыва обязательств по устойчивому развитию из-за энергоемких GPU.
Возможность поддерживать охлаждение серверов GPU также будет приоритетом для операторов центров обработки данных. Размещение десятков серверов GPU в одной стойке может оказаться невозможным без сложных систем охлаждения, которые могут очень эффективно отводить тепло.
Существует также проблема аварийного восстановления центра обработки данных . Защита инфраструктуры центра обработки данных от сбоев и быстрое восстановление, когда они происходят, важны независимо от типов серверов внутри объекта. Но это особенно важно, когда серверы включают в себя графические процессоры, которые стоят десятки тысяч долларов за штуку.
Вдобавок к этому, восстановление после сбоя может быть более сложным, когда у вас есть серверы GPU в миксе, поскольку рабочие нагрузки, которые выполнялись на этих серверах, сложнее поднять и перенести на другие серверы. Если стандартный сервер выходит из строя, вы обычно можете заменить его любым другим стандартным сервером. Это не обязательно относится к серверу GPU, который включает специализированное оборудование и особые конфигурации.
Итог: превращение дата-центров в идеальные дома для GPU-серверов, безусловно, возможно. Но это требует особого планирования и инвестиций. GPU-сервер может поместиться в ту же стойку, что и стандартный CPU-сервер, но это не значит, что он будет работать безупречно без особых условий.