Вот как работает графический процессор как услуга — предложение облачных вычислений, которое предоставляет серверам графические процессоры по требованию — и когда следует рассмотреть возможность использования предложения GPUaaS.
Как будто индустрия облачных вычислений еще не была наводнена аббревиатурами, ИТ-специалистам стоит изучить новую: GPUaaS.
На самом деле, те из вас, кто ведет счет, заметят, что это аббревиатура внутри аббревиатуры, потому что она означает «графический процессор как услуга».
Но мы здесь не для того, чтобы фетишизировать аббревиатуры. Мы здесь, чтобы рассказать вам о тенденциях облачных вычислений , и графический процессор как услуга — одна из них. Продолжайте читать, чтобы узнать, что означает GPUaaS, почему это важная концепция сегодня и где найти решения GPU как услуга.
Что такое графический процессор как услуга?
Графический процессор как услуга, также известный как GPUaaS или иногда просто GaaS, — это тип предложения облачных вычислений, который делает серверы с графическими процессорами или графическими процессорами доступными по требованию.
Графический процессор как услуга подпадает под категорию инфраструктуры как услуги или IaaS, поскольку это способ предоставления инфраструктуры — в частности, серверов, оснащенных графическими процессорами — через сетевое соединение.
Как работает графический процессор как услуга?
Предложения графического процессора как услуги работают так же, как и любое стандартное решение IaaS: поставщики услуг развертывают серверы, включающие графические процессоры, а затем позволяют клиентам подключаться к этим серверам через Интернет с помощью SSH или инструмента удаленного рабочего стола. После подключения клиенты могут развертывать рабочие нагрузки по своему выбору. Цены основаны в первую очередь на продолжительности работы сервера.
Если это очень похоже на развертывание любого типа экземпляра сервера в облаке, а не только того, который дает вам доступ к графическим процессорам, то это потому, что так оно и есть. Все основные поставщики облачных услуг теперь предлагают экземпляры серверов — например, от AWS и от Azure — с мощными графическими процессорами в рамках стандартной линейки облачных серверов. В большинстве случаев экземпляры представляют собой виртуальные машины, хотя можно найти «голые» облачные серверы с графическими процессорами, например экземпляры AWS G4dn.
Почему важен графический процессор как услуга?
Практически во всех случаях эксплуатация экземпляра облачного сервера, оснащенного мощным графическим процессором, обходится дороже, чем экземпляр, который предоставляет аналогичные ресурсы ЦП и памяти, но не включает графический процессор. Итак, почему вы решили развернуть облачный сервер с графическим процессором?
Ответ заключается в том, что вы будете выполнять рабочую нагрузку, которая может извлечь выгоду из использования графического процессора или требует его, например, обучение моделированию или крупномасштабный анализ баз данных. Для подобных рабочих нагрузок графические процессоры могут обеспечить огромный прирост производительности, поскольку они могут обрабатывать числа на очень высоких скоростях, особенно в тех случаях, когда вычисления могут выполняться параллельно.
Таким образом, хотя графические процессоры изначально были разработаны в первую очередь для рендеринга видео, они могут оказаться полезными для любой рабочей нагрузки, требующей параллельных вычислений в больших масштабах. И, учитывая динамику развития искусственного интеллекта , вполне вероятно, что в ближайшие годы все больше и больше предприятий будут обращаться к решениям графического процессора как услуги, чтобы помочь в обучении и развертывании приложений, зависящих от искусственного интеллекта.
Вы, конечно, можете пойти и купить собственные серверы с графическим процессором для обработки таких рабочих нагрузок. Но аренда доступа к таким серверам через облако с использованием предложения «графический процессор как услуга» может оказаться более экономичным подходом, особенно если вы не будете использовать свои собственные серверы на полную мощность на постоянной основе.
GPU-over-IP: вариант GPUaaS
Приобретение временного доступа к облачным графическим серверам с использованием GPUaaS — не единственный способ получить доступ к мощным графическим процессорам без их приобретения самостоятельно. Вы также можете воспользоваться преимуществами GPU-over-IP — варианта идеи GPUaaS.
Используя GPU-over-IP, вы не арендуете целый сервер и не развертываете на нем рабочие нагрузки, чтобы задействовать его графические процессоры. Вместо этого вы подключаете свои рабочие нагрузки, зависящие от графического процессора, к графическому процессору удаленного сервера через Интернет, используя программное обеспечение, которое предоставляет графический процессор в «необработанном» виде через сеть.
Уровни производительности GPU-over-IP, как правило, ниже, чем у GPUaaS, поскольку некоторые ресурсы тратятся впустую в процессе предоставления графического процессора сети. Но преимущество в том, что вам не нужно арендовать целый сервер и развертывать на нем свои рабочие нагрузки; вы можете воспользоваться преимуществами удаленных графических процессоров, оставив при этом свои рабочие нагрузки.
Где найти графический процессор как услугу
Как отмечалось выше, вы можете найти предложения GPUaaS от всех основных поставщиков облачных услуг. Некоторые более мелкие компании также предлагают экземпляры серверов с поддержкой графического процессора. NVIDIA ведет полезную таблицу со списком поставщиков облачных услуг, предлагающих доступ к серверам, оснащенным ее графическими процессорами.
Если вы хотите изучить подход GPU-over-IP, посетите Juice Labs , которая создает программное обеспечение, которое может предоставлять доступ к графическим процессорам по сети. Доступна бесплатная версия решения с открытым исходным кодом . Juice Labs не предоставляет инфраструктуру с поддержкой графических процессоров; вы должны найти это самостоятельно. Но это позволяет получить инфраструктуру графического процессора из одного источника (например, центра обработки данных партнера) и подключить ее к рабочим нагрузкам, расположенным в другом месте.