Поскольку центры обработки данных изо всех сил пытаются решить проблему энергоэффективности и декарбонизации, искусственный интеллект стал мощным решением. Давайте посмотрим на технологию — и на то, в чем она терпит неудачу.
Сейчас считается, что центры обработки данных и другие операции облачных вычислений составляют до 1% глобального энергопотребления . Углерод, затрачиваемый на эксплуатацию этих огромных серверных ферм, и особенно на их охлаждение, далеко не так уж и мал. Считается, что около 50% потребления электроэнергии приходится на основные эксплуатационные расходы, а до 40% приходится на затраты на охлаждение.
Центры обработки данных постоянно ищут решения: от использования большего количества возобновляемых источников энергии до размещения центров обработки данных под водой, чтобы сэкономить на затратах на охлаждение.
Некоторые из наиболее экономных и практичных решений включают внедрение искусственного интеллекта для выявления и устранения недостатков. По оценкам отчета Gartner , в ближайшие два года ИИ будет работать в половине всех центров обработки данных. Отчет IDC за 2019 год предполагает, что это, возможно, уже произошло. Загрузка будет увеличиваться на 20% в годовом исчислении, поэтому это актуальная проблема.
Ян Клэтворси, директор по маркетингу продуктов платформы данных в Hitachi Vantara, и Эрик Шварц, вице-президент по разработке DataBank, рассказывают о возможностях и ограничениях решений искусственного интеллекта в центрах обработки данных.
Сбор правильных данных
Чтобы создать и откалибровать полезные инструменты искусственного интеллекта, центры обработки данных должны собирать и вводить соответствующие данные. Это оказалось непростой задачей, поскольку определенные типы данных, которые исторически не были полезны в повседневной работе, просто игнорировались. Некоторые могут быть собраны, но не использованы. А некоторые вообще не собираются, а это означает, что операторам приходится начинать с нуля или экстраполировать существующие данные.
Необходимые данные об оборудовании включают в себя: доступное хранилище, простоту доступа, количество компьютеров, работающих в данный момент, и машины, на которые направляется трафик при любых данных обстоятельствах. Также важны данные, касающиеся энергии, затраченной на питание машин и охлаждение, а также соответствующие данные об условиях окружающей среды внутри и за пределами центра.
«Чтобы создать правильную систему искусственного интеллекта машинного обучения, вам понадобится все это, чтобы действительно повысить эффективность. Все это имеет значение», — говорит Шварц. «Каждая из этих точек данных может исказить другую».
На самом деле ИИ может быть полезен в первую очередь при сборе этой информации. Интеллектуальный анализ данных может извлечь полезные данные, спрятанные в, казалось бы, несвязанной статистике, при наличии правильных инструкций. По словам Клэтворти, когда правильные данные упорядочены, они могут «фактически представлять информацию так, чтобы она что-то значила».
Как использовать ИИ для повышения эффективности ЦОД
Использование энергии серверами является основной целью вмешательства ИИ. Неиспользуемые серверы остаются включенными, а входящий трафик неэффективно распределяется по доступному оборудованию. Механизмы управления планированием могут использовать глубокое обучение для правильного направления трафика. Его можно распределить по доступным машинам таким образом, чтобы оптимально использовать их возможности, но не перегружать их.
А затем неиспользуемые машины можно отключить до тех пор, пока они не потребуются. А еще лучше, говорит Клэтворти: «Мы можем выключить процессор. Выключая вещи, вы тратите меньше энергии». Он считает, что включение и выключение машин также неэффективно.
Можно предвидеть структуру трафика, что позволяет более экономно использовать оборудование. Таким образом, повышается эффективность использования энергии (PUE). ИИ может помочь в масштабировании этих процессов по мере увеличения рабочей нагрузки.
Используя данные для определения вероятности возникновения сбоев, можно упростить создание соответствующих резервных копий. Установка исправлений и обновлений, которые являются обременительными и трудоемкими, также можно в некоторой степени автоматизировать. А вышедшие из строя машины можно заменить или отремонтировать до того, как они вызовут перебои в работе.
Управление источниками энергии также может получить выгоду от ИИ. Определив, когда возобновляемые источники наиболее доступны — ветреные дни для энергии ветра, солнечные дни для солнечной энергии — центры обработки данных могут определить, когда они будут получать энергию из этих источников, а когда они прибегнут к менее желательным источникам электроэнергии, полученным из ископаемого топлива. Отходящее тепло можно перенаправить и использовать либо внутри самого центра, либо на близлежащих объектах.
«Невозможно всегда использовать возобновляемые источники энергии», — утверждает Шварц. «Используя ИИ, чтобы определить, когда лучше всего его использовать, вы получаете лучшее из обоих миров».
Там тоже есть экономия. «Даже 1% [потребления энергии] может означать сотни тысяч долларов энергии», — добавляет он. «Настроить его на наиболее эффективный рабочий параметр было бы очень полезно».
Системы охлаждения — еще одна цель программ повышения эффективности ИИ. Как и власть, они в прошлом были постоянными. То есть они не корректировались в соответствии с меняющимися параметрами, а вместо этого работали с постоянной скоростью, определяемой расплывчатыми оценками потребностей.
Охлаждение обходится очень дорого – как с финансовой точки зрения, так и с точки зрения выбросов углекислого газа – и даже незначительные изменения в системах охлаждения могут привести к существенной экономии. Управление температурным режимом должно учитывать такие факторы, как температура окружающей среды, погода, тепло, выделяемое активными машинами в любой момент времени, материалы, из которых построено здание, и действующие системы HVAC.
Как цифровое дублирование может оптимизировать системы центров обработки данных
Создание цифрового двойника или виртуального представления физической среды центра обработки данных может помочь смоделировать взаимодействие его различных компонентов без риска нарушения работы самой системы. Вводя данные об энергопотреблении, температуре, потребностях в трафике и погоде, а также других факторах, архитекторы ИИ могут разработать оптимальные условия для центров обработки данных — по крайней мере, теоретически.
«Мы можем моделировать различные конфигурации охлаждения», — предлагает Клэтворти в качестве примера. «Будь то Сингапур, Мельбурн, Европа, дождь — мы можем определить наиболее эффективные схемы охлаждения в зависимости от расположения оборудования».
Отсутствие данных – а их всегда не хватает – конечно, исказит эти цифровые модели. Но даже разумное количество исторических данных может создать реалистичные модели того, как на самом деле работают центры обработки данных и используют энергию.
Однако цифровые двойники не являются самодостаточными. Они требуют настройки со стороны людей-наблюдателей, которые могут отмечать параметры, превышающие возможные в физическом мире. Таким образом, модели со временем совершенствуются.
Проблемы развертывания ИИ в центрах обработки данных
Дефицит данных представляет собой самую неприятную проблему для внедрения ИИ в центрах обработки данных. Хотя некоторые данные собираются для других целей и, таким образом, готовы для ввода в системы ИИ, некоторые данные, необходимые для оптимизации производительности ИИ, до сих пор дрейфовали в цифровом эфире. Некоторые из них можно получить задним числом из других источников. Но другие типы требуют новых методологий, а это означает отсутствие исторических данных. Центры обработки данных должны начинать с нуля.
Например, центры обработки данных имеют в своем распоряжении указанное производителем энергопотребление готовой машины. Но данные о энергопотреблении машин по мере их старения и ухудшения производительности не могут быть собраны и, следовательно, недоступны для использования в решениях искусственного интеллекта. Тщательное знание возможностей и уязвимостей каждой используемой части оборудования является обязательным, и зачастую его трудно получить.
Как отмечает Шварц, многопользовательские центры обработки данных сталкиваются с еще одним уровнем трудностей при сборе данных, поскольку они должны соблюдать соглашения о конфиденциальности со своими клиентами. «У нас есть разные типы клиентов с разными потребностями и разными уровнями риска», — сообщает он. «Когда вы пытаетесь учесть все это, вы обычно не можете быть тем, кто живет на грани».
ИИ также требует новых и сложных систем и оборудования для поддержки своего внедрения – так называемого налога на ИИ . Это недешево на начальном этапе, но экономия средств в дальнейшем кажется надежной. Тем не менее, запуск и запуск системы — непростая задача: данные необходимо собрать, обработать, ввести, а затем повторно проанализировать.
Еще одной задачей является обеспечение устойчивой связи центров обработки данных друг с другом. «Мы изучаем, как использовать программное обеспечение искусственного интеллекта для перемещения данных из центров обработки данных без какого-либо воздействия на клиента», — говорит Клэтворти. Это создает множество препятствий, когда учитываются возобновляемые источники энергии. «Здесь садится солнце. Это означает, что мы не собираемся использовать возобновляемые источники энергии для перемещения этого набора данных».
Даже несмотря на то, что их сложность растет и они умеют принимать такие решения, системы ИИ в некоторых ситуациях все еще не могут сравниться с человеческим мышлением.
«
Поскольку ИИ становится все более неотъемлемой частью работы центров обработки данных, людям, работающим с ним, придется соответствующим образом корректировать свои обязанности.