Оптимизация эффективности центра обработки данных для приложений петамасштаба

Прочитано: 72 раз(а)


Многие ИТ-руководители считают, что наиболее экономичным вариантом хранения для них являются твердотельные накопители по сравнению с жесткими дисками. Но так ли это на самом деле?

Приложения петамасштаба, такие как AI/ML, финансовые приложения и архитектуры граничных вычислений, сегодня есть везде, а не только в крупных организациях. Они доводят объемы данных до беспрецедентного уровня и, как следствие, требуют огромных объемов хранилища, а также плана того, как постоянно обеспечивать производительность, не расходуя весь ИТ-бюджет.

Многие ИТ-руководители считают, что наиболее экономичным вариантом хранения для них являются твердотельные накопители (SSD) по сравнению с жесткими дисками ( HDD ).

Но так ли это на самом деле? Как известно любому оператору центра обработки данных, электропитание, охлаждение/обогрев, недвижимость и другие факторы совокупной стоимости владения (TCO) являются факторами, помимо первоначальных затрат на программное обеспечение и носители данных, которые необходимо учитывать.

Анализы, проведенные различными поставщиками накопителей и устройств хранения, а также аналитиками и консультантами , показывают, что твердотельные накопители не всегда обеспечивают преимущество — даже с учетом таких инноваций, как технологии флэш-памяти с четырьмя ячейками (QLC) и повышенная плотность хранения.

Давайте рассмотрим три категории приложений и рекомендации по использованию жестких дисков и твердотельных накопителей для каждого из них.

Приложение № 1: чувствительная к задержкам аналитика

Вспышка лучше, когда:

Флэш-накопители часто отлично подходят для приложений, которым требуется произвольный доступ к небольшим полезным данным. Например, транзакционные системы, которые выполняют произвольные запросы к системе заказа продуктов и просматривают записи о клиентах с помощью ключа, такого как имя или номер телефона клиента, перед выполнением следующего шага в цепочке, могут значительно выиграть от более низкой задержки SSD. То же самое можно сказать и о периферийных приложениях, в которых небольшие потоки событий IoT или датчиков устройств содержат килобайты или меньше на запись данных о событиях, особенно при масштабных рабочих нагрузках.

Флэш-накопители могут быть более выгодными, чем жесткие диски, в этих ситуациях из-за их меньшей задержки и более высоких операций в секунду (IoP). В этих случаях флэш-память QLC, которая обеспечивает вдвое большую плотность, чем существующая флэш-память с тройными ячейками (TLC), может обеспечить значительно более высокую производительность.

Когда HDD может быть лучшим вариантом:

ИТ-руководители не могут предполагать, что для каждого приложения, чувствительного к задержкам, требуются твердотельные накопители. Предприятия часто обнаруживают, что они могут получить более чем достаточную производительность, запуская рабочие нагрузки с высоким IoP, чувствительные к задержкам в системах на основе жестких дисков, особенно с жесткими дисками корпоративного уровня, оптимизированными для рабочих нагрузок серверов и центров обработки данных. Хорошим примером здесь являются сценарии использования архивации данных.

В таких приложениях, как архивирование, резервное копирование и управление мультимедийными активами, разница между миллисекундной и микросекундной задержкой часто не влияет на производительность конечного пользователя. В этих ситуациях HDD может быть лучшим выбором, потому что он удовлетворяет постоянному балансу ИТ, удовлетворяя или превосходя ожидания по производительности, при этом придерживаясь бюджета.

Приложение № 2: рассмотрение совокупной стоимости владения при использовании неструктурированных данных в петабайтном масштабе

В последнее время в отрасли разгорелись споры о том, что лучше — твердотельные накопители высокой плотности или жесткие диски — для хранения неструктурированных данных, таких как мультимедийные файлы или данные датчиков. Сторонники твердотельных накопителей предположили, что самые последние версии флэш-памяти практически «на одном уровне» с жесткими дисками в отношении стоимости емкости. Некоторые даже предсказывают, что твердотельные накопители с флэш-памятью высокой плотности скоро заменят жесткие диски, поскольку они могут лучше выполнять все задачи.

Тем не менее сегодня твердотельные накопители высокой плотности не могут полностью заменить жесткие диски с точки зрения соотношения цена/производительность, особенно когда речь идет о хранении неструктурированных данных петабайтного масштаба для всего диапазона рабочих нагрузок приложений. Идеальное сочетание производительности, долговечности, емкости и доступности часто достигается за счет сочетания флэш-памяти и жесткого диска для достижения преимуществ каждого из них. На самом деле речь идет об использовании сильных сторон каждого из них для конкретных обстоятельств и выборе подходящего носителя, который лучше всего подходит для каждой рабочей нагрузки.

Жесткие диски могут быть идеальными, когда речь идет об обеспечении надежности в больших масштабах, о чем свидетельствует тот факт, что 90% емкости хранения в облачных центрах обработки данных сегодня по-прежнему основаны на жестких дисках .

Приложение № 3: вторичное хранилище или резервное копирование

Как правило, приложения для резервного копирования читают и записывают в хранилище большие файлы. Эти рабочие нагрузки почти полностью противоположны случайным операциям ввода-вывода, чувствительным к задержкам рабочим нагрузкам в отношении требований к производительности, которые они предъявляют к системе хранения.

Приложения резервного копирования работают лучше всего, когда они имеют быстрый последовательный доступ к огромным файлам данных резервного копирования с пропускной способностью в гигабайтах в секунду (или терабайтах в час). Кроме того, поскольку в настоящее время большинство организаций имеют сотни критически важных приложений, ресурсы должны обрабатывать несколько задач резервного копирования и восстановления одновременно и параллельно. Использование общих систем хранения для предотвращения распространения традиционных разрозненных хранилищ имеет финансовый смысл.

Различия между решениями на базе QLC-flash и HDD незначительны для этого типа рабочей нагрузки последовательного ввода-вывода. Решения для хранения объектов на основе жестких дисков способны достигать десятков ГБ/сек (десятков терабайт в час) с пропускной способностью, достаточной для насыщения сети. Это очень важно, поскольку ограничителем производительности здесь является не система хранения, а сеть.

Кроме того, поскольку время обработки приложений, дедупликации/сжатия и повторной сборки данных становится ключевым моментом для резервного копирования и восстановления, сама программа может быть ограничивающим фактором в общей производительности решения. В результате возрастающую разницу в пропускной способности между жестким диском и флэш-накопителем обычно можно считать незначительной, особенно если в анализе учитывается стоимость.

Итог: выбор жесткого диска или твердотельного накопителя зависит от соотношения производительности и стоимости.

Оптимизация производительности петамасштабных приложений может зависеть от тонких, но важных соображений при подборе правильного хранилища для требований приложений. Флэш-память QLC не является универсальным вариантом. Для чувствительных к задержкам рабочих нагрузок с интенсивным чтением его более высокая стоимость может обеспечить значительную выгоду для конечного пользователя. Однако он не всегда подходит для других типов рабочих нагрузок, включая резервное копирование, которое лежит в основе современных стратегий защиты данных и программ-вымогателей.

Сопоставляя модель производительности с преимуществами и стоимостью среды, команды центров обработки данных могут найти идеальный баланс между производительностью и стоимостью.

Оптимизация эффективности центра обработки данных для приложений петамасштаба



Новости партнеров