icon__time_white.png Часы работы: пн.-пт. с 9:00 до 18:00
icon__mes_white.png sales@gst-it.ru Оставить заявку

Что такое DCPMM и где её использовать

Несколько лет назад компания Intel представила энергонезависимую память Intel Optane DC (DCPMM), которая имеет большую емкость, чем DRAM, а её производительность выше, чем у SSD и HDD. Иными словами, это некий гибрид между модулем оперативной памяти и накопителем. И он стирает грань между DRAM и хранилищем данных при вычислениях в памяти.

Другое преимущество — Intel Optane DC сохраняет данные, если пропало питание сервера или оно нестабильно. При этом сохраняется производительность DRAM. Таким образом, данные сохраняются в оперативной памяти после выключения устройства.

Насколько эффективно это решение для работы? Рассмотрим на примере работы с SAP HANA.

Суть технологии

Для работы с OLTP, базами данных в памяти и других сложных задач нужно использовать ресурсы процессора, и памяти по максимуму и при этом сокращать задержки при передаче информации. Решения по базе энергонезависимой памяти (NVM) не могут до конца решить эту проблему. Выходом может стать энергонезависимая память NVRAM/NVDIMM, в том числе Intel Optane DCPMM.

Разработка DCPMM началась в середине 2000-х. В 2012 году Intel и Micron объединили усилия для совместной работы. В июле 2015 технология была показана широкой публике.

Тогда технология называлась 3D XPoint («Трехмерная точка пересечения»).

Идея заключалась в создании памяти, которая бы отвечала следующим критериям:

  • Энергонезависимость
  • Надежность
  • Скорость выше, чем у флэш

По сути, инженеры разработали новый класс модулей, который позволил поставщикам информационно-коммуникационных технологий преодолеть ограничения классической трехуровневой модели хранения «горячих, теплых и холодных» данных.

Распределение данных в памяти. Классическая архитектура

В итоге появляется четвертый слой для «полугорячих» данных, которые пользователи и получают при включении компьютера.

Новый слой NVRAM оказывается между двумя «кольцами»: SSD (хранение данных) и DRAM с CPU (запуск приложения).

Новая архитектура

Модули DCPMM фактически переопределяют привычную иерархию памяти и хранения. На практике необходимая для запуска приложений информация оказывается доступна течение сотен наносекунд по сравнению с десятками микросекунд для SSD и миллисекунд для HDD.

Ещё одно существенное преимущество технологии: модули Intel Optane DCPMM устанавливаются в те же стандартные слоты памяти, что и DRAM. На рисунке более точное представление о том, где они находятся, чем отличаются от обычных блоков памяти и жестких дисков.

Скорость и объём в новой системе

Режимы работы с постоянной памятью Intel Optane DC

Модули Intel Optane DCPMM были выпущены в апреле 2019 года вместе со вторым поколением процессоров Intel Xeon Scalable. Одной из первых компаний, которая получила новые процессоры и DCPMM стала Fujitsu. Компания внедрила новшества в системы PRIMERGY и PRIMEQUEST.

Покупатели устройств этих линеек могут выбрать один из трех режимов работы, которые лучше всего отвечают текущим потребностям.

  • Memory Mode (MM)
  • App Direct Mode (AD)
  • Mixed Mode

В режиме Memory Mode вся емкость DCPMM работает как «классическая» ОЗУ. В этом случае операционная система и приложения рассматривают её как пул энергозависимой памяти, а DRAM используется в роли кэша.

Процессор контроллера памяти обрабатывает все операции управления кэшем. Это означает, что при запросе данных из памяти, он сначала проверяет кэш DRAM. Если данные присутствуют, скорость передачи и время ожидания идентичны DRAM. В противном случае данные считываются из модулей DCPMM с немного большей задержкой.

К слову, наличие в сервере планок памяти DRAM обязательно.

MM предпочтителен, когда нужно увеличить объём основной памяти. Например, в средах с высокой степенью виртуализации, модули DCPMM могут вмещать больше виртуальных машин и в то же время предоставлять больше памяти для каждой из них. При этом затрачивается меньше средств, чем на сравнительную по эффективности конфигурацию DRAM.

То же самое относится к рабочим нагрузкам с высокой степенью ввода-вывода, таким как аналитические и бизнес-приложения, а также большой набор устаревшего программного обеспечения.

Режим App Direct позволяет приложениям напрямую взаимодействовать с частями DCPMM. Таким образом, все важные данные хранятся в постоянной памяти в непосредственной близости от процессора, а значит сразу же доступны при загрузке части программного обеспечения.

В этом режиме ОС распознает два отдельных пула памяти и обрабатывает их соответствующим образом: часть DCPMM, резервируется для AD как постоянная память, а SDRAM функционирует как основная память.

Еще одним преимуществом такой конфигурации: DCPMM с поддержкой AD выполняет роль постоянного запоминающего устройства, но адресация проходит по байтам, как SDRAM.

Кроме того, данные из пространства App Direct DCPMM кэшируются в памяти ЦП точно так же, как из SDRAM. Система получается более согласованной, а все ядра ЦП в системе сразу получают одинаковые данные.

Ещё одна возможность: пространство App Direct можно монтировать непосредственно в ОС как сверхбыстрый SSD, делая его доступным для неизменяемых приложений.

AD Mode максимально использует DCPMM с точки зрения производительности, емкости, гибкости и простоты использования. Поэтому неудивительно, что эксперты считают этот режим работы предпочтительным для сценариев, в которых устойчивость систем и приложений, а также быстрое время загрузки/перезапуска имеют первостепенное значение.

DCPMM в конфигурациях AD особенно хорошо работает с приложениями, которые в значительной степени зависят от объема и производительности памяти, такими как базы данных в памяти и приложения для сверхбыстрого хранения.

Смешанный режим (Mixed Mode)— разновидность AD. В этом случае можно настроить DCPMM таким образом, чтобы одна часть работала в режиме памяти (Memory Mod), а другая — в режиме App Direct.

Ключевое отличие от AD: «разделение» емкости и функциональности должно быть с самого начала, чтобы поддерживать приложения с различными требованиями, которые должны выполняться параллельно.

В смешанном режиме приложения могут пользоваться преимуществами высокопроизводительного хранилища без задержки, которую вызывает перемещение данных на шину ввода-вывода и обратно.

Intel Optane Memory

Немного о SAP HANA

SAP HANA — популярная база данных, которая лежит в основе полного пакета программного обеспечения для предприятий SAP. Технологии SAP HANA позволяют одновременно выполнять приложения OLTP и OLAP, что упрощает аналитику больших данных.

SAP HANA хранит большие объёмы данных в колонках, которые можно подвергнуть векторной обработке для сложных аналитических запросов. При этом есть ориентированное на строки дифференциальное хранилище для регистрации изменений данных, после транзакций, и включения их в столбчатую организацию.

Благодаря архитектуре SAP HANA, она пригодна для работы на серверных системах, оснащенных Intel Optane DCPMM. Так, основная часть данных, которая хранится в столбцах, может передаваться в модуль DCPMM, а часто используемая («горячая») информация (например, данные в строках) остаётся в DRAM.

SAP HANA

Тестирование производительности

У Fujitsu есть оптимальное решение PRIMEFLEX, предварительно настроенный и оптимизированный для работы с SAP HANA. Продукт объединяет серверы, СХД, сетевые компоненты и программное обеспечение. Таким образом можно просто, быстро и безопасно внедрить и ввести в эксплуатацию SAP HANA.

Инфраструктурное решение основано на SAP-сертифицированных компонентах и дополнено большим списком опций. PRIMEFLEX охватывает всё: предустановленные системы масштабирования, виртуализированные платформы VMware, индивидуальные концепции масштабирования и так далее.

Внутренние тесты Fujitsu доказали, что потери или снижение производительности SAP HANA на самом деле минимальны, когда используются серверы с конфигурациями DCPMM. Результаты были подтверждены SAP SE. Тесты проводились на двух моделях серверов PRIMERGY RX4770 M5, одна из которых оснащалась только DRAM, а другая — DCPMM и DRAM.

Точная конфигурация:

SAP HANA сервер с DRAM SAP HANA сервер с DRAM+DCPMM
Сервер FUJITSU Server PRIMERGY RX4770 M5
Процессор Intel Xeon Platinum 8280L @ 2.70 GHz x 4
Память DRAM 64GB x 48 (3.0TB) DRAM 64GB x 24 (1.5TB)
Объем DCPMM
DCPMM 128GB x 24 (3.0TB)
ОС SUSE Linux Enterprise Server 12 SP4
База данных SAP HANA 2.0 SPS03 Rev36

Сценарий тестирования:

Тест был разработан, чтобы определить, как модули DCPMM вместо DRAM влияют на производительность сервера и БД.

В частности, нужно было установить следующие характеристики:

  • Время загрузки памяти
  • Снижение производительности в параллельных запросах
  • Снижение производительности в последовательных запросах
  • Сокращение времени перезапуска систем SAP HANA

Исходя из этих целей, были предприняты следующие шаги:

  • Тест 1. Измерение времени загрузки памяти для больших наборов данных
  • Тест 2. Измерение пропускной способности в параллельных запросах
  • Тест 3. Измерение времени выполнения последовательных запросов
  • Тест 4. Измерение времени перезапуска систем SAP HANA

Результаты теста

В таблице ниже показатели производительности для конфигураций DCPMM в сравнении со значениями для DRAM. В тестах 1, 2 и 3 отмечены относительные потери производительности или прирост по сравнению с конфигурациями DRAM. Что касается теста 4, в нем время представлено в минутах.



Объем памяти, используемый SAP HANA Тест 1 Тест 2 Тест 3 Тест 4
DRAM DCPMM Итого Скорость загрузки памяти для больших наборов данных Пропускная способность в параллельных запросах Скорость выполнения последовательных запросов Время перезапуска
DRAM конфигурация (DRAM 3.0TB) 1,850GB 1,850GB 100% 100% 100% 11 минут
DRAM+DCPM конфигурация (DRAM 1.5TB + DCPMM 3.0TB) 780GB 1,147GB 1,927GB 88% 96% 101% 2 минуты
Примечания Чем выше значения, тем лучше Чем ниже значения, тем лучше

Результаты тестов производительности 1-3 на DRAM и DCPMM конфигурациях

Итоги тестирования памяти
На производительность при тестировании загрузки памяти и параллельных запросов влияет скорость, с которой можно получить доступ к данным на разных уровнях памяти. В результате относительная производительность конфигурации DCPMM была ниже, чем у его аналога DRAM. В частности, время загрузки оказалось на 12% больше, а разница в пропускной способности составила 4%. Следовательно, относительная производительность конфигурации DCPMM в тесте была аналогична конфигурации DRAM — фактически даже немного лучше, как показано в таблице выше.

Тест 4 был проведен для определения времени перезапуска обеих конфигураций после сбоя питания или регулярного перезапуска. Загрузка конфигурации с DCPMM заняла всего 2 минуты, намного опередив установку DRAM с её 11 минутами. В этом случае сохранение всех нужных данных, хранящихся в DCPMM, означает, что системе не нужно повторно извлекать эту информацию с SSD или HDD и загружать ее в основную память. Вместо этого он будет доступен сразу после завершения процесса загрузки, что приведет к значительному повышению производительности.

Решения Intel Select

Сервер SAP HANA с DRAM + DCPMM верифицирован как решение Intel Select. Intel Select — это заранее определенные, оптимизированные для рабочих нагрузок решения, разработанные для минимизации проблем, связанных с оценкой и развертыванием инфраструктуры.

Решение для SAP HANA Business Operations (на основе PRIMEFLEX для SAP HANA) базируется на сервере FUJITSU PRIMERGY RX4770 M5, интегрированном решении PRIMEFLEX для SAP HANA и спецификациях Intel Select Solution. Результаты производительности были проверены Intel.

Элемент Intel Select для SAP HANA базовая рекомендуемая архитектура — 1 узел
Платформа
Quad-socket серверная платформа, FUJITSU Server PRIMERGY RX4770 M5
Процессор
4 x Intel Xeon Platinum 8260M* или 8276M или 8280M процессоры
или 4 x Intel Xeon Gold 6238M* or 6240M* процессоры
Память
4.5 TB
(отношение 1:2)
24×128GB
Intel Optane DCPM => 3072GB + 24×64GB 4Rx4 DDR4-2933 LR ECC => 1536 GB
6.0 TB
(отношение 1:1)
24×128GB Intel Optane DC DCPM => 3072GB + 24×128GB 4Rx4 DDR4-2933 LR ECC => 3072GB
7.5 TB
(отношение 1:4)
24×256GB Intel Optane DC DCPM => 6144GB + 24×64GB 4Rx4 DDR4-2933 LR ECC => 1536 GB
Хранилище Загрузчик 2* SSD SATA 6G 240GB M.2 (зеркалированный)

HANA
Данные, логи и прочее
Внутренний диск или ETERNUS JX40 S2 (JBOD) — 16* TLC SSD 1.6TB (3DWPD) ETERNUS JX40 S2 (JBOD) 20* TLC SSD 1.6TB (3DWPD) ETERNUS JX40 S2 (JBOD) 16* TLC SSD 3.2TB (3DWPD)
Сеть
Встроенный высокопроизводительный чип Intel LBG4 с гибким LAN соединением (2*10GB / 4*1GB)
Опционально: 2* 100 Gbit Ethernet Adapters (например, для масштабирования)
ПО
ОС (минимальная или лучше): SLES4SAP 12 SP4 or RHEL4SAP 7.6
SAP HANA 2.0 SPS 03 или выше
Прошивка/Оптимизированное по руководствам SAP HANA ПО и реокмендованное SAP / Intel

Резюме

Тесты производительности SAP HANA на сервере FUJITSU Модель PRIMERGY RX4770 M5, оснащенный процессором Intel Optane DCPMM, подтвердили минимальные недостатки производительности в отношении времени загрузки памяти для больших наборов данных и пропускной способности в параллельных запросах по сравнению с конфигурацией DRAM. Кроме того, установка DCPMM работала одинаково хорошо или немного лучше в отношении последовательных запросов и превосходила своего аналога в отношении времени перезапуска.

Постоянная память Intel Optane DC стирает грань между DRAM и постоянным хранилищем для вычислений в памяти. В отличие от DRAM, постоянная память Intel Optane DC сохраняет данные, если питание сервера теряется или сервер перезагружается, но при этом обеспечивает производительность, близкую к DRAM. В операции SAP HANA это дает ощутимые преимущества:


  • Ускорение выключения, запуска и перезапуска во много раз, что значительно сокращает время простоя системы и снижает эксплуатационные расходы
  • Обработка большего объёма данных в режиме реального времени с увеличенным объемом памяти
  • Снижение совокупной стоимости владения за счёт преобразования иерархии хранения данных
  • Повышение эффективности рабочих процессов, благодаря быстрой загрузке данных при запуске.
Ответим на ваши вопросы в течение одного дня!
sales@gst-it.ru
Время работы: с 9 до 18
С понедельника по пятницу
Оставить заявку