Что такое DCPMM и где её использовать
Несколько лет назад компания Intel представила энергонезависимую память Intel Optane DC (DCPMM), которая имеет большую емкость, чем DRAM, а её производительность выше, чем у SSD и HDD. Иными словами, это некий гибрид между модулем оперативной памяти и накопителем. И он стирает грань между DRAM и хранилищем данных при вычислениях в памяти.
Другое преимущество — Intel Optane DC сохраняет данные, если пропало питание сервера или оно нестабильно. При этом сохраняется производительность DRAM. Таким образом, данные сохраняются в оперативной памяти после выключения устройства.
Насколько эффективно это решение для работы? Рассмотрим на примере работы с SAP HANA.
Суть технологии
Для работы с OLTP, базами данных в памяти и других сложных задач нужно использовать ресурсы процессора, и памяти по максимуму и при этом сокращать задержки при передаче информации. Решения по базе энергонезависимой памяти (NVM) не могут до конца решить эту проблему. Выходом может стать энергонезависимая память NVRAM/NVDIMM, в том числе Intel Optane DCPMM.
Разработка DCPMM началась в середине 2000-х. В 2012 году Intel и Micron объединили усилия для совместной работы. В июле 2015 технология была показана широкой публике.
Тогда технология называлась 3D XPoint («Трехмерная точка пересечения»).
Идея заключалась в создании памяти, которая бы отвечала следующим критериям:
- Энергонезависимость
- Надежность
- Скорость выше, чем у флэш
По сути, инженеры разработали новый класс модулей, который позволил поставщикам информационно-коммуникационных технологий преодолеть ограничения классической трехуровневой модели хранения «горячих, теплых и холодных» данных.
В итоге появляется четвертый слой для «полугорячих» данных, которые пользователи и получают при включении компьютера.
Новый слой NVRAM оказывается между двумя «кольцами»: SSD (хранение данных) и DRAM с CPU (запуск приложения).
Модули DCPMM фактически переопределяют привычную иерархию памяти и хранения. На практике необходимая для запуска приложений информация оказывается доступна течение сотен наносекунд по сравнению с десятками микросекунд для SSD и миллисекунд для HDD.
Ещё одно существенное преимущество технологии: модули Intel Optane DCPMM устанавливаются в те же стандартные слоты памяти, что и DRAM. На рисунке более точное представление о том, где они находятся, чем отличаются от обычных блоков памяти и жестких дисков.
Режимы работы с постоянной памятью Intel Optane DC
Модули Intel Optane DCPMM были выпущены в апреле 2019 года вместе со вторым поколением процессоров Intel Xeon Scalable. Одной из первых компаний, которая получила новые процессоры и DCPMM стала Fujitsu. Компания внедрила новшества в системы PRIMERGY и PRIMEQUEST.
Покупатели устройств этих линеек могут выбрать один из трех режимов работы, которые лучше всего отвечают текущим потребностям.
- Memory Mode (MM)
- App Direct Mode (AD)
- Mixed Mode
В режиме Memory Mode вся емкость DCPMM работает как «классическая» ОЗУ. В этом случае операционная система и приложения рассматривают её как пул энергозависимой памяти, а DRAM используется в роли кэша.
Процессор контроллера памяти обрабатывает все операции управления кэшем. Это означает, что при запросе данных из памяти, он сначала проверяет кэш DRAM. Если данные присутствуют, скорость передачи и время ожидания идентичны DRAM. В противном случае данные считываются из модулей DCPMM с немного большей задержкой.
К слову, наличие в сервере планок памяти DRAM обязательно.
MM предпочтителен, когда нужно увеличить объём основной памяти. Например, в средах с высокой степенью виртуализации, модули DCPMM могут вмещать больше виртуальных машин и в то же время предоставлять больше памяти для каждой из них. При этом затрачивается меньше средств, чем на сравнительную по эффективности конфигурацию DRAM.
То же самое относится к рабочим нагрузкам с высокой степенью ввода-вывода, таким как аналитические и бизнес-приложения, а также большой набор устаревшего программного обеспечения.
Режим App Direct позволяет приложениям напрямую взаимодействовать с частями DCPMM. Таким образом, все важные данные хранятся в постоянной памяти в непосредственной близости от процессора, а значит сразу же доступны при загрузке части программного обеспечения.
В этом режиме ОС распознает два отдельных пула памяти и обрабатывает их соответствующим образом: часть DCPMM, резервируется для AD как постоянная память, а SDRAM функционирует как основная память.
Еще одним преимуществом такой конфигурации: DCPMM с поддержкой AD выполняет роль постоянного запоминающего устройства, но адресация проходит по байтам, как SDRAM.
Кроме того, данные из пространства App Direct DCPMM кэшируются в памяти ЦП точно так же, как из SDRAM. Система получается более согласованной, а все ядра ЦП в системе сразу получают одинаковые данные.
Ещё одна возможность: пространство App Direct можно монтировать непосредственно в ОС как сверхбыстрый SSD, делая его доступным для неизменяемых приложений.
AD Mode максимально использует DCPMM с точки зрения производительности, емкости, гибкости и простоты использования. Поэтому неудивительно, что эксперты считают этот режим работы предпочтительным для сценариев, в которых устойчивость систем и приложений, а также быстрое время загрузки/перезапуска имеют первостепенное значение.
DCPMM в конфигурациях AD особенно хорошо работает с приложениями, которые в значительной степени зависят от объема и производительности памяти, такими как базы данных в памяти и приложения для сверхбыстрого хранения.
Смешанный режим (Mixed Mode)— разновидность AD. В этом случае можно настроить DCPMM таким образом, чтобы одна часть работала в режиме памяти (Memory Mod), а другая — в режиме App Direct.
Ключевое отличие от AD: «разделение» емкости и функциональности должно быть с самого начала, чтобы поддерживать приложения с различными требованиями, которые должны выполняться параллельно.
В смешанном режиме приложения могут пользоваться преимуществами высокопроизводительного хранилища без задержки, которую вызывает перемещение данных на шину ввода-вывода и обратно.
Немного о SAP HANA
SAP HANA — популярная база данных, которая лежит в основе полного пакета программного обеспечения для предприятий SAP. Технологии SAP HANA позволяют одновременно выполнять приложения OLTP и OLAP, что упрощает аналитику больших данных.
SAP HANA хранит большие объёмы данных в колонках, которые можно подвергнуть векторной обработке для сложных аналитических запросов. При этом есть ориентированное на строки дифференциальное хранилище для регистрации изменений данных, после транзакций, и включения их в столбчатую организацию.
Благодаря архитектуре SAP HANA, она пригодна для работы на серверных системах, оснащенных Intel Optane DCPMM. Так, основная часть данных, которая хранится в столбцах, может передаваться в модуль DCPMM, а часто используемая («горячая») информация (например, данные в строках) остаётся в DRAM.
Тестирование производительности
У Fujitsu есть оптимальное решение PRIMEFLEX, предварительно настроенный и оптимизированный для работы с SAP HANA. Продукт объединяет серверы, СХД, сетевые компоненты и программное обеспечение. Таким образом можно просто, быстро и безопасно внедрить и ввести в эксплуатацию SAP HANA.
Инфраструктурное решение основано на SAP-сертифицированных компонентах и дополнено большим списком опций. PRIMEFLEX охватывает всё: предустановленные системы масштабирования, виртуализированные платформы VMware, индивидуальные концепции масштабирования и так далее.
Внутренние тесты Fujitsu доказали, что потери или снижение производительности SAP HANA на самом деле минимальны, когда используются серверы с конфигурациями DCPMM. Результаты были подтверждены SAP SE. Тесты проводились на двух моделях серверов PRIMERGY RX4770 M5, одна из которых оснащалась только DRAM, а другая — DCPMM и DRAM.
Точная конфигурация:
SAP HANA сервер с DRAM | SAP HANA сервер с DRAM+DCPMM | |
Сервер | FUJITSU Server PRIMERGY RX4770 M5 | |
Процессор | Intel Xeon Platinum 8280L @ 2.70 GHz x 4 | |
Память | DRAM 64GB x 48 (3.0TB) | DRAM 64GB x 24 (1.5TB) |
Объем DCPMM |
|
DCPMM 128GB x 24 (3.0TB) |
ОС | SUSE Linux Enterprise Server 12 SP4 | |
База данных | SAP HANA 2.0 SPS03 Rev36 |
Сценарий тестирования:
Тест был разработан, чтобы определить, как модули DCPMM вместо DRAM влияют на производительность сервера и БД.
В частности, нужно было установить следующие характеристики:
- Время загрузки памяти
- Снижение производительности в параллельных запросах
- Снижение производительности в последовательных запросах
- Сокращение времени перезапуска систем SAP HANA
Исходя из этих целей, были предприняты следующие шаги:
- Тест 1. Измерение времени загрузки памяти для больших наборов данных
- Тест 2. Измерение пропускной способности в параллельных запросах
- Тест 3. Измерение времени выполнения последовательных запросов
- Тест 4. Измерение времени перезапуска систем SAP HANA
Результаты теста
В таблице ниже показатели производительности для конфигураций DCPMM в сравнении со значениями для DRAM. В тестах 1, 2 и 3 отмечены относительные потери производительности или прирост по сравнению с конфигурациями DRAM. Что касается теста 4, в нем время представлено в минутах.
|
Объем памяти, используемый SAP HANA | Тест 1 | Тест 2 | Тест 3 | Тест 4 | ||
DRAM | DCPMM | Итого | Скорость загрузки памяти для больших наборов данных | Пропускная способность в параллельных запросах | Скорость выполнения последовательных запросов | Время перезапуска | |
DRAM конфигурация (DRAM 3.0TB) | 1,850GB | — | 1,850GB | 100% | 100% | 100% | 11 минут |
DRAM+DCPM конфигурация (DRAM 1.5TB + DCPMM 3.0TB) | 780GB | 1,147GB | 1,927GB | 88% | 96% | 101% | 2 минуты |
Примечания | Чем выше значения, тем лучше | Чем ниже значения, тем лучше |
Результаты тестов производительности 1-3 на DRAM и DCPMM конфигурациях

На производительность при тестировании загрузки памяти и параллельных запросов влияет скорость, с которой можно получить доступ к данным на разных уровнях памяти. В результате относительная производительность конфигурации DCPMM была ниже, чем у его аналога DRAM. В частности, время загрузки оказалось на 12% больше, а разница в пропускной способности составила 4%. Следовательно, относительная производительность конфигурации DCPMM в тесте была аналогична конфигурации DRAM — фактически даже немного лучше, как показано в таблице выше.
Тест 4 был проведен для определения времени перезапуска обеих конфигураций после сбоя питания или регулярного перезапуска. Загрузка конфигурации с DCPMM заняла всего 2 минуты, намного опередив установку DRAM с её 11 минутами. В этом случае сохранение всех нужных данных, хранящихся в DCPMM, означает, что системе не нужно повторно извлекать эту информацию с SSD или HDD и загружать ее в основную память. Вместо этого он будет доступен сразу после завершения процесса загрузки, что приведет к значительному повышению производительности.
Решения Intel Select
Сервер SAP HANA с DRAM + DCPMM верифицирован как решение Intel Select. Intel Select — это заранее определенные, оптимизированные для рабочих нагрузок решения, разработанные для минимизации проблем, связанных с оценкой и развертыванием инфраструктуры.
Решение для SAP HANA Business Operations (на основе PRIMEFLEX для SAP HANA) базируется на сервере FUJITSU PRIMERGY RX4770 M5, интегрированном решении PRIMEFLEX для SAP HANA и спецификациях Intel Select Solution. Результаты производительности были проверены Intel.
Элемент | Intel Select для SAP HANA базовая рекомендуемая архитектура — 1 узел | |||
---|---|---|---|---|
Платформа |
|
Quad-socket серверная платформа, FUJITSU Server PRIMERGY RX4770 M5 | ||
Процессор |
|
4 x Intel Xeon Platinum 8260M* или 8276M или 8280M процессоры или 4 x Intel Xeon Gold 6238M* or 6240M* процессоры |
||
Память |
|
4.5 TB (отношение 1:2) 24×128GB Intel Optane DCPM => 3072GB + 24×64GB 4Rx4 DDR4-2933 LR ECC => 1536 GB |
6.0 TB (отношение 1:1) 24×128GB Intel Optane DC DCPM => 3072GB + 24×128GB 4Rx4 DDR4-2933 LR ECC => 3072GB |
7.5 TB (отношение 1:4) 24×256GB Intel Optane DC DCPM => 6144GB + 24×64GB 4Rx4 DDR4-2933 LR ECC => 1536 GB |
Хранилище | Загрузчик | 2* SSD SATA 6G 240GB M.2 (зеркалированный) | ||
|
HANA Данные, логи и прочее |
Внутренний диск или ETERNUS JX40 S2 (JBOD) — 16* TLC SSD 1.6TB (3DWPD) | ETERNUS JX40 S2 (JBOD) 20* TLC SSD 1.6TB (3DWPD) | ETERNUS JX40 S2 (JBOD) 16* TLC SSD 3.2TB (3DWPD) |
Сеть |
|
Встроенный высокопроизводительный чип Intel LBG4 с гибким LAN соединением (2*10GB / 4*1GB) Опционально: 2* 100 Gbit Ethernet Adapters (например, для масштабирования) |
||
ПО |
|
ОС (минимальная или лучше): SLES4SAP 12 SP4 or RHEL4SAP 7.6 SAP HANA 2.0 SPS 03 или выше Прошивка/Оптимизированное по руководствам SAP HANA ПО и реокмендованное SAP / Intel |
Резюме
Тесты производительности SAP HANA на сервере FUJITSU Модель PRIMERGY RX4770 M5, оснащенный процессором Intel Optane DCPMM, подтвердили минимальные недостатки производительности в отношении времени загрузки памяти для больших наборов данных и пропускной способности в параллельных запросах по сравнению с конфигурацией DRAM. Кроме того, установка DCPMM работала одинаково хорошо или немного лучше в отношении последовательных запросов и превосходила своего аналога в отношении времени перезапуска.
Постоянная память Intel Optane DC стирает грань между DRAM и постоянным хранилищем для вычислений в памяти. В отличие от DRAM, постоянная память Intel Optane DC сохраняет данные, если питание сервера теряется или сервер перезагружается, но при этом обеспечивает производительность, близкую к DRAM. В операции SAP HANA это дает ощутимые преимущества:
- Ускорение выключения, запуска и перезапуска во много раз, что значительно сокращает время простоя системы и снижает эксплуатационные расходы
- Обработка большего объёма данных в режиме реального времени с увеличенным объемом памяти
- Снижение совокупной стоимости владения за счёт преобразования иерархии хранения данных
- Повышение эффективности рабочих процессов, благодаря быстрой загрузке данных при запуске.