Немного о подсистеме хранения в Windows Server 2012

Зафиксирую немного информации с семинара IT CAMPS, посвящённого Windows Server 2012 и «облакам». Более всего показалось интересным про нововведения в подсистеме хранения. А именно — Storage Spaces и дедупликация.

Storage Spaces (Пулы носителей)

Storage Spaces — это своеобразная эволюция RAID. Практически, Microsoft подошли к механизму организации ресурсов хранения так, как это уже довольно давно реализовано в системах хранения данных. Если упрощённо, на пальцах, то механизм такой:

— В сервер мы наталкиваем N дисков.
— Диски мы объединяем в пулы — можно все объединить в один пул, можно несколько пулов сделать. Имеет смысл делить пулы по типам дисков (то есть по скоростям их работы, то есть все SAS — в один пул, все SATA 7200 — в другой и т.д.) и/или по типам RAID, указываемым для каждого пула (поддерживаются зеркалирование [RAID1], чётность [RAID5] и, стандартно, RAID0).
— В пулах мы создаём логические диски необходимого нам объёма. Аналоги LUN в СХД.

В чём преимущество, по сравнению с предыдущим подходом? Более упрощённое управление дисковыми ресурсами. Создав разово пулы, можно потом аккуратно отрезать себе логические диски нужного объёма, производительности и отказоустойчивости, не заморачиваясь с нарезкой RAID. Кроме того (и это ключевое, на мой взгляд), появилась возможность создавать логические диски в режиме Thin. То есть резиновые. Которые будут занимать на физических ровно столько места, сколько занимают их данные. А это значит, что на одном пуле, ёмкостью, скажем, в 100 ГБ мы можем создать, например, 5 логических дисков, по 50 ГБ предельной ёмкости каждый. То есть, суммарно 250. Конечно, если мы два из этих пяти дисков тут же забьём данными под завязку, то на остальные три уже ничего записать не получится. Но эта технология является спасением от ситуаций, когда мы разметили диск в 1 ТБ, например как 500 ГБ под данные пользователей и 500 ГБ под базу данных, а в результате через год наблюдаем картину, что база данных занимает 150 ГБ и на диске больше половины свободного места, а пользователи забили весь свой диск и жалуются на простои в работе. (Пример условный, т.к. пользовательские папки общего доступа и файлы БД на одном пуле при thin-дисках я бы размещать не решился во избежание факапов.)

Было у меня одно опасение — что произойдёт, если ОС вдруг решит упасть и рассыпаться? Ладно если из-за программного сбоя или вируса, но аппаратный крах сервера вызывал ещё больше вопросов.

Оказывается, вся информация о пулах носителей и хранящихся на них логических дисках и данных размещена на самих дисках. И, в случае необходимости, мы просто переносим все диски на новый сервер, втыкаем их в любом порядке и новый сервер (при условии, что он — Windows Server 2012) собирает их в исходный вид.

Дедупликация

Что такое дедупликация, можно понять из следующей иллюстрации:

ru-deduplication_big

Грубо говоря, все идентичные экземпляры данных после дедупликации занимают место одного единственного экземпляра. То есть,  если у вас на диске 33 папки, в каждой из которых лежит фильм «Криминальное чтиво» на 4 ГБ, то до дедупликации на диске будет занято 132 ГБ, после — 4 ГБ. Если все 33 фильма разные, то вряд ли разница будет существенной.

Дедупликация бывает блочная, которая до сих пор была реализована из всех известных мне СХД только на NetApp и файловая, которую, без особого, впрочем энтузиазма, озвучивали некоторые другие производители СХД.

Надо ли говорить, что дедупликация на блочном уровне куда практичнее, чем на файловом.

В Windows Server 2012 реализована именно блочная дедупликация.

Включается в свойствах диска, является необратимым изменением. То есть отключить будет нельзя. Включить её можно только на томах NTFS (даже новая файловая система самого Windows Server 2012 — ReFS — не поддерживается).

Дедупликация — это фоновый процесс, выполняемый по расписанию (какому — непонятно, сказано лишь, что главный приоритет — не загрузить этим процессом систему). Дедупликации не подвергаются файлы размером меньше 32 КБ. В настройках  можно также исключить файлы по расширению и указать директории, содержимое которых не должно подвергаться дедупликации. А также указать минимальное время, которое файл должен провести на диске, после чего его можно будет дедуплицировать.

Windows 8 изначально данную технологию не поддерживает. Однако, нужные библиотеки можно перенести из серверного дистрибутива. Правда, графического интерфейса всё равно не будет, придётся настраивать исключительно средствами PowerShell.

Если воткнуть дедуплицированный диск в компьютер с ОС Windows младше чем WIndows Server 2012, то есть не понимающую дедупликации, то диск будет открываться, файлы будут видны, но открываться файлы будут только те, которые не были подвержены процессу. C’est la vie.

В общем, весьма достойные изменения в новом сервере.

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s