Міжнародная канферэнцыя распрацоўнікаў і карыстальнікаў свабодных праграм

Система хранения Colobridge Cloud Platform

Александр А. Шваяков, Минск, Беларусь

LVEE Winter 2014

The overview of Storage system architecture, scaling aspects, hardware and software choice.

Когда возникает необходимость в создании инфраструктуры для предоставления ИТ как услуги (ITaaS), развертывании услуг облачного хранения в центре обработки данных приходится серьезно задумываться о надежности, производительности и стоимости решения.

РАСПОЛОЖЕНИЕ КОМПЛЕКСА
Комплекс ColoBridge Cloud Platform размещается в информационном и деловом центре Европы – во Франкфурте на Майне.
Гарантируется доступность кондиционирования, электропитания и сети на уровне не ниже 99.999% в месяц.

ОБОРУДОВАНИЕ
В качестве кандидатов для платформы системы хранения рассматривались различные готовые аппаратные и программные решения.
Выбор оборудования осуществлялся по критериям надежности, производительности, масштабируемости, доступности замены и стоимости.

ОПЕРАЦИОННАЯ СИСТЕМА
Для построения базовых узлов системы хранения данных мы используем открытую операционную систему OmniOS.
Эта система – одна из свободных ветвей развития OpenSolaris, наследника Sun Solaris.
Идеология и особенности этой операционной системы обеспечивает самые комфортные условия для разработки оптимальных стратегий реализации высокой доступности.
Выбор OmniOS определялся наличием коммерческой технической поддержки и минимализмом дистрибутива — ничего лишнего.

ФАЙЛОВАЯ СИСТЕМА ZFS
Уникальные характеристики и возможности ZFS просто не оставляют другого выбора для построения современной системы хранения.
Революционная архитектура стека ввода вывода, принципов кэширования, фантастическая производительность, надежность и быстрое развитие этого Open Source проекта почти не оставляют шансов конкурентам.

ПРИНЦИП ОРГАНИЗАЦИИ ПРОСТРАНСТВА СХД
Пространство СХД распределяется особым образом для достижения максимальных параметров надежности и производительности. При этом обеспечивается гармония резервирования элементов и распределения нагрузки.

СХД: ЗАДАЧИ И СЦЕНАРИИ
В рамках проекта ColoBridge Cloud Platform мы разработали свою систему хранения данных по принципу конвергентной структуры которая отличается полиморфной простотой и универсальностью.

Мы рассматриваем нашу СХД как строительный «кирпич» который можно использовать в разных конструкциях и задачах по разным сценариям.

Основное назначение СХД – пространство хранения данных для серверов виртуализации и выделенных серверов в структуре облачного хостинга.
Виртуальные машины и образы файловой системы должны свободно перемещаться между узлами.
Все объекты и пути автоматически резервируются и агрегируются для увеличения производительности.

Возможны сценарии с выделением обособленной системы для клиента.
Таких сценариев может быть много — с разной степенью изоляции и консолидации.
Для клиента можно предоставлять полную изоляцию, частичную или полную интеграцию в нашу инфраструктуру. Даже при минимальных вложениях это позволит иметь обособленную систему хранения с полномасштабным режимом высокой доступности.

ОТКАЗОУСТОЙЧИВОСТЬ
Расчетный показатель времени непрерывной работы нашей системы составляет 99,999%.
В ходе конструирования системы и стратегии обслуживания мы уделили немало внимания сокращению длинны доменов отказа, тщательно искали пути к сокращению времени обнаружения отказов и восстановления системы.
Кроме аппаратных и архитектурных решений направленных на укрепление надежности мы используем High Availability (HA) Cluster RSF-1.
RSF-1 позволяет контролировать в ручном и автоматическом режиме до 200 критически важных приложений и служб в кластере от 2 до 64 узлов.

РЕЗЕРВНОЕ КОПИРОВАНИЕ
Для задач резервного копирования используются рекурсивные снапшоты отдельных наборов данных файловых систем и и сетевая репликация на сервер резервного копирования.
Для реализации устойчивости к катастрофам может выполнятся асинхронная репликация определенного набора данных ZFS через 10GbE на узел в другом ДЦ.

УПРАВЛЕНИЕ
Взаимодействие с системой осуществляется только через perl, bash по принципу проективной системы.

МОНИТОРИНГ
Для мониторинга системы используются внутренний механизм определения неполадок Solaris Fault Manager, средства ZFS, RSF-1 и HA Zabbix.

ДИАГНОСТИКА ПРОБЛЕМ
Для диагностики используется богатый арсенал специализированных утилит системы и диагностический фреймворк DTrace.

ПРОИЗВОДИТЕЛЬНОСТЬ И ТЕСТЫ
Особенности СХД позволяют определить производительность как конструктивный параметр. Это значит, что можно получить любые разумные параметры производительности соответствующей композицией элементов.

Abstract licensed under Creative Commons Attribution-ShareAlike 3.0 license

Назад