X

News, tips, partners, and perspectives for the Oracle Solaris operating system

Высокая доступность для Grid Engine в osgc2008

Guest Author
На прошлой неделе я представлял проект "Кластер высокой доступности с открытым кодом" на конференции по проекту с открытым кодом "Grid Cluster" в Окленде, Калифорния. На конференции были представлены три направления: проект Globus (GlobusWorld), проект Grid Engine (семинар по Grid Engine) и проект Rocks (семинар по Rocks Cluster). Мой доклад о достижении высокой доступности для Sun Grid Engine с помощью кластера высокой доступности с открытым кодом (Open HA Cluster, OHAC) был частью семинара по Grid Engine.
Я обратил внимание на то, что термин кластер , который слишком часто можно было слышать на этой конференции, используется слегка по-разному для разных продуктов и технологий. В результате я начал свой доклад с точного определения термина "кластер высокой доступности" как обозначения технологии, которую собирается представить OHAC и которая посвящена достижению высокой доступности, несмотря на возможные сбои. Небольшое голосование поднятием рук показало, что 25% участников знакомо с идеей кластера высокой доступности, а 15% знали о самом OHAC. Тогда я посвятил большую часть своего рассказа концепции единственной точки отказа, избыточности, переходу на другой ресурс при сбое и тому, как кластер OHAC восстанавливается после системных сбоев. К концу доклада я также рассказал о достижении высокой доступности для Sun Grid Engine при помощи кластера OHAC и о том, какими основными преимуществами обладают решения на базе OHAC. За эти пункты моего доклада, как и за слайды, я должен благодарить Торстена Фройфа (Thorsten Frueauf) . Основные сведения о том, как с помощью OHAC можно повысить доступность Sun Grid Engine, расположены в этой записи блога .
После презентации возникло несколько вопросов, я помню один: о том, как OHAC справляется с изменением MAC-адреса, если в результате перехода на другой ресурс при сбое меняется IP-адрес. Я объяснил, что в OHAC используются необязательные запросы протокола ARP для обновления кэша ARP всех маршрутизаторов в сети, и что за исключением очень редких случаев этот механизм работает. Другой вопрос был о восстановлении данных при сбое диска или зеркального тома и необходимости в этом случае принимать какие-то меры конечному приложению. Я ответил, что обычно такое восстановление осуществляется диспетчером томов и, к счастью, никак не влияет на конечное приложение. Инфраструктура OHAC обеспечивает наличие данных для конечного приложения там и тогда (на узле, где приложение запущено), когда приложение запускается. Еще был вопрос о скорости переключения ресурса в случае сбоя (как быстро происходит восстановление после разных типов сбоев). Я воспользовался этим вопросом, когда объяснял, как тесно интегрирован OHAC с системой Sоlaris и, следовательно, как быстро он способен определить сбой и восстановиться после него. Затем я пригласил участников посмотреть на демонстрацию переключения ресурсов на моем переносном компьютере в разделе конференции "поджарь гуру".
Я заинтересовался составом смешанной аудитории и тем, было ли в ней больше представителей сообщества ученых или коммерческих пользователей. Очередной опрос поднятием рук показал, что коммерческих пользователей было довольно много, примерно столько же, сколько было представителей учебных и исследовательских организаций. После доклада я поговорил с несколькими участниками во время перерывов на кофе и обед и встретился с большим количеством людей. Вот кого я запомнил особенно хорошо: системный администратор из европейской нефтедобывающей компании, заинтересованный в использовании Grid Engine для уменьшения количества лицензий на коммерческое программное обеспечение, используемое для анализа геологических данных; руководитель отдела ИТ в недавно созданной компании по разработке медицинского программного обеспечения в Сан-Франциско, заинтересованный в программном обеспечении с открытым кодом с целью ум��ньшения затрат; архитектор развертывания из консультационной компании в области ИТ, заинтересованный в репликации данных, зависящей от географии, и в маршрутизации поступающих заказов в зависимости от их содержимого; руководитель лаборатории из известного университета, которому нужен был простой способ обучить студентов управлению оборудованием в компьютерной лаборатории; системный администратор производителя носителей информации, которому хотелось узнать о приемах экономного наблюдения за рабочей нагрузкой.
Для демонстрации, спланированной на следующий день, я настроил на своем портативном компьютере Sun Grid Engine в качестве сервера высокой доступности между двумя зонами. Я показал, как быстро Grid Engine перезапускает службы qmaster и scheduler. Зрителям захотелось узнать побольше о том, как это происходит, в итоге я рассказал об использовании контрактов Solaris в OHAC в реализации наблюдения за процессами, что ведет к быстрому определению сбоев приложений и восстановлению после них. Большинство же просто хотело поговорить об идее кластеров вообще и об их собственных вариантах использования "распределенной вычислительной структуры и кластеров".
Слайды, которые я использовал в докладе, находятся здесь . Для пропустивших эту конференцию есть возможность получить дополнительные сведения о проектах OHAC и OpenSolaris на предстоящей конференции LinuxTag , которая пройдет в Германии, в Берлине с 28 по 31 мая 2008 года.
Фото наверху было сделано во время перерыва на кофе. Другие фотографии с конференции находятся по этой ссылке . Дейрдра Строн (Deirdré Straughan) снимала мой доклад на видео, а потом дополнила его слайдами с презентации. Щелкните встроенное окно внизу, чтобы посмотреть флэш-презентацию.

Это видел также доступно в формате iPod, и просмотреть его можно здесь . Осторожно: файл довольно большой.
Эта конференция стала для меня хорошим опытом. Я поговорил со многими людьми, рассказал им о проекте кластера высокой доступности с открытым кодом , и, кроме того, узнал, что происходит в других сообществах программистов продуктов с открытым кодом, например в проекте Grid. Надеюсь, вы нашли полезное и интересное для себя в моем блоге.
С наилучшими пожеланиями, группа инженеров Solaris Cluster, Ашутош Трипатхи

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.