|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.2 Область применения. 2 Диагностика. Таблица регистрации изменений. Номера листов (страниц). Всего листов. (страниц). Номера док. ⇐ ПредыдущаяСтр 2 из 2 1. 2 Область применения Настоящий документ предназначен для администраторовСистемы. Основная цель документа заключается в обеспечении пользователя необходимой информацией для проведения диагностики и управления оборудованием, входящим в Систему.
2 Диагностика Для определения работоспособности и управления службами резервирования существуют следующие команды, представленные в таблице 1. Таблица 1 – Перечень команд и конфигурационных файлов.
Перечень конфигурационных файлов представлен в таблице 2. Таблица 2 – Перечень конфигурационных файлов автоматизированных скриптов.
Для проверки состояния служб резервирования серверов используется команда smis_cluster_status, результат которой представлен на рисунке 1. Рисунок 1 - Результат выполнения команды smis_cluster_status где, · hostname – имя сервера; · PGSQL_DB – статусслужбыpostgresql (online илиonline, recovery); · PGSQL_FIP – отображает наличие IP-адреса кластера БД postgresql у конкретного сервера; · Aggregate – статуссервера Aggregate (start или stop); · AGG_FIP - отображает наличие IP-адреса кластера Aggregate у конкретного сервера; Для обеспечения резервирования системы данные службы должны находиться в состоянии, представленном на рисунке 1, при котором сервер 1 является основным, а сервер 2 резервным. Данные состояния серверов обозначаются какPrimary(ubuntu-serv1) иStandby(ubuntu-serv2). Для приведения системы резервирования к такому состоянию используются две команды smis_primary_init и smis_standby_recovery. Команда smis_primary_init выполняется на сервере c актуальной БД и приводит его в состояние Primary. При запуске данный скрипт выполняет следующие действия: 1. проверка наличия файла логов системы резервирования, в случае отсутствия создает его. 2. запуск скрипта HS_to_PR, который выполняет следующие действия: · проверка наличия файла конфигурации smis, в случае отсутствия в файл лога записывается ошибка, происходит завершение скрипта; · проверка наличия standby_file и его удаление; · создание trigger_file; · проверка наличия recovery. conf и его удаление; · удаление существующего postgresql. conf и копирование postgresql. conf. primary с переименованием файла в postgresql. conf; · остановка и запуск службы postgresql. 3. запуск службы Aggregate. Команда smis_standby_recovery выполняется на сервере в состоянии Primary и приводит второй сервер в состояние Standby. При запуске данный скрипт выполняет следующие действия: 1. проверка статуса службы postgresql, если статус не равен «online» в файл лога записывается ошибка, происходит завершение скрипта; 2. выполнение команд vacuumlo, vacuumdb, reindexdb, pgarchclean и pg_basebackup; 3. запуск скрипта init_HS на втором сервере, который выполняет следующие действия: · проверка наличия файла конфигурации smis, в случае отсутствия в файл лога записывается ошибка, происходит завершение скрипта; · проверка наличия trigger_file и его удаление; · создание standby_file; · остановка службы postgresql; · репликация БД postgresql с первого сервера; · создание recovery. conf с параметрами standby сервера; · удаление существующего postgresql. conf и копирование postgresql. conf. standby с переименованием файла в postgresql. conf; · запуск службы postgresql. Причины срабатывания системы резервирования, переход на резервный сервер и способы восстановления в состояние PrimaryиStandby: 1. Отказ сетевой карты: При отказе сетевой карты на первом сервере, второй сервер переходит в режим Primary. В случае последующего восстановления работоспособности сетевой карты на первом сервере происходит автоматическое отключение служб системы резервирования. Для восстановления системы резервирования необходимо: 1) на втором сервере запустить команду smis_standby_recovery, это восстановит первый сервер в состояние Standby; 2) на втором сервере остановить службу postgresql, это переведет первый сервер в состояние Primary; 3) на первом сервере запустить команду smis_standby_recovery, это восстановит второй сервер в состояние Standby; 2. Отказ postgresql: При отключении службы postgresqlна первом сервере, служба postgresqlвторого сервера переходит в режим online. В случае данного перехода при повторном включении службы postgresqlпервого сервера происходит ее автоматическое отключение. Для восстановления системы резервирования необходимо выполнить действия, указанные в пункте 1; 3. Отказ электропитания: При отказе электропитания на первом сервере, а за тем его возобновление, переход на резервный сервер и восстановление системы резервирования выполняется аналогично первому пункту; 4. Отказ коммутаторов: При выключении и последующем включении коммутаторов на обоих серверах происходит автоматическое отключение служб системы резервирования. Для восстановления системы резервирования необходимо: · запустить команду smis_primary_init на том сервере, у которого количество файлов wal-логов postgresql превышено на 1 (таким образом определяем актуальность БД); · на этом же сервере запустить команду smis_standby_recovery, это восстановит второй сервер в состояние Standby; · привести систему в состояние Primary(ubuntu-serv1) иStandby (ubuntu-serv2); 5. Ошибочное ручное завершение работы: При завершении работы и последующем включении первого сервера, переход на резервный сервер и восстановление системы резервирования выполняется аналогично первому пункту; 6. При отключении питания, служб резервирования, а также сбоях сети на втором сервере, находящегося в состоянии Standby и последующем его восстановлением происходит автоматическое отключение служб системы резервирования. Для его восстановления в состояние Standby на первом сервере необходимо запустить команду smis_standby_recovery.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|