Хелпикс

Главная

Контакты

Случайная статья





1.2 Область применения. 2 Диагностика. Таблица регистрации изменений. Номера листов (страниц). Всего листов. (страниц). Номера док.



1. 2 Область применения

Настоящий документ предназначен для администраторовСистемы. Основная цель документа заключается в обеспечении пользователя необходимой информацией для проведения диагностики и управления оборудованием, входящим в Систему.

 

2 Диагностика

Для определения работоспособности и управления службами резервирования существуют следующие команды, представленные в таблице 1.

Таблица 1 – Перечень команд и конфигурационных файлов.

№ п/п Наименование Расположение Краткое описание
smis_cluster_status /bin Отображение состояния служб резервирования
smis_primary_init /bin Восстановление сервера в режим Primary
smis_standby_recovery /bin Восстановление второго сервера в режим Standby (Выполняется на сервере Primary)
smis_agg_FIP_watchdog /bin Создает/удаляет дополнительный IP-адрес кластера Aggregate
smis_node_failover /bin Производит проверку актуальности Primary сервера на момент включения и в случае обнаружения второго сервера в режиме Primary, имеющего более актуальную БД отключает службы резервирования
smis_pgsql_FIP_watchdog /bin Создает/удаляет дополнительный IP-адрес кластера postgresql
disable_pgsql /etc/postgresql/9. 5/main/replscripts Аварийно останавливает сервер postgresql
HS_to_PR /etc/postgresql/9. 5/main/replscripts Переводит сервер в состояние Primary
init_HS /etc/postgresql/9. 5/main/replscripts Переводит сервер в состояние Standby

 

Перечень конфигурационных файлов представлен в таблице 2.

Таблица 2 – Перечень конфигурационных файлов автоматизированных скриптов.

№ п/п Наименование Расположение Краткое описание
smis /etc/default Файл конфигурации для скриптов СМИС
cluster. log /var/log/SMIS Лог системы резервирования
im_the_master_time /etc/postgresql/9. 5/main trigger_file
im_slave /etc/postgresql/9. 5/main standby_file
postgresql. conf. primary etc/postgresql/9. 5/main/repltemplates Файлконфигурацийpostgresqlдля Primary сервера
postgresql. conf. standby etc/postgresql/9. 5/main/repltemplates Файлконфигурацийpostgresqlдля Standby сервера

 

Для проверки состояния служб резервирования серверов используется команда smis_cluster_status, результат которой представлен на рисунке 1.

Рисунок 1 - Результат выполнения команды smis_cluster_status

где,

· hostname – имя сервера;

· PGSQL_DB – статусслужбыpostgresql (online илиonline, recovery);

· PGSQL_FIP – отображает наличие IP-адреса кластера БД postgresql у конкретного сервера;

· Aggregate – статуссервера Aggregate (start или stop);

· AGG_FIP - отображает наличие IP-адреса кластера Aggregate у конкретного сервера;

Для обеспечения резервирования системы данные службы должны находиться в состоянии, представленном на рисунке 1, при котором сервер 1 является основным, а сервер 2 резервным. Данные состояния серверов обозначаются какPrimary(ubuntu-serv1) иStandby(ubuntu-serv2).

Для приведения системы резервирования к такому состоянию используются две команды smis_primary_init и smis_standby_recovery.

Команда smis_primary_init выполняется на сервере c актуальной БД и приводит его в состояние Primary. При запуске данный скрипт выполняет следующие действия:

1. проверка наличия файла логов системы резервирования, в случае отсутствия создает его.

2. запуск скрипта HS_to_PR, который выполняет следующие действия:

· проверка наличия файла конфигурации smis, в случае отсутствия в файл лога записывается ошибка, происходит завершение скрипта;

· проверка наличия standby_file и его удаление;

· создание trigger_file;

· проверка наличия recovery. conf и его удаление;

· удаление существующего postgresql. conf и копирование postgresql. conf. primary с переименованием файла в postgresql. conf;

· остановка и запуск службы postgresql.

3. запуск службы Aggregate.

Команда smis_standby_recovery выполняется на сервере в состоянии Primary и приводит второй сервер в состояние Standby. При запуске данный скрипт выполняет следующие действия:

1. проверка статуса службы postgresql, если статус не равен «online» в файл лога записывается ошибка, происходит завершение скрипта;

2. выполнение команд vacuumlo, vacuumdb, reindexdb, pgarchclean и pg_basebackup;

3. запуск скрипта init_HS на втором сервере, который выполняет следующие действия:

· проверка наличия файла конфигурации smis, в случае отсутствия в файл лога записывается ошибка, происходит завершение скрипта;

· проверка наличия trigger_file и его удаление;

· создание standby_file;

· остановка службы postgresql;

· репликация БД postgresql с первого сервера;

· создание recovery. conf с параметрами standby сервера;

· удаление существующего postgresql. conf и копирование postgresql. conf. standby с переименованием файла в postgresql. conf;

· запуск службы postgresql.

Причины срабатывания системы резервирования, переход на резервный сервер и способы восстановления в состояние PrimaryиStandby:

1. Отказ сетевой карты:

При отказе сетевой карты на первом сервере, второй сервер переходит в режим Primary. В случае последующего восстановления работоспособности сетевой карты на первом сервере происходит автоматическое отключение служб системы резервирования. Для восстановления системы резервирования необходимо:

1) на втором сервере запустить команду smis_standby_recovery, это восстановит первый сервер в состояние Standby;

2) на втором сервере остановить службу postgresql, это переведет первый сервер в состояние Primary;

3) на первом сервере запустить команду smis_standby_recovery, это восстановит второй сервер в состояние Standby;

2. Отказ postgresql:

При отключении службы postgresqlна первом сервере, служба postgresqlвторого сервера переходит в режим online. В случае данного перехода при повторном включении службы postgresqlпервого сервера происходит ее автоматическое отключение. Для восстановления системы резервирования необходимо выполнить действия, указанные в пункте 1;

3. Отказ электропитания:

При отказе электропитания на первом сервере, а за тем его возобновление, переход на резервный сервер и восстановление системы резервирования выполняется аналогично первому пункту;

4. Отказ коммутаторов:

При выключении и последующем включении коммутаторов на обоих серверах происходит автоматическое отключение служб системы резервирования. Для восстановления системы резервирования необходимо:

· запустить команду smis_primary_init на том сервере, у которого количество файлов wal-логов postgresql превышено на 1 (таким образом определяем актуальность БД);

· на этом же сервере запустить команду smis_standby_recovery, это восстановит второй сервер в состояние Standby;

· привести систему в состояние Primary(ubuntu-serv1) иStandby (ubuntu-serv2);

5. Ошибочное ручное завершение работы:

При завершении работы и последующем включении первого сервера, переход на резервный сервер и восстановление системы резервирования выполняется аналогично первому пункту;

6. При отключении питания, служб резервирования, а также сбоях сети на втором сервере, находящегося в состоянии Standby и последующем его восстановлением происходит автоматическое отключение служб системы резервирования. Для его восстановления в состояние Standby на первом сервере необходимо запустить команду smis_standby_recovery.

 

 


 


Таблица регистрации изменений

Изм.

Номера листов (страниц)

Всего листов

(страниц)

в док.

Номера док.

Подп.

Дата

Изменен-ных Заменен-ных Новых Аннулиро-ванных
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.