Пусть Вы пошли на пути что лучше расположить Ваш сервис не у Вас в организации (хоть есть и статический IP
), а вынести его к облачному провайдеру, такому как Dataline
. Да все отлично, ресурсы CPU, RAM, HDD
куплены, статический IP
предоставлен бесплатно. НО вот ежедневные бекапы и план по их восстановлению у Вас как ответственного за сервис должен быть.
У меня на время карантина случилось, что я успешно избавился от CentOS + Docker
в пользу Ubuntu 18.04 Server + nginx
и т.д. Cервис "Адаптация работы портала dealers on Ubuntu 18.04 Server"
, настроил "Защита портала dealers.ekzorchik.ru через Firewalld"
. Все расписано и бекапы делают.
И тут 24.04
сервис вдруг перестает быть доступным.
Сразу же через личный кабинет https://myvdc.cloudlite.ru/billmgr формирую тикет:
Информация о запросе
Наименование услуги Стоимость диска и памяти, VDS Linux 2 (1vCPU, 2ГБ vRAM, 40ГБ) #номер_тикета (внешний_статический_ip)
От: dtlncustom@ekzorchik.ru – 2020-04-24 16:23:07
Что у нас опять с виртуалками, мы не можем даже открыть консоль и пропинговать ресурс и зайти на него по SSH
ekzorchik@navy:~/project$ ping dealers.ekzorchik.ru
PING dealers.ekzorchik.ru (внешний_статический_ip) 56(84) bytes of data.
^C
— dealers.ekzorchik.ru ping statistics —
5 packets transmitted, 0 received, 100% packet loss, time 4072ms
ekzorchik@navy:~/project$
От: dtlncustom@ekzorchik.ru – 2020-04-24 16:25:55
При выборе VM и затем нажимаю на консоль и получаю ошибку “Во время выполнения запроса произошла ошибка”
От: dtlncustom@ekzorchik.ru – 2020-04-24 16:38:49
Проблема перехода в панель управления
От: dtlncustom@ekzorchik.ru – 2020-04-24 16:39:19
Мой руководитель мечется, сервис простаивает. Да что за дела такие, ау?
От: Даниил Воложинок – 2020-04-24 16:40:46
Здравствуйте!
Консоль действительно недоступна. Пинг до ресурса есть.
Проверьте доступ сейчас, пожалуйста.
Инструкции по работе с системой Вы можете найти у нас на сайте: https://cloudlite.ru/faq/
С уважением, инженер поддержки CloudLite.
Оцените ответХорошоПлохо
От: dtlncustom@ekzorchik.ru – 2020-04-24 17:09:08
Сейчас ресурс доступен, какого хрена он не отвечал, кто за это будет отвечать и компенсировать простой.
От: dtlncustom@ekzorchik.ru – 2020-04-24 17:09:31
я даже по ssh к нему не мог подключиться, а сейчас могу.
От: Даниил Воложинок – 2020-04-24 18:38:45
Здравствуйте!
К сожалению, произошла авария. Нам необходимо исправить ситуацию на стенде виртуализации, после чего мы сможем помочь вам. К сожалению, мы не можем произвести исправление сейчас. Если начать исправление ситуации с Вашим виртуальным сервером раньше, чем со стендом в целом, то может стать хуже.
Обсуждение компенсации будем вести после нормализации ситуации.
С уважением, инженер поддержки CloudLite.
Оцените ответХорошоПлохо
От: Вахромеев Илья – 2020-04-25 11:55:39
Добрый день!
Переместили вашу ВМ srv-dealers
на другую более надежную и новую СХД. Причина простоя сервера: аппаратное повреждение оборудования хоста виртуализации.
Методика ликвидации: вывод хоста из кластера виртуализации навсегда. Перенастройка имеющихся хостов для корректной работы. Позднее будут добавлены новые хосты в кластер, чтобы мощности было достаточно для всех.
Пожалуйста подтвердите корректность работы сервера. По нашей информации должна быть в норме. Могут наблюдаться небольшие тормоза в работе. На всякий случай предварительно сохраните важные данные с него к себе на компьютер, после чего отправьте на перезагрузку.
Приносим извинения за доставленные неудобства!
С уважением, инженер поддержки CloudLite.
Вот только когда инженеры поддержки проделали свои меры по восстановлению работоспособности, операционная система Ubuntu 18.04 Server
была в режиме Read Only
и через fsck
я провел восстановление и бекап не потребовался (кстати их я всегда имею, как на самом сервере, так и у себя, т.е. бекап бекапа).
Исходя из этого делается вывод, Вы как ответственное лицо должны все же заботиться о бекапе, способе восстановления и путей решения проблем с сервером и только тогда у Вас все будет хорошо.
Кстати все же наклевывается вопрос, почему в системе мониторинга за инфраструктурой Dataline
об этом не узнали раньше, а получается по факту.
Сейчас уже июль и более проблем с сервисами пока нет.
На этом я прощаюсь, с уважением автор блога Олло Александр aka ekzorchik.