Пусть Вы пошли на пути что лучше расположить Ваш сервис не у Вас в организации (хоть есть и статический IP), а вынести его к облачному провайдеру, такому как Dataline. Да все отлично, ресурсы CPU, RAM, HDD куплены, статический IP предоставлен бесплатно. НО вот ежедневные бекапы и план по их восстановлению у Вас как ответственного за сервис должен быть.

У меня на время карантина случилось, что я успешно избавился от CentOS + Docker в пользу Ubuntu 18.04 Server + nginx и т.д. Cервис "Адаптация работы портала dealers on Ubuntu 18.04 Server", настроил "Защита портала dealers.ekzorchik.ru через Firewalld". Все расписано и бекапы делают.

И тут 24.04 сервис вдруг перестает быть доступным.

Сразу же через личный кабинет https://myvdc.cloudlite.ru/billmgr формирую тикет:

Информация о запросе

Наименование услуги   Стоимость диска и памяти, VDS Linux 2 (1vCPU, 2ГБ vRAM, 40ГБ) #номер_тикета (внешний_статический_ip)

От: dtlncustom@ekzorchik.ru – 2020-04-24 16:23:07

Что у нас опять с виртуалками, мы не можем даже открыть консоль и пропинговать ресурс и зайти на него по SSH

ekzorchik@navy:~/project$ ping dealers.ekzorchik.ru

PING dealers.ekzorchik.ru (внешний_статический_ip) 56(84) bytes of data.

^C

— dealers.ekzorchik.ru ping statistics —

5 packets transmitted, 0 received, 100% packet loss, time 4072ms

ekzorchik@navy:~/project$

От: dtlncustom@ekzorchik.ru – 2020-04-24 16:25:55

При выборе VM и затем нажимаю на консоль и получаю ошибку “Во время выполнения запроса произошла ошибка”

От: dtlncustom@ekzorchik.ru – 2020-04-24 16:38:49

Проблема перехода в панель управления

От: dtlncustom@ekzorchik.ru – 2020-04-24 16:39:19

Мой руководитель мечется, сервис простаивает. Да что за дела такие, ау?

От: Даниил Воложинок – 2020-04-24 16:40:46

Здравствуйте!

Консоль действительно недоступна. Пинг до ресурса есть.

Проверьте доступ сейчас, пожалуйста.

Инструкции по работе с системой Вы можете найти у нас на сайте: https://cloudlite.ru/faq/

С уважением, инженер поддержки CloudLite.

Оцените ответХорошоПлохо

От: dtlncustom@ekzorchik.ru – 2020-04-24 17:09:08

Сейчас ресурс доступен, какого хрена он не отвечал, кто за это будет отвечать и компенсировать простой.

От: dtlncustom@ekzorchik.ru – 2020-04-24 17:09:31

я даже по ssh к нему не мог подключиться, а сейчас могу.

От: Даниил Воложинок – 2020-04-24 18:38:45

Здравствуйте!

К сожалению, произошла авария. Нам необходимо исправить ситуацию на стенде виртуализации, после чего мы сможем помочь вам. К сожалению, мы не можем произвести исправление сейчас. Если начать исправление ситуации с Вашим виртуальным сервером раньше, чем со стендом в целом, то может стать хуже.

Обсуждение компенсации будем вести после нормализации ситуации.

С уважением, инженер поддержки CloudLite.

Оцените ответХорошоПлохо

От: Вахромеев Илья – 2020-04-25 11:55:39

Добрый день!

Переместили вашу ВМ srv-dealers на другую более надежную и новую СХД. Причина простоя сервера: аппаратное повреждение оборудования хоста виртуализации.

Методика ликвидации: вывод хоста из кластера виртуализации навсегда. Перенастройка имеющихся хостов для корректной работы. Позднее будут добавлены новые хосты в кластер, чтобы мощности было достаточно для всех.

Пожалуйста подтвердите корректность работы сервера. По нашей информации должна быть в норме. Могут наблюдаться небольшие тормоза в работе. На всякий случай предварительно сохраните важные данные с него к себе на компьютер, после чего отправьте на перезагрузку.

Приносим извинения за доставленные неудобства!

С уважением, инженер поддержки CloudLite.

Вот только когда инженеры поддержки проделали свои меры по восстановлению работоспособности, операционная система Ubuntu 18.04 Server была в режиме Read Only и через fsck я провел восстановление и бекап не потребовался (кстати их я всегда имею, как на самом сервере, так и у себя, т.е. бекап бекапа).

Исходя из этого делается вывод, Вы как ответственное лицо должны все же заботиться о бекапе, способе восстановления и путей решения проблем с сервером и только тогда у Вас все будет хорошо.

Кстати все же наклевывается вопрос, почему в системе мониторинга за инфраструктурой Dataline об этом не узнали раньше, а получается по факту.

Сейчас уже июль и более проблем с сервисами пока нет.

На этом я прощаюсь, с уважением автор блога Олло Александр aka ekzorchik.