Мониторинг сервера и сайта
Мы развернули собственную платформу мониторинга 24/7 для Linux VPS и сайтов клиентов. Система непрерывно собирает метрики инфраструктуры и доступности, заранее предупреждает команду о сбоях и помогает устранять инциденты до того, как они заметны пользователям и поисковикам.
Как устроен мониторинг
- Экспортёры отдают метрики с серверов и сервисов (Node Exporter, cAdvisor, Blackbox для HTTP/TCP/TLS).
- Prometheus собирает данные (инфраструктура - каждые 15 секунд, сайт - каждые 30 секунд) и применяет правила алертов.
- Alertmanager группирует уведомления и отправляет их в Telegram
, email и служебный вебхук. - Grafana даёт дашборды по флоту серверов и отдельным хостам: нагрузка, диск, задержки, SSL.
- ИИ-агент диагностики в режиме только чтения анализирует инцидент из вебхука и присылает краткий отчёт с гипотезой и планом действий.
Что отслеживаем
Критичные события
- Сайт недоступен более 2 минут
- TCP-эндпоинт БД недоступен более 1 минуты
- Свободное место на диске менее 10%
- До истечения TLS-сертификата менее 7 дней
Предупреждения
- CPU выше 85% в течение 10 минут
- RAM выше 90% в течение 10 минут
- Доля ответов 5xx выше 2% в течение 5 минут
- P95 задержка выше 1,5 секунды в течение 10 минут
Что получает ваш бизнес
- Раннее обнаружение сбоев - часто до жалоб клиентов и падения продаж
- Прозрачная картина по серверу и сайту в одном месте
- Оперативные уведомления ответственным в Telegram
и на email - Мониторинг входит в техническое сопровождение сайтов на 1С-Битрикс
Нужна такая же надёжность для вашего проекта?
Оставьте заявку на поддержку сайта - подключим мониторинг и сопровождение под вашу инфраструктуру.
-
Загрузка сервера, память и свободное место на диске
-
Срок действия SSL-сертификата и домена
-
Критические ошибки в логах и события 1С-Битрикс
-
Уведомления в Telegram
или на email
-
Доступность сайта и время ответа