Один из методов мониторинга и анализа ошибок СУБД

Kate · 11 Фев 2024

Очень неприятная ситуация для DBA: «что-то происходит с СУБД, но что именно — нет информации». Первый и иногда достаточный способ избежать неопределенности — всегда иметь полную информацию о нештатных ситуациях в работе СУБД на текущий период и в истории. Для решения этой в общем то стандартной задачи и нужно мониторить и анализировать лог СУБД. PostgreSQL в данном случае не исключение.

К рассмотрению предлагается один из способов мониторинга ошибок СУБД PostgreSQL и получением итоговой информации, используя Zabbix. Данная статья не tutorial и не roadmap, скорее как эскиз для обмена мнениями с коллегами.

Мониторинг ошибок СУБД

Способ мониторинга СУБД очень простой — постоянный парсинг лога СУБД и оповещение о появлении ошибки.

В основе сервисного скрипта, который выполняется по cron положена очень простая конструкция:
cat $log_file | grep -E 'FATAL|ВАЖНО|PANIC|ПАНИКА|ERROR|ОШИБКА'

Данную конструкцию можно выполнять используя возможности агента Zabbix, но в этом случае есть несколько моментов:

Агент Zabbix должен иметь доступ на чтение к папке лога СУБД
Агент Zabbix имеет ограничения по timeout и в случае повышенной нагрузки на сервер и аварийной ситуации с инфраструктурой могут быть пробелы в мониторинга. А как раз в таких сценариях мониторинг ошибок особенно важен.

Поэтому используется несколько другой способ — агент Zabbix не выполняет парсинг лога СУБД, а всего лишь считывает значение метрики из файлов, которые формируются простым скриптом bash по расписанию cron:
# ERROR | ОШИБКА
cat $log_file | grep -E 'ERROR|ОШИБКА' | wc -l > /tmp/error.count

# FATAL | ВАЖНО
cat $log_file | grep -E 'FATAL|ВАЖНО' | wc -l > /tmp/fatal.count

# PANIC | ПАНИКА
cat $log_file | grep -E 'PANIC|ПАНИКА' | wc -l > /tmp/panic.count

В результате — не нужны никакие дополнительных настроек для работы агента Zabbix, да и накладные расходы на получение данных — минимальны.

Для более углубленного анализа, для некоторых кодов ошибок можно и нужно сформировать отдельные файлы:
#Класс 53 — Нехватка ресурсов
cat $log_file | grep -E 'FATAL|ВАЖНО|PANIC|ПАНИКА|ERROR|ОШИБКА' | grep -E ' 53000\|| 53100\|| 53200\|| 53400\|| 53500\|' | wc -l > /tmp/error53.count

# Класс 58 — Ошибка системы (ошибка, внешняя по отношению к PostgreSQL)
cat $log_file | grep -E 'FATAL|ВАЖНО|PANIC|ПАНИКА|ERROR|ОШИБКА' | grep -E ' 58000\|| 58030\|| 58P01\|| 58P02\|' | wc -l > /tmp/error58.count

# Класс<h3></h3> XX — Внутренняя ошибка
cat $log_file | grep -E 'FATAL|ВАЖНО|PANIC|ПАНИКА|ERROR|ОШИБКА' | grep -E ' XX000\|| XX001\|| XX002\|' | wc -l > /tmp/errorXX.count

Для оперативного реагирования на ошибки — можно и нужно настроить стандартное оповещение Zabbix:
Problem started at HH:MI:SS on YYYY.DD.MM
Problem name: ERRORXX
Host: ХХХ
...

Метрики Zabbix

В результате добавления метрик Zabbix получается вполне доступная для оперативного и исторического анализа картина:

Итог

Развитием идея является парсинг и анализ части(или всего) лога СУБД для получения сводного отчета по кодам ошибок:
Класс 25 — Неверное состояние транзакции:48
Класс 42 — Ошибка синтаксиса или нарушение правила доступа:453
Класс 57 — Вмешательство оператора:186
...

Один из методов мониторинга и анализа ошибок СУБД

Очень неприятная ситуация для DBA: «что-то происходит с СУБД, но что именно — нет информации». Первый и иногда достаточный способ избежать неопределенности — всегда иметь полную информацию о нештатных...

habr.com

LavillMat · 20 Апр 2025

5 1 4 tert butylphenoxy ethyl 4 methyl 4h 1, 2, 4 triazole 3 thiol - купить онлайн в интернет-магазине химмед
Tegs: антитела human par1 allophycocyanin mab clone 731115 - купить онлайн в интернет-магазине химмед
антитела human par1 mab clone 731115 - купить онлайн в интернет-магазине химмед
антитела human par1 phycoerythrin mab clone 731115 - купить онлайн в интернет-магазине химмед

5 1 4 tert butylphenoxy ethyl 4 methyl 4h 1, 2, 4 triazole 3 thiol - купить онлайн в интернет-магазине химмед https://chimmed.ru/products/5--1-4-tret-butilfenoksietil-4-metil-4n-124-triazol-3-tiol-id=8567333

LavillMat · 26 Апр 2025

4 ethoxycarbonylmethylphenylboronic acid, pinacol ester 95% - купить онлайн в интернет-магазине химмед
Tegs: 1 4, 5 dibromo 2 thienyl 1 ethanone 95% - купить онлайн в интернет-магазине химмед
1 4, 5 dichloro 1h imidazol 1 yl propan 2 one - купить онлайн в интернет-магазине химмед
1 4, 5 dichloroimidazolyl 2 hydroxyimino 3, 3 dimethylbutane - купить онлайн в интернет-магазине химмед

4 ethoxycarbonylmethylphenylboronic acid, pinacol ester 95% - купить онлайн в интернет-магазине химмед https://chimmed.ru/products/4-ethoxycarbonylmethylphenylboronic-acid-pinacol-ester-95-id=4346738

LavillMat · 13 Май 2025

nickel, wire reel, 20m, diameter 1 0mm - купить онлайн в интернет-магазине химмед
Tegs: cytokeratin 18 antibody 2g3 alexa fluor 532 - купить онлайн в интернет-магазине химмед
cytokeratin 18 antibody 2g3 alexa fluor 594 - купить онлайн в интернет-магазине химмед
cytokeratin 18 antibody 2g3 alexa fluor 647 - купить онлайн в интернет-магазине химмед

nickel, wire reel, 20m, diameter 2 0mm - купить онлайн в интернет-магазине химмед https://chimmed.ru/products/nickel-wire-reel-20m-diameter-20mm-id=3904964

Один из методов мониторинга и анализа ошибок СУБД

Kate

Administrator

Мониторинг ошибок СУБД

Метрики Zabbix

Итог

Один из методов мониторинга и анализа ошибок СУБД

LavillMat

Member

LavillMat

Member

LavillMat

Member

Один из методов мониторинга и анализа ошибок СУБД

Kate

Administrator

Мониторинг ошибок СУБД​

Метрики Zabbix​

Итог​

Один из методов мониторинга и анализа ошибок СУБД

LavillMat

Member

LavillMat

Member

LavillMat

Member

Мониторинг ошибок СУБД

Метрики Zabbix

Итог