Size: a a a

SCOM + SCorch + DPM

2018 June 02

P

Pablo in SCOM + SCorch + DPM
С айдишком MG
источник

P

Pablo in SCOM + SCorch + DPM
Вот
источник

P

Pablo in SCOM + SCorch + DPM
кажись помогло редактирование таблицы
источник

P

Pablo in SCOM + SCorch + DPM
ManagementGroup
источник
2018 June 03

P

Pablo in SCOM + SCorch + DPM
источник

P

Pablo in SCOM + SCorch + DPM
привет, кто знает из-за чего так часто меняется состояние DA?
источник

P

Pablo in SCOM + SCorch + DPM
и так у многих других DA
источник

P

Pablo in SCOM + SCorch + DPM
Tablename TotalSpace(MB) DataSize(MB) IndexSize(MB) Unused(MB) RowCount
StateChangeEvent 8544 7290 1253 1 14949101
источник
2018 June 04

P

Pablo in SCOM + SCorch + DPM
Summary
The Data Warehouse Performance Data Collection process running on the Management Server has posted data, but has not received an acknowledgement within 3 minutes that the data was written to the Data Warehouse. This indicates a connectivity or performance issue with Data Warehouse writes. This monitor will alert if no acknowledgement was received within 3 minutes, and will go back to green when there have been no issues for 5 minutes. Note that both these parameters are overrideable.
источник

P

Pablo in SCOM + SCorch + DPM
после этого события MS падает в серое состояние и красит все DA при этом у самого сервака все службы работают и SDK и мониторинг
источник

АИ

Андрей Игнатьев in SCOM + SCorch + DPM
Pablo
после этого события MS падает в серое состояние и красит все DA при этом у самого сервака все службы работают и SDK и мониторинг
а с бд нормально все? может мОчи нехватает
источник

P

Pablo in SCOM + SCorch + DPM
20 core 32 гб рам диски разгоняются до 12к IOPS на scailio зашел в перф там все ок
источник

АИ

Андрей Игнатьев in SCOM + SCorch + DPM
а в логах сиквела в этот момент нет событий "MSSQL SERVER I/O requests taking long" ? номер к сожалению не помню(
источник

АИ

Андрей Игнатьев in SCOM + SCorch + DPM
была похожая хрень одно время, правда не помню в чем выражалась, но в итоге нашли что была проблема в схд какая то там
источник

P

Pablo in SCOM + SCorch + DPM
все расследования заканчиваются печально в этом направлении - у нас все ок, иди гуляй вася
источник

АИ

Андрей Игнатьев in SCOM + SCorch + DPM
печально, у нас тоже так было до тех пор пока все больше и больше приложух не стало сообщать о проблемах с бд, в итоге я сделал алерт по данному событию, и отстук данным алертом на почту СХДешников, измором взял)) только после этого увидели какие то там задержки
источник

P

Pablo in SCOM + SCorch + DPM
ну походу никак по другому не получится решить, как только палками пиздить
источник

АИ

Андрей Игнатьев in SCOM + SCorch + DPM
а вообще странно то что произодительность сервера при этом не падала и никакими метриками это не фиксировалось
источник

P

Pablo in SCOM + SCorch + DPM
там есть интересная шняга в логах пишется что мол таймаут 1000+ секунд и тут проблема может быть на урвоне аакаунтаов прописанных в SCOM
источник

P

Pablo in SCOM + SCorch + DPM
в прошлый раз обнаружил что с DWH учеткой косяк
источник