Коллеги, привет.
После перезагрузки одного management-сервера (из трёх) management-группа упала, в логи кидает несколько ивентов (указаны ниже), консоль не подключается, SDK-сервис падает через минуту. Если запустить SDK-сервис от имени другого администратора (не того SDK-акка, под которым вчера всё работало) - SDK-сервис стартует и работает, консоль подключается, но ивенты в логах продолжают появляться. Есть ли у кого идеи, куда копнуть?
Понятно, что какие-то проблемы с авторизацией, но никаких изменений со старым sdk-акком не зафиксировано.
-EventID: 26340
System Center Data Access Service and/or System Center Management is unresponsive because Authorization Manager is unable to recover from database errors. Please restart services System Center Data Access Service and System Center Management.
-EventID: 26380
The System Center Data Access service failed due to an unhandled exception.
The service will attempt to restart.
Exception:
Microsoft.EnterpriseManagement.Common.SdkServiceNotInitializedException: The Data Access service has not yet initialized. Please try again.
at Microsoft.EnterpriseManagement.ServiceDataLayer.DispatcherService.get_Container()
at Microsoft.EnterpriseManagement.Mom.Sdk.Service.SdkSubService.SdkChannel.Start()
at System.Threading.ExecutionContext.RunInternal(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
at System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
at System.Threading.QueueUserWorkItemCallback.System.Threading.IThreadPoolWorkItem.ExecuteWorkItem()
at System.Threading.ThreadPoolWorkQueue.Dispatch()
-EventID: 29111
OpsMgr Management Configuration Service failed to stop due to the following exception
System.ServiceProcess.TimeoutException: Failed to perform operation. Timeout provided has expired
at Microsoft.EnterpriseManagement.ManagementConfiguration.Service.LongRunningOperationManager.ExecuteOperation(ServiceBase service, LongRunningOperationCallback callback)
at Microsoft.EnterpriseManagement.ManagementConfiguration.Service.ConfigService.StopConfigServiceEngine()
at Microsoft.EnterpriseManagement.ManagementConfiguration.Service.ConfigService.OnStop()
Пофиксили следующим образом:
удалить аккаунт SDK из SQL, остановить на всех management-серверах SCOM сервисы Data Access, Management Configuration и Microsoft Monitoring Agent, удаляем папку "Health Service State", добавляем SDK-акк в SQL и выдаём нужные права, запускаем сервисы.
Права в SQL на SDK-акк были, однако, не срабатывали. Почему - не ясно, т.к. никто изменений в правах не делал.