ЦОД сертифицирован по стандарту Tier III, в залах порядок и красота — но и тогда могут происходить сбои в работе оборудования. Из нашей практики, в 90% случаев они возникают из-за неправильного подключения этого оборудования.
Вместе с Кириллом Шадским мы составили топ-7 самых частых ошибок. Не делайте так :)
1) Сервер, СХД или сетевое оборудование с двумя блоками питания подключены к одному PDU — то есть, к одному лучу.
Если пропадет соответствующий луч — оборудование отключится, а если это сетевое железо, вы потеряете связь со всей стойкой.
2) Автоматический ввод резерва (АВР) подключен обоими кабелями питания в один и тот же PDU.
3) Оборудование с одним блоком питания подключено без АВР.
4) Оборудование подключено в соседние стойки.
Когда вы будете перебрасывать энергопотребление в соседний шкаф, произойдет путаница в подключении к лучам питания.
Бардак с прокладкой проводов, угроза отключения оборудования, а также перегрев стойки, нагруженной «под завязку», — не лучшее подспорье в ИТ-хозяйстве.
5) Секции PDU перегружены.
Каждая секция стандартного PDU рассчитана на определенную силу тока. Секции нельзя перегружать, даже если соседняя совершенно свободна.
Если у стойки отключится один луч питания, нагрузку берет на себя оставшийся в живых луч. У перегруженной и перегретой секции сработают защитные автоматы, и вся эта секция с подключенным к ней оборудованием «отвалится».
6) Стойка перегружена оборудованием настолько, что вынуждена в штатном режиме «кормиться» сразу от двух лучей, один из которых резервный.
Резерв, который задействован в штатной ситуации, — это уже и не резерв.
7) Неправильная установка оборудования.
Неправильно — это когда оборудование дует в холодный коридор горячим воздухом или когда свободные юниты не закрыты заглушками. Это не связано с пунктами выше, но тоже очень важно.
Если вы сталкивались с ошибками, о которых мы не рассказали, — пишите в наш чат:
https://t.me/unidatalinechat