Size: a a a

Ceph — русскоговорящее сообщество

2021 January 20

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Alibek
toshiba xg5
Ну и говнище
источник

A

Alibek in Ceph — русскоговорящее сообщество
Alex
Ну не надо с алиэкспреса брать
у поставщика взято вместе с сервером - прошивку прислал, для xg5, времени нет освободить сервер и проапгрейдить накопитель.
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Так и запишем, тошибу не брать
источник

A

Alex in Ceph — русскоговорящее сообщество
Эт десктопный какойто ссд походу
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Гнусмас бери инфа сотка
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
а какой еще в м2 может быть?
источник

A

Alibek in Ceph — русскоговорящее сообщество
Alex
Эт десктопный какойто ссд походу
да хз, входит в компатибл лист к серверу, вместо intel сказали, а интел нужной ёмкости перестал входить в этот компатиблист.
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Vyacheslav Olkhovchenkov
а какой еще в м2 может быть?
Да хотя бы микрон 7300 или самсунг pm983
источник

ПС

Павел Савин... in Ceph — русскоговорящее сообщество
источник
2021 January 21

t

timureh in Ceph — русскоговорящее сообщество
Victor Chaplinsky
А я тоже с вопросом пришёл. Может сталкивался кто с такой ситуацией: не первый раз уже зависают машины с OSD - не часто, раз в пол года, может, например, но так как их в кластере несколько, случается это не сильно редко. Кластеров таких проблемных - 2, независимых, что общего в обоих - это материнки Supermicro, в одном - X10DSC+, в другом - X10DRI-T и сетевые адаптеры: в первом - Intel i350, в другом - Intel x540 и Mellanox ConnectX-4. ОС - Centos 7, ядра - 3.10.0-1062.4.3.el7 и 3.10.0-862.14.4.el7 - штатные из репы Центоси, драйверы ixgbe также комплектные. Другие инсталляции на серверах Dell, Lenovo таким не страдают.
Что примечательно: при зависании, в консоли приглашение ввода логина светится, но курсор не мигает и ничего не вводится. А в норме экран обычно потухший, т.е. что-то будит "экран".
В логе IPMI тишина, многодневные тесты памяти проблем также не выявили.
подобное победил у себя месяц назад сделав в bios следующее по просьбе саппорта, целый год в это не верил месяц назад попробовал, и вуаля
до этого рандомно могли ребутаться (и если не стоит system-auto-reset в ipmi зависать) ноды
источник

t

timureh in Ceph — русскоговорящее сообщество
но у меня в server health логах проблема отображалась вот так
CATERR
источник

DP

Dmitry Polyakov in Ceph — русскоговорящее сообщество
Victor Chaplinsky
зависание выглядит так, что линки сетевых адаптеров подняты, но активности нет и MAC с порта коммутатора потом пропадает, активности по дискам тоже нет. Ну и, как я сказал курсов не мигает даже
Привет супермикре большой. Было такое много раз и не только с хранилками. В итоге не повторить, не найти корневую причину доказательно не получилось. Возможно виной блоки питания/провода от БП.  Ну в общем после того, как начали поддерживать актуальные прошивки - проблем вроде не было. Мы эту хрень назвали «фризы»
источник

VC

Victor Chaplinsky in Ceph — русскоговорящее сообщество
Dmitry Polyakov
Привет супермикре большой. Было такое много раз и не только с хранилками. В итоге не повторить, не найти корневую причину доказательно не получилось. Возможно виной блоки питания/провода от БП.  Ну в общем после того, как начали поддерживать актуальные прошивки - проблем вроде не было. Мы эту хрень назвали «фризы»
ох, ну и древность Вы откопали :) как раз через какое-то время после того вышло оновление BIOS, где собственно было в релизе указано, что устранено зависание, в том числе на этой платформе, обновили, аптайм у 6 нод из 7 уже по 355 дней, одна несколько месяцев назад так же подвисла, ребутнули - пока работает
источник

DP

Dmitry Polyakov in Ceph — русскоговорящее сообщество
Victor Chaplinsky
ох, ну и древность Вы откопали :) как раз через какое-то время после того вышло оновление BIOS, где собственно было в релизе указано, что устранено зависание, в том числе на этой платформе, обновили, аптайм у 6 нод из 7 уже по 355 дней, одна несколько месяцев назад так же подвисла, ребутнули - пока работает
А :) просто вчера был реплай на это сообщение :) я и подумал, что актуальная проблема
источник

VC

Victor Chaplinsky in Ceph — русскоговорящее сообщество
а вообще все вендоры небезгрешны, и с деллом приколы бывают, а один оператор (не в РФ) себе решил купить решение на базе Mars 400 от Ambedded с вендорской поддержкой, сейчас собирается менять на "стандартный ceph на стандартных supermicro" :)
источник

N

Nikita in Ceph — русскоговорящее сообщество
Как оно  было живо вообще с 4 ГБ ОЗУ на OSD? Это же вроде противоречит всем известным best practice.
источник

VC

Victor Chaplinsky in Ceph — русскоговорящее сообщество
Nikita
Как оно  было живо вообще с 4 ГБ ОЗУ на OSD? Это же вроде противоречит всем известным best practice.
это про Mars?
источник

N

Nikita in Ceph — русскоговорящее сообщество
Victor Chaplinsky
это про Mars?
Да
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Nikita
Как оно  было живо вообще с 4 ГБ ОЗУ на OSD? Это же вроде противоречит всем известным best practice.
ну пока OSD <= 4 ТБ, не противоречит
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
да и вангую, что и больше бы завелось более-менее
источник