Телеграмм чат группы sds

2020 September 24

BB

Boriss Borisovich in SDS и Кластерные FS

http://paste.openstack.org/show/798359/ - хотелось бы спросить, это нормально, пойдет, сойдет? к8с кластр на виртуалках в проксмоксе, простые хард диски.

источник

23:09пожаловаться #1

k

kvaps in SDS и Кластерные FS

Хочу поделиться с вами историей с хорошим концом.

В рамках переезда Kubernetes-кластера (стейдж, не прод), я переносил также контрол плен линстора. В качестве бэкенда используется отказоустойчивый PostgreSQL (stolon).

Как это бывает в лучших традициях, что-то пошло не так и я забэкапил не ту базу данных, а оригинал удалил. В общем пришлось востанавливаться из чудом найденного бэкапа двухмесячной давности, в котором половина созданных ресурсов в linstor отсутсвовала.

Не долго думая, я навоял простенький bash-скриптик, которым собрал имена всех LVM-томов созданных в кластере и нагенерил команды для создания одноимённых drbd-ресурсов в linstor. Нумерация tcp-портов как и drbd-девайсов не соблюдалась, информация о размерах томов была взята непосредственно из LVM-томов, то есть совпадала не полностью. Ноды, разумеется, я предварительно перезагрузил, чтобы освободить минорные девайсы drbd, которые могли бы начать конфликтовать друг с другом.

Сгенерил resource-definitions, volume-definitions и ресурсы как есть созданные на нодах.
Ресурсы создались но большитсво из них были Inconsistent / Outdated.

Тогда я прошёлся по ним:

drbdadm down $res
yes yes | drbdadm create-md $res
drbdadm up $res

после пересоздания метаданных ресурсы перешли в Inconsistent на всех репликах, что явно указывало на то, что drbd не знал какую реплику считать более актуальной, что легко пофиксилось:

drbdadm primary --force $res"
drbdadm secondary $res"

Удивительно, но все потерянные ресурсы сейчас работают как и до инциидента.

источник

23:36пожаловаться #2

G

George in SDS и Кластерные FS

kvaps

Хочу поделиться с вами историей с хорошим концом.

В рамках переезда Kubernetes-кластера (стейдж, не прод), я переносил также контрол плен линстора. В качестве бэкенда используется отказоустойчивый PostgreSQL (stolon).

Как это бывает в лучших традициях, что-то пошло не так и я забэкапил не ту базу данных, а оригинал удалил. В общем пришлось востанавливаться из чудом найденного бэкапа двухмесячной давности, в котором половина созданных ресурсов в linstor отсутсвовала.

Не долго думая, я навоял простенький bash-скриптик, которым собрал имена всех LVM-томов созданных в кластере и нагенерил команды для создания одноимённых drbd-ресурсов в linstor. Нумерация tcp-портов как и drbd-девайсов не соблюдалась, информация о размерах томов была взята непосредственно из LVM-томов, то есть совпадала не полностью. Ноды, разумеется, я предварительно перезагрузил, чтобы освободить минорные девайсы drbd, которые могли бы начать конфликтовать друг с другом.

Сгенерил resource-definitions, volume-definitions и ресурсы как есть созданные на нодах.
Ресурсы создались но большитсво из них были Inconsistent / Outdated.

Тогда я прошёлся по ним:

drbdadm down $res
yes yes | drbdadm create-md $res
drbdadm up $res

после пересоздания метаданных ресурсы перешли в Inconsistent на всех репликах, что явно указывало на то, что drbd не знал какую реплику считать более актуальной, что легко пофиксилось:

drbdadm primary --force $res"
drbdadm secondary $res"

Удивительно, но все потерянные ресурсы сейчас работают как и до инциидента.

2020 September 25

KA

Konstantin Aristov in SDS и Кластерные FS

kvaps

Хочу поделиться с вами историей с хорошим концом.

В рамках переезда Kubernetes-кластера (стейдж, не прод), я переносил также контрол плен линстора. В качестве бэкенда используется отказоустойчивый PostgreSQL (stolon).

Как это бывает в лучших традициях, что-то пошло не так и я забэкапил не ту базу данных, а оригинал удалил. В общем пришлось востанавливаться из чудом найденного бэкапа двухмесячной давности, в котором половина созданных ресурсов в linstor отсутсвовала.

Не долго думая, я навоял простенький bash-скриптик, которым собрал имена всех LVM-томов созданных в кластере и нагенерил команды для создания одноимённых drbd-ресурсов в linstor. Нумерация tcp-портов как и drbd-девайсов не соблюдалась, информация о размерах томов была взята непосредственно из LVM-томов, то есть совпадала не полностью. Ноды, разумеется, я предварительно перезагрузил, чтобы освободить минорные девайсы drbd, которые могли бы начать конфликтовать друг с другом.

Сгенерил resource-definitions, volume-definitions и ресурсы как есть созданные на нодах.
Ресурсы создались но большитсво из них были Inconsistent / Outdated.

Тогда я прошёлся по ним:

drbdadm down $res
yes yes | drbdadm create-md $res
drbdadm up $res

после пересоздания метаданных ресурсы перешли в Inconsistent на всех репликах, что явно указывало на то, что drbd не знал какую реплику считать более актуальной, что легко пофиксилось:

drbdadm primary --force $res"
drbdadm secondary $res"

Удивительно, но все потерянные ресурсы сейчас работают как и до инциидента.

пафосное превозмогание, Адептус Астартес смотрят с одобрением!!! 👍👍👍

источник

00:52пожаловаться #4

p

pragus in SDS и Кластерные FS

George

page cache не такой умный как вы думаете

Тут кое-кто утверждал что несложно сделать нотификаций от page cache что страничку подняли с диска

источник

02:24пожаловаться #5

M

Mistique in SDS и Кластерные FS

тут такое выкатили..
https://github.com/Seagate/cortx

GitHub

Seagate/cortx

CORTX Community Object Storage is 100% open source object storage uniquely optimized for mass capacity storage devices. - Seagate/cortx

источник

05:53пожаловаться #6

S

Sergey in SDS и Кластерные FS

kvaps

Хочу поделиться с вами историей с хорошим концом.

В рамках переезда Kubernetes-кластера (стейдж, не прод), я переносил также контрол плен линстора. В качестве бэкенда используется отказоустойчивый PostgreSQL (stolon).

Как это бывает в лучших традициях, что-то пошло не так и я забэкапил не ту базу данных, а оригинал удалил. В общем пришлось востанавливаться из чудом найденного бэкапа двухмесячной давности, в котором половина созданных ресурсов в linstor отсутсвовала.

Не долго думая, я навоял простенький bash-скриптик, которым собрал имена всех LVM-томов созданных в кластере и нагенерил команды для создания одноимённых drbd-ресурсов в linstor. Нумерация tcp-портов как и drbd-девайсов не соблюдалась, информация о размерах томов была взята непосредственно из LVM-томов, то есть совпадала не полностью. Ноды, разумеется, я предварительно перезагрузил, чтобы освободить минорные девайсы drbd, которые могли бы начать конфликтовать друг с другом.

Сгенерил resource-definitions, volume-definitions и ресурсы как есть созданные на нодах.
Ресурсы создались но большитсво из них были Inconsistent / Outdated.

Тогда я прошёлся по ним:

drbdadm down $res
yes yes | drbdadm create-md $res
drbdadm up $res

после пересоздания метаданных ресурсы перешли в Inconsistent на всех репликах, что явно указывало на то, что drbd не знал какую реплику считать более актуальной, что легко пофиксилось:

drbdadm primary --force $res"
drbdadm secondary $res"

Удивительно, но все потерянные ресурсы сейчас работают как и до инциидента.

Если не на проде, то не считается

источник

06:53пожаловаться #7

S

Sergey in SDS и Кластерные FS

ВН

Виталий На Заборе... in SDS и Кластерные FS

Mistique

тут такое выкатили..
https://github.com/Seagate/cortx

GitHub

Seagate/cortx

CORTX Community Object Storage is 100% open source object storage uniquely optimized for mass capacity storage devices. - Seagate/cortx

Базвордов дохуя, а что оно умеет - не понятно

источник

09:20пожаловаться #9

M

Mistique in SDS и Кластерные FS

Виталий На Заборе

Базвордов дохуя, а что оно умеет - не понятно

Нада проверять

источник

09:26пожаловаться #10

ВН

Виталий На Заборе... in SDS и Кластерные FS

Mistique

Нада проверять

Вообще когда в продукте первой строчкой идет инклюзивность, говно это, а не продукт

источник

09:39пожаловаться #11

ВН

Виталий На Заборе... in SDS и Кластерные FS

nanomechanic

https://aliexpress.ru/item/1005001424608865.html?spm=a2g0o.productlist.0.0.7df64ccetLi9SB&algo_pvid=ffb5fe99-2c1e-48c3-a6d6-4d2b340d771a&algo_expid=ffb5fe99-2c1e-48c3-a6d6-4d2b340d771a-0&btsid=0b0a119a16005252505243521e4b07&ws_ab_test=searchweb0_0,searchweb201602_,searchweb201603_

aliexpress.ru

5650.96руб. |Ceacent AO2M2PE08 M.2 M ключ + Oculink SFF8611 NVMe контроллер Quad port PCIe 3,0 X8 с plx8724 NVMe HBA|Платы расширения| | АлиЭкспресс

Покупай умнее, живи веселее! Aliexpress.com

я вот одно тут не понял - а откуда 4 порта если x8?

источник

10:48пожаловаться #12

ВН

Виталий На Заборе... in SDS и Кластерные FS

или там M.2 и U.2 порты подключены к одним и тем же контактикам?

источник

10:48пожаловаться #13

ВН

Виталий На Заборе... in SDS и Кластерные FS

или оно как-то хитро работает и допустим если подключить все 4 то они будут по x2?

источник

10:49пожаловаться #14

ВН

Виталий На Заборе... in SDS и Кластерные FS

или всё будет x4 но просто ПСП делиться будет? =)

источник

11:10пожаловаться #15

DV

Dmitry Vylegzhanin in SDS и Кластерные FS

Виталий На Заборе

или всё будет x4 но просто ПСП делиться будет? =)

Полоса делиться будет, там pci-e switch, как раз для случая, когда прямое деление(бифуркация) не поддерживается

источник

11:14пожаловаться #16

ВН

Виталий На Заборе... in SDS и Кластерные FS

kvaps

Ну нбд такое-себе, как я говорил работает достаточно плохо, по крайней мере тот коиент что в qemu-nbd

а, ой, я чот стал писать NBD прокси, а там оказывается можно тупо сделать так

LD_PRELOAD=./qemu_driver.so qemu-nbd -c /dev/nbd0 'vitastor:etcd_host=10.115.0.10\:2379/v3:pool=1:inode=2:size=21474836480'

и всё работает

источник

11:37пожаловаться #17

k

kvaps in SDS и Кластерные FS

Виталий На Заборе

а, ой, я чот стал писать NBD прокси, а там оказывается можно тупо сделать так

LD_PRELOAD=./qemu_driver.so qemu-nbd -c /dev/nbd0 'vitastor:etcd_host=10.115.0.10\:2379/v3:pool=1:inode=2:size=21474836480'

и всё работает

бгг, я же говорил уже про qemu-nbd :)

источник

11:37пожаловаться #18

ВН

Виталий На Заборе... in SDS и Кластерные FS

kvaps

бгг, я же говорил уже про qemu-nbd :)

ну так и после этого просто можно юзать /dev/nbd0

источник

11:38пожаловаться #19

ВН

Виталий На Заборе... in SDS и Кластерные FS

kvaps

бгг, я же говорил уже про qemu-nbd :)

латенси чуть хуже конечно - fio напрямую получается 0.14мс, а fio через qemu-nbd получается 0.18мс. Q=64 иопсы через qemu-nbd - примерно 45к

источник

11:38пожаловаться #20