Size: a a a

OpenNebula - русскоговорящее сообщество

2019 December 23

k

kvaps in OpenNebula - русскоговорящее сообщество
Vladimir P
Здравствуйте! @kvaps не тестили свой драйвер linstor_un на centos 8? А то вот решил потестить сразу и centos 8 и linstor(по статье с хабра), а тут ошибки сыпятся когда машину пытаюсь развернуть и lvm зависает на метво только перезагрузка помогает, при этом образа заливаются без проблем

Mon Dec 23 16:26:51 2019 [Z0][VM][I]: New state is ACTIVE
Mon Dec 23 16:26:51 2019 [Z0][VM][I]: New LCM state is PROLOG
Mon Dec 23 16:31:54 2019 [Z0][TM][I]: Command execution failed (exit code: 21): /var/lib/one/remotes/tm/linstor_un/clone tmpse:/dev/drbd/by-res/one-image-10/0 node3:/var/lib/one//datastores/110/42/disk.0 42 111
Mon Dec 23 16:31:54 2019 [Z0][TM][I]: /var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 227: local: `HOSTS_ARRAY+': not a valid identifier
Mon Dec 23 16:31:54 2019 [Z0][TM][I]: /var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 287: "0x1380001" & "0xC000000000000000" : syntax error: operand expected (error token is ""0x1380001" & "0xC000000000000000" ")
Mon Dec 23 16:31:54 2019 [Z0][TM][I]: /var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 287: [: ==: unary operator expected
Mon Dec 23 16:31:54 2019 [Z0][TM][E]: Command "linstor snapshot create one-image-10 one-vm-42-disk-0" failed: Error: Socket timeout, no data received for more than 300s.
Mon Dec 23 16:31:54 2019 [Z0][TM][I]: /var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 287: "0x3380002" & "0xC000000000000000" : syntax error: operand expected (error token is ""0x3380002" & "0xC000000000000000" ")
Mon Dec 23 16:31:54 2019 [Z0][TM][I]: /var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 287: [: ==: unary operator expected
Mon Dec 23 16:31:54 2019 [Z0][TM][E]: Error executing image transfer script: Command "linstor snapshot create one-image-10 one-vm-42-disk-0" failed: Error: Socket timeout, no data received for more than 300s.
привет, ошибка с unary operator expected решена, обновите плагин из репозитория.
А вот это действительно проблема:
Command "linstor snapshot create one-image-10 one-vm-42-disk-0" failed: Error: Socket timeout, no data received for more than 300s.
источник

VP

Vladimir P in OpenNebula - русскоговорящее сообщество
Ага увидел что обновили, сейчас как раз тестирую)
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
попробуйте выполнить команду вручную на ноде опеннебулы и провертьте работоспособность линстора вообще
источник

VP

Vladimir P in OpenNebula - русскоговорящее сообщество
/var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 227: local: `HOSTS_ARRAY+': not a valid identifier
да вот эта ошибка осталась пока local не уберёшь
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
Vladimir P
/var/lib/one/remotes/tm/linstor_un/../../datastore/linstor_un/linstor_utils.sh: line 227: local: `HOSTS_ARRAY+': not a valid identifier
да вот эта ошибка осталась пока local не уберёшь
спасибо, исправил
источник
2019 December 25

T

Timur in OpenNebula - русскоговорящее сообщество
народ, никто не тестил такой момент: Есть три HOST. Есть три виртуалки, разделенные  на 2 роли. Условные 2 фронта, 1 бэк. Между этими ролями стоит ограничение ANTI_AFFINED, т.е они наливаются на разные физические тачки. Вопрос: если выходит  из строя HOST на котором живет бэк, отработает ли для него HA ? или сработает ограничение и шедулер не найдет HOST на который переместить ?
источник

T

Timur in OpenNebula - русскоговорящее сообщество
не работает из коробки HA виртуалки :(
источник

T

Timur in OpenNebula - русскоговорящее сообщество
HOST_HOOK = [
   name      = "error",
   on        = "ERROR",
   command   = "ft/host_error.rb",
   arguments = "$ID -m -p 0",
   remote    = "no" ]
источник

T

Timur in OpenNebula - русскоговорящее сообщество
хост ребутается, но ничего не происходит
источник
2019 December 26

T

Timur in OpenNebula - русскоговорящее сообщество
Timur
не работает из коробки HA виртуалки :(
во-первых надо было ручками с помощью команды onehook создать HOST_HOOK, во-вторых вырубить fencing
источник

T

Timur in OpenNebula - русскоговорящее сообщество
@kvaps после того как отрабатывает HOST_HOOK и начинается миграция(опция -m в хуке), возникает ошибка:
источник

T

Timur in OpenNebula - русскоговорящее сообщество
Thu Dec 26 09:06:02 2019 [Z0][VM][I]: New LCM state is RUNNING
Thu Dec 26 09:07:53 2019 [Z0][VM][I]: New LCM state is UNKNOWN
Thu Dec 26 09:08:03 2019 [Z0][VM][I]: New LCM state is PROLOG_MIGRATE_UNKNOWN
Thu Dec 26 09:08:03 2019 [Z0][VM][I]: New state is ACTIVE
Thu Dec 26 09:08:10 2019 [Z0][TM][I]: Command execution failed (exit code: 1): /var/lib/one/remotes/tm/linstor_un/mv cm3data:/var/lib/one//datastores/100/19/disk.0 cm2data:/var/lib/one//datastores/100/19/disk.0 19 101
Thu Dec 26 09:08:10 2019 [Z0][TM][E]: Command "linstor resource delete cm3data one-image-5 --async" failed: (Node: 'cm2data') Failed to adjust DRBD resource one-image-5 Error reports: [ 5E0477E1-05E68-000000 ] (Node: 'cm1data') Failed to adjust DRBD resource one-image-5 Error reports: [ 5E01D326-0E1CC-000009 ]
Thu Dec 26 09:08:10 2019 [Z0][TM][E]: Error executing image transfer script: Command "linstor resource delete cm3data one-image-5 --async" failed: (Node: 'cm2data') Failed to adjust DRBD resource one-image-5 Error reports: [ 5E0477E1-05E68-000000 ] (Node: 'cm1data') Failed to adjust DRBD resource one-image-5 Error reports: [ 5E01D326-0E1CC-000009 ]
Thu Dec 26 09:08:10 2019 [Z0][VM][I]: New LCM state is PROLOG_MIGRATE_UNKNOWN_FAILURE
источник

T

Timur in OpenNebula - русскоговорящее сообщество
Failed to adjust DRBD resource one-image-5
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
Это после отвала ноды?
источник

T

Timur in OpenNebula - русскоговорящее сообщество
Additional information:
   The full command line executed was:
   drbdadm -vvv adjust one-image-5

   The external command sent the following output data:
   drbdsetup del-peer one-image-5 2


   The external command sent the following error information:
   Value of 'rs-discard-granularity' differs: r=524288 c=65536
   Command 'drbdsetup del-peer one-image-5 2' did not terminate within 5 seconds
источник

T

Timur in OpenNebula - русскоговорящее сообщество
да. я ее ребутаю
источник

T

Timur in OpenNebula - русскоговорящее сообщество
почему-то не отработал линстор на живых нодах
источник

T

Timur in OpenNebula - русскоговорящее сообщество
разбираюсь
источник

T

Timur in OpenNebula - русскоговорящее сообщество
ребутается cm3data
источник

T

Timur in OpenNebula - русскоговорящее сообщество
Command "linstor resource delete cm3data one-image-5 --async" failed: (Node: 'cm2data') Failed to adjust DRBD resource one-image-5 Error reports: [ 5E0477E1-05E68-000000 ]
источник