Телеграмм чат группы sds

00:19пожаловаться #1

1) Страдает read latency, т.к. половина данных жила локально
2) Страдает write latency, т.к. обе копии удалённые, и completion latency из-за network jitter+ssd lat distribution будет выше чисто статистически.

00:19пожаловаться #2

Это не теория, у меня даже тесты есть в рукаве :)

00:19пожаловаться #3

а с чего вы взяли, что чтение и запись делались локально до vmotion? Алгоритмы распределения данных по узлам абсолютно не связаны с алгоритмами выбора узла размещения ВМ. При этом мы возвращаемся к теме data locality, где я не слышал, как это хоть сколько нибуть значимо отражается на результатах. С другой стороны, вслед за миграцией ВМ между узлами переезжает DOM Owner в течении 15-60 секунд + RAM Read Cache тоже сбрасывается и запускается на новом узле

00:23пожаловаться #4

ну да - если ничего не изменилось, то «AHV, согласно, вот этой вроде бы актуальной доке (https://portal.nutanix.com/... просто смотрит каждые 15 минут на CPU Utilization ноды и если загрузка превышает 85% думает куда бы ему смигрировать ВМ:
«ADS tracks each individual node’s CPU and memory utilization. When a node’s CPU allocation breaches its threshold (currently 85 percent of CVM CPU), Nutanix migrates VMs or Nutanix Volumes off that host as needed to rebalance the workload.». При этом из метрик - загрузка CPU, просто объем RAM ВМ (потому что AHV не умеет в переподписку по RAM) и загрузку CPU storage controller на узлах (https://next.nutanix.com/ho.... Поэтому если у вас CPU загружен менее, чем на 85%, то совершенно не важно как там cебя чувствуют ВМ и что там с ресурсами в кластере - никакой миграции не будет.» из комментов тут - https://www.vmgu.ru/news/vmware-drs-vsphere-7-performance

00:24пожаловаться #5

Мне казалось, что initial placement и rebalance алгоритмы именно что кладут 1 копию на хост с ВМ (если есть такая возможность). Или это не так?

00:26пожаловаться #6

The Cloud Platform Tech Zone

ну мне такое, как минимум, неизвестно. Плюс я не вижу в этом никакого смысла с учетом того, что описано тут https://core.vmware.com/resource/understanding-data-locality-vmware-vsan

Understanding Data Locality in VMware vSAN | VMware

This document discusses how vSAN design choices exploit data locality to deliver superior aggregate performance while retaining simplicity and efficiency.

00:27пожаловаться #7

Почитаю.

HCI Architecture Matters – Nutanix AOS vs the competition & their Cache Drives & Disk Groups

00:28пожаловаться #8

Alexander in SDS и Кластерные FS

Вот реальные данные, с реальным +50% скорости VM за счет даталокалити, если задержки по сети ниже чем чтение локального nvme почему такие данные ? http://www.joshodgers.com/2020/08/10/hci-architecture-matters-nutanix-aos-vs-the-competition-their-cache-drives-disk-groups/

CloudXC

As the HCI market continues to grow and with the ever increasing number of customers successfully using HCI solutions, the more critical workloads are being migrated from legacy storage (SAN/NAS) a…

00:53пожаловаться #9

Alexander in SDS и Кластерные FS

или в 2 раза быстрее ?

00:55пожаловаться #10

как и в любой другой статье эээ.. господина Оджерса - я понятия не имею, что, как и на чем он запускал. Все тесты, которые я запускаю имеют полное детальное описание на чем, как и в каких условиях были запущены тесты. Любой желающий может взять и повторить.

00:59пожаловаться #11

и опять таки - я понятия не имею с чего он взял, что результат связан с data locality. у меня просто нет всех нормальных данных - он просто бросает на вентилятор, как обычно

00:59пожаловаться #12

поэтому я еще раз прошу повторить тест, где 20 us в госте + полный конфиг железа/софта + fio

01:01пожаловаться #13

Alexander in SDS и Кластерные FS

кстати, какая-то vm в бакап пошла, и я спать пойду, всем спасибо.

01:04пожаловаться #14

Alexander in SDS и Кластерные FS

на днях выйдет бесплатный CE на SPDK, сделаю

01:06пожаловаться #15

V in SDS и Кластерные FS

Ну тут что считать недоутилизацией. Держим 70-80 процентов. Ничего особо не ездит. Но называть недоутилизацией это не могу

01:06пожаловаться #16

V in SDS и Кластерные FS

Сап хана, не будь она к ночи помянута

01:06пожаловаться #17

70-80% - выглядит, как нормальная утилизация в отличии от скриншотов выше, где 30% по CPU и 50% по RAM. Почему при этом не ездят ВМ - я не в курсе (может у вас безумно ровная нагрузка на всех ВМ). Я просто превел статистику с VMware, где DRS учитывает попадания в CPU Cache, утилизилазацию сети, RAM, CPU Ready и т.д. Когда у нас в инфре была утилизация по CPU под 90%, а RAM работал с balloon+TPS, то было порядка 30 миграций в день для каждой ВМ

Petr Antonov in SDS и Кластерные FS

01:11пожаловаться #18

Ребят, то что вы нафлудили тут за пару дней - бесценно! 👍
Это прямо в вики нужно оформить!

Nik Sh in SDS и Кластерные FS

08:57пожаловаться #19

Вы меня конечно извините, но например голды второго поколения при 50% утилизации уже начинают частоты дропать на некоторых ядрах. 80% утилизации cpu на гипервизоре на них - это жопа. АМД, кстати в таких ситуация получше, но все равно имеет место.