Size: a a a

Ceph — русскоговорящее сообщество

2020 June 20

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
От данных собственно зависит какими блоками ты их читаешь
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
сам диск в принципе можно достаточно точно апроксимировать упрощенной можелью, в который мы фиксируем среднюю задержку доступа к данным (для типичного hdd 7200 rpm это примерно 14мс -- 4.2мс от вращения и 9 с копейками от позиционирования)
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Ну вот у тебя 3 тб данных. Так у тебя все 3 тб на каждом хосте. А так делим их на 3 группы: в первой чётность на первом, во второй на втором, в третьей на третьем. В итоге у тебя на каждом осд 1 тб данных и 0.5 тб чётности. Вот и будет он свой 1 тб отдавать спокойно. Объекты - какие-то картиночки там, всё такое. Ну порядка 1 мб. Разницы будет мало - разница будет только из-за того что условно вот объект 512 кб чтобы прочитать - ты его прочитаешь с 2 хостов по 256 кб. Но фактически это не такая большая разница
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
Виталий На Заборе
От данных собственно зависит какими блоками ты их читаешь
ну нет же. если ты радосгв на ec положил то у тебя rgw stripe поделится на N
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
и читать ты будешь за раз в N раз меньше
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Ну если у тебя 20 дисков, то это может и влияет, да
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
А если N небольшое то пофиг
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
продолжу. и средню скорость трансфера (да, она в начале диска больше чем в два раза больше чем в конце), ну для современных пусть 120MB/s
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Ну только ты помни, что там ещё блюстор в случае цефа и линейное чтение не очень линейное само по себе
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
И поэтому оно сразу где-то 40 мб/с в цефе с 1 хдд
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
теперь считаем. 256KB передается за .256/120 + 0.014 мс ~ 17мс. 512кб -- 19мс. 58 и 52 iops. умножаем обратно  и получаем 14.8 и 26.6МБ/с. разница конечно не в два раза, но вполне заметная
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
ну, да... понятно, что чем меньше объекты, тем хуже
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
да, блюстор в этом смысле не очень удачен. но если объекты крупные или их можно заставить быть крупными то можно поднять bluestore_min_alloc_size_hdd (емнип) и уменьшить фрагментацию
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
ну вот ec размер эффективный размер объектов дробит по сути
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
для 40мб/с у тебя кусок чтения под мегабайт должен
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
ну вот я щас подёргал Seagate ST8000NM0055 - randread 256k типа 35 МБ/с, 512k типа 60 МБ/с
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
так что да - так-то конечно всё верно
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
HD Tune Pro shows the Seagate 8TB Enterprise Capacity HD in at 228.3MB/s average with a maximum speed of 240.3MB/s and an access time of 8.72ms and 8% CPU usage.
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
как-то у тебя слишком хорошая производительность вышла
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Ну iodepth=32
источник