Size: a a a

Церковь метрик

2019 November 11

N

Navern in Церковь метрик
Aleksey Shirokikh
там ответочка тут же прилетела. жопная
Ответка была оч странная))
источник

A

Andor in Церковь метрик
Ссылку?
источник

AV

Aliaksandr Valialkin in Церковь метрик
Alexander
Это же, вроде, все равно сетевые диски. Потому сетевые ошибки все равно могут быть, просто они скрыты от пользователя за залипанием io и ошибками ввода-вывода. И, если худо-бедно, но от сети адекватные разработчики уже не ждут 100% надежности и делают обработку ошибок и таймауты, то вот проблемы с блочными устройствами заставляют софт поголовно падать лапками к верху.
да, в теории это так. На практике GCP диски показывают ноль сетевых ошибок и удивительно консистентную latency с bandwidth, которая не скачет туда-сюда, как у object storage. На предыдущей работе у нас был кластер кликхауса на gcp hdd дисках. Суммарный объем дисков был 500ТБ - за полтора года работы не вылезло ни одной проблемы, связанной с сетевой природой этих дисков. Единственный инцидент - один раз нас по ошибочной abuse'е принудительно отрубили от дисков, что привело к крэшу КХ и потере последних записанных данных в КХ.
источник

AV

Aliaksandr Valialkin in Церковь метрик
Andor
давайте про надёжность и ненадёжность дисков в клауде куда-нибудь в другой чят, если нет метрик для обсуждения
упс. сорри, только что прочитал. Больше не буду )
источник

AV

Aliaksandr Valialkin in Церковь метрик
Alexander
@Andorka в контексте работы стораджа метрик, надеюсь, можно?

@valyala не, ну, если, конечно, вы в виктории проверяете успешность любого ввода-вывода и регулярно тестируете ее работу на dm-flakey, dm-delay и dm-error, то респект и уважуха. Но большинство, просто, таким не заморачивается, считая блочный сторадж априори надежным.
ВМ тоже так считат - при любых ошибках на блочном сторедже она падает с паникой. Это позволяет сохранить данные в консистентном состоянии при глюках на уровне блочного стореджа. Но, как показывает практика, вероятность таких ошибок на GCP дисках близка к нулю.
источник

AV

Aliaksandr Valialkin in Церковь метрик
Aleksey Shirokikh
там ответочка тут же прилетела. жопная
Норм ответка. Разозлили Брайана - вот он и нашел слабые места в вм, чтобы показать, кто на PromCon'е хозяин :)
источник

GG

George Gaál in Церковь метрик
Aliaksandr Valialkin
ВМ тоже так считат - при любых ошибках на блочном сторедже она падает с паникой. Это позволяет сохранить данные в консистентном состоянии при глюках на уровне блочного стореджа. Но, как показывает практика, вероятность таких ошибок на GCP дисках близка к нулю.
Ага
источник

GG

George Gaál in Церковь метрик
Это очень актуально в ключе того, что гуголь валяется
источник

PR

Paul Rudnitskiy in Церковь метрик
George Gaál
Это очень актуально в ключе того, что гуголь валяется
до сих пор валяется?
источник

GG

George Gaál in Церковь метрик
источник

GG

George Gaál in Церковь метрик
Right now
источник

GG

George Gaál in Церковь метрик
Google Cloud Storage
источник

GG

George Gaál in Церковь метрик
Google Kubernetes Engine
источник

PR

Paul Rudnitskiy in Церковь метрик
у них что, так с 1 числа авария и чинится?
источник

GG

George Gaál in Церковь метрик
То что в первую очередь
источник

PR

Paul Rudnitskiy in Церковь метрик
у них первые проблемы были в 30-х числах октября
источник

GG

George Gaál in Церковь метрик
Paul Rudnitskiy
у них что, так с 1 числа авария и чинится?
🤷‍♂
источник

AV

Aliaksandr Valialkin in Церковь метрик
George Gaál
Google Cloud Storage
Наши GCP disk'и вроде работают. GCS - это аналог S3. Так что если сравнивать надежность GCP дисков с GCS или S3, то диски пока надежнее :)
источник

VS

Vladimir Smirnov in Церковь метрик
Оно в основном в us-east1 было
источник

AS

Aleksey Shirokikh in Церковь метрик
Vladimir Smirnov
Оно в основном в us-east1 было
Меня в 4ом цепануло
источник