Size: a a a

2019 July 05

AK

Alexey Khotulev in DevOps Moscow
Vit
Ребят, а где гуру-сетевиков можно найти?

У меня на паре виртуальных машин vmware периодически под нагрузкой сетевой стек себя странно ведёт. Растут всякие tcpRetransimission, tcpAbort, TcpTimeout и т.п. Но как я понимаю, это все симптомы, не причины.

Вот хочется найти - куда копать, в какие очереди/графики поискать, и чтобы не перепутать причину и следствие)
попробовать пробросить сетевуху до вм и посмотреть, что происходит.
источник

AK

Alexey Khotulev in DevOps Moscow
если всё ок, значит, скорее всего, ресурсов не хватает
источник

V

Vit in DevOps Moscow
Alexey Khotulev
если всё ок, значит, скорее всего, ресурсов не хватает
А каких именно ресурсов?
Загрузка CPU/ram как обычно. Во время сбоя очень мало растет.

Имеешь ввиду - что-то подворовывают?
источник

AK

Alexey Khotulev in DevOps Moscow
и можно подумать заменить сетевуху на ту, что поддерживает много очередей. в вмваре где то галочка была, чтобы отдельную очередь прокидывать в вм
источник

AK

Alexey Khotulev in DevOps Moscow
cpu
источник

AK

Alexey Khotulev in DevOps Moscow
смотри отдельные ядра
источник

V

Vit in DevOps Moscow
Ну, проброс сетевухи и замена - не оч вариант...а гипервизоре же куча машин и это - одна из них. А замена - физически, или другой тип некий?
источник

AK

Alexey Khotulev in DevOps Moscow
возможно, какое то одно ядро загружено
источник

V

Vit in DevOps Moscow
По ядрам - гляну. Но, если одно загружено - почему другие не займутся светлым делом?
источник

AK

Alexey Khotulev in DevOps Moscow
Vit
Ну, проброс сетевухи и замена - не оч вариант...а гипервизоре же куча машин и это - одна из них. А замена - физически, или другой тип некий?
а проблема с трафиком из одной вм в другую, без выхода наружу есть?
источник

AK

Alexey Khotulev in DevOps Moscow
потому что очереди сетевухи пинятся к конкретным ядрам. вручную или автоматически. и перескакивать им не положено
источник

V

Vit in DevOps Moscow
Alexey Khotulev
а проблема с трафиком из одной вм в другую, без выхода наружу есть?
Наружу - это в интернет?
источник

AK

Alexey Khotulev in DevOps Moscow
Vit
Наружу - это в интернет?
это в роутер
источник

AK

Alexey Khotulev in DevOps Moscow
это наружу из хоста
источник

V

Vit in DevOps Moscow
Сложный вопрос. У меня считай весь трафик - наружу из хоста, потому что это Аля балансер и +/- изолирован на отдельном хосте гипервизора. Все бекенде/апстримы живут на других хостах
источник

AK

Alexey Khotulev in DevOps Moscow
ещё, насколько помню, могут быть нюансы с тем, какую сетевуху показываешь виртуалке. вмваре её может типа эмулировать. тогда можно не ждать хорошей производительности. но думаю, это первое, на что ты уже посмотрел :)
источник

AK

Alexey Khotulev in DevOps Moscow
попробуй погонять обычные пинги внутри хоста. тогда будет ясно, проблема скорее с сетевым железом или с cpu
источник

AK

Alexey Khotulev in DevOps Moscow
емнип трафик между вм в одном влане не улетает наружу
источник

V

Vit in DevOps Moscow
Alexey Khotulev
попробуй погонять обычные пинги внутри хоста. тогда будет ясно, проблема скорее с сетевым железом или с cpu
В момент начал лагов CPU l system прыгает под 30-ку разово, и потом в целом ок ..но машина уже оч долго тупит.

И вопром, как раз, как понять, что именно не так с сетью или что не так с CPU (по ядрам гляну).

Ну и найти/сделать метрики с  физических хостов , я так понимаю
источник

AK

Alexey Khotulev in DevOps Moscow
всё верно. начни с того, что проще
источник