Телеграмм чат группы ProLua страница 2584

Получается, будет принят поток по кусочкам, а последний кусочек потока будет в data.

Напоминаю, что такая штука как TCP ориентирована не на сообщения, а на потоки. И сами сообщеньки благополучно склеиваются в одно бесконечное (пока соединение не порвут) сообщение. Тут идёт разделение только потому, что отсутствуют блокировки (чтение прерывается на таймауте) и мы смотрим на partial.

источник

00:45пожаловаться #3

S

Snusmumriken in pro.lua

Вот в UDP — вполне себе сообщения, с началом, телом и концом.

источник

00:46пожаловаться #4

VV

V V in pro.lua

Snusmumriken

Вот в UDP — вполне себе сообщения, с началом, телом и концом.

udp не везде подойдёт - хотя бы просто потому, что не все умеют его слать))

источник

00:48пожаловаться #5

S

Snusmumriken in pro.lua

Если посмотреть на формат HTTP — там можно заметить такие фигулины как:
1. Разделение заголовков и тела пустой строкой. Это сделано за тем, что бы если послали длинное тело — можно было бы определить его начало.
2. Наличие в заголовках "длины тела сообщения". Это сделано для того, чтобы можно было понять, когда тело вообще закончилось, и начался следующий запрос (запросы можно объединять тупым склеиванием, но с приёмом придётся заморочиться)

Поэтому самый короткий формат сообщений на TCP —
[несколько фиксированных символов длины сообщения][тело]

источник

00:49пожаловаться #6

VV

V V in pro.lua

"1. Разделение заголовков и тела пустой строкой. Это сделано за тем, что бы если послали длинное тело — можно было бы определить его начало."

Я бы поспорил. Что один пробел, что два - разницы для парсера не будет при прочих равных.
Это хорошо только как спецсимвол - в заголовках два переноса строки не встретятся по определению, а в тексте пользовательского запроса - могут. Значит, каждый блок пользовательского запроса просто логичнее начинать с комбинации, которая никогда не встретится в заголовках =)

источник

00:51пожаловаться #7

VV

V V in pro.lua

"Поэтому самый короткий формат сообщений на TCP —
[несколько фиксированных символов длины сообщения][тело]" - это в идеальном мире.
В реальном клали разрабы на длину вначале строки - парси как хочешь, хоть по кофейной гуще.

источник

00:52пожаловаться #8

VV

V V in pro.lua

Мне просто интересно сделать схему приёма-отправки, которая бы позволила выбрать протокол как опцию - хочешь, tcp, хочешь - udp.

И при этому если приём tcp задать в режиме *l, то отличий от udp для пользователя не будет.

источник

00:53пожаловаться #9

VV

V V in pro.lua

Аналогично с отправкой - хочешь, по udp, хочешь, по tcp.

Понятно, что будут вещи, которые в принципе не будут одинаковыми для протоколов - то, что в tcp будет бесконечным бинарным потоком, по udp придётся так или иначе делать большим набором датаграмм. Но это граничные условия, где один из двух неприменим, и на нём нужно изворачиваться.

источник

00:55пожаловаться #10

VV

V V in pro.lua

Snusmumriken

Получается, будет принят поток по кусочкам, а последний кусочек потока будет в data.

Напоминаю, что такая штука как TCP ориентирована не на сообщения, а на потоки. И сами сообщеньки благополучно склеиваются в одно бесконечное (пока соединение не порвут) сообщение. Тут идёт разделение только потому, что отсутствуют блокировки (чтение прерывается на таймауте) и мы смотрим на partial.

Я просто за что зацепился - если мы на каждом шаге приёма кусочка по tcp будем его считать равным сообщению (и пересылать дальше), не получится ли, что мы заспамим получателя кучей повторяющихся "кусочков"? "1", потом "12", и "123" и т.д. до полной строки "12345678"?
Логичнее ведь тогда сразу создать буфер фиксированного размера - и заполнять его или до предела или до конца входящей строки. И пересылать дальше такими "пачками".

На конечном приёмнике если печать получаемого потока включить, "кусочки"-повторы не приходят?

источник

00:59пожаловаться #11

VV

V V in pro.lua

Я, как будет время, попробую тест провести на многих подключениях - если подтвердится, сформулирую, что не так на мой взгляд.
Пока это только подозрения)

источник

01:01пожаловаться #12

S

Snusmumriken in pro.lua

Нет, не получится "12 123 12345".

источник

01:05пожаловаться #13

S

Snusmumriken in pro.lua

Можно заметить в примере, что мы N раз отправляем 12345678, и количество отправок равно количеству кусочков.

источник

01:05пожаловаться #14

S

Snusmumriken in pro.lua

receive очищает буфер partial'а при каждом вызове.

источник

01:06пожаловаться #15

S

Snusmumriken in pro.lua

V V

"1. Разделение заголовков и тела пустой строкой. Это сделано за тем, что бы если послали длинное тело — можно было бы определить его начало."

Я бы поспорил. Что один пробел, что два - разницы для парсера не будет при прочих равных.
Это хорошо только как спецсимвол - в заголовках два переноса строки не встретятся по определению, а в тексте пользовательского запроса - могут. Значит, каждый блок пользовательского запроса просто логичнее начинать с комбинации, которая никогда не встретится в заголовках =)

Пустая строка — это и есть спецсимвол. И нужен для разделения. Разницы никакой, но оно служит именно спецсимволом разделения и ничем больше. Я про это и написал.

"самый короткий формат" — он самый короткий потому, что в принципе позволяет надёжно разделять сообщения. В противном случае, мы, кто бы мог подумать, не можем разделять сообщения, потому что их нет. Приходить будет всё что нам прислали в склеенном виде, и нам или регулярками вытаскивать волшебные сигнатуры конца сообщения (что грубо и стрёмно, и может присутстовать в теле, что ломает систему), или кодировать и разделять чем-то типа \n.

TCP — это про потоки байтов, там всё склеивается.

источник

01:31пожаловаться #16

VV

V V in pro.lua

Snusmumriken

receive очищает буфер partial'а при каждом вызове.

Тогда почему каждый раз из partial высылается вся строка?

источник

11:04пожаловаться #17

VV

V V in pro.lua

Snusmumriken

Пустая строка — это и есть спецсимвол. И нужен для разделения. Разницы никакой, но оно служит именно спецсимволом разделения и ничем больше. Я про это и написал.

"самый короткий формат" — он самый короткий потому, что в принципе позволяет надёжно разделять сообщения. В противном случае, мы, кто бы мог подумать, не можем разделять сообщения, потому что их нет. Приходить будет всё что нам прислали в склеенном виде, и нам или регулярками вытаскивать волшебные сигнатуры конца сообщения (что грубо и стрёмно, и может присутстовать в теле, что ломает систему), или кодировать и разделять чем-то типа \n.

TCP — это про потоки байтов, там всё склеивается.

Я к тому, что вместо пустой строки можно использовать любой другой спец.символ, и смысл не изменится. Главное, чтобы на входе ждали тот же спец.разделитель, что и выставят на отправке.

источник

11:06пожаловаться #18

VV

V V in pro.lua

Snusmumriken

Пустая строка — это и есть спецсимвол. И нужен для разделения. Разницы никакой, но оно служит именно спецсимволом разделения и ничем больше. Я про это и написал.

"самый короткий формат" — он самый короткий потому, что в принципе позволяет надёжно разделять сообщения. В противном случае, мы, кто бы мог подумать, не можем разделять сообщения, потому что их нет. Приходить будет всё что нам прислали в склеенном виде, и нам или регулярками вытаскивать волшебные сигнатуры конца сообщения (что грубо и стрёмно, и может присутстовать в теле, что ломает систему), или кодировать и разделять чем-то типа \n.

TCP — это про потоки байтов, там всё склеивается.

Я и говорю, в идеальном мире.

Потому что сплошь и рядом сообщение пихают в поток байт и без разделителей, и без длины.
И нужно самому догадаться, по каким признакам верно будет разрезать склейку.

источник

11:08пожаловаться #19

S

Snusmumriken in pro.lua

V V

Тогда почему каждый раз из partial высылается вся строка?

Только потому что socket.sleep. В данных условиях, это слип на пол года.

источник

11:08пожаловаться #20