Телеграмм чат группы ProLua страница 2622

Вангую надо было какой-то дефайн добавить

19:51пожаловаться #1

Я прост на работе такОООе на базовой 5.1 пилю, что не всегда 512гб оперативки хватает ))

19:53пожаловаться #2

Хотя на самом деле вру, хватает. В моём случае, такое обычно на парсинг терабайтных файлов может потребоваться, а я шо так шо так чанкую обработку по паре сотен метров.

19:54пожаловаться #3

Stunni in pro.lua

Snusmumriken

Я прост на работе такОООе на базовой 5.1 пилю, что не всегда 512гб оперативки хватает ))

чё ж ты там делаешь интересно

19:54пожаловаться #4

А зачем обрабатывать весь файл разом?

19:55пожаловаться #5

И кто генерит эти убер файлы?

19:55пожаловаться #6

Ну вот я про то же, чанкование.

Генерит — много кто, например служба судебных приставов ))

19:56пожаловаться #7

Snusmumriken

Ну вот я про то же, чанкование.

Генерит — много кто, например служба судебных приставов ))

Я же не думаю что там убер связи через весь документ внутри файла.

19:57пожаловаться #8

Там обычно огромные списки, которые надо распарсить и загнать в базу.

19:57пожаловаться #9

Его и помегабайтно можно изи читать наверн.

19:57пожаловаться #10

Да, я уже написал пару итераторов по большим файлам.
Один — ищет конкретный текст (замыкающий тег) и дочитывает в буфер пока не найдёт (дальше можно парсить блок и повторять заново), другой — гусеничкой гуляет: смотрит, есть ли в блоке сопоставление регулярке, если нет — отходит немного назад и захватывает новый кусок, снова проверяя нет ли сопоставления. На случай если прочитавшийся кусок с половиной регулярки (тут нет временного буфера, сделано для економии памяти и ускорения парсинга). И кушает оно, в зависимости от размера текста/регулярки максимум метров тридцать, при дефолтных настройках. Но для ускорения можно и по паре сотен гигов хапать.

20:00пожаловаться #11

В целом, обходы больших файлов (особенно когда нельзя зацепиться за символы типа \n) — это весело.

20:01пожаловаться #12

Anatoliy S in pro.lua

Snusmumriken

Я даже не собирал а просто стырил бинарь из пакетов luapower (https://github.com/luapower/luajit)

Вот попробовал по твоей ссылке луаджит - вот он действительно нормально память сжирает - всю что есть, а все что сам компилил под 64 бит- еще раз перепроверил - даже 2 Гб не сьедает, 1,5 только и потом падает процесс, видимо надо еще и в исходниках чтото менять но об этом в доках ничего не сказано а в Си шарят далеко не все

20:13пожаловаться #13

Флаги небось очередные 😏

20:14пожаловаться #14

А в сях надо шарить. Без сей никуда.

20:14пожаловаться #15