Size: a a a

Rust Jobs - вакансии & резюме

2020 January 01

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
MrSmith
Вероятностные структуры данных вообще мало кому нужны исключая мест где появляются реально большие числа потому как в основном все прецмушества того же квартире фильтра только дальше нескольких лярдов а вообще насрать всегда найдется очередной сабжект метер который ты не решишь типа что лучше р дерево или ещё какое хеширование для задачи двумерного индекса в рпг а что для бд объектов на орбите земли
Да ладно, я недавно таблицы джоинил при помощи фильтра блума. Оказалось очень эффективно
источник

M

MrSmith in Rust Jobs - вакансии & резюме
На чем делал?
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Ну вообще посыл то не в этом а в том что всегда есть то где ты что то не знаешь и спрашивать вероятностные структуры всеравно что спрашивать персистеньные структуры, нужны они единицам а разбираться в них не просто
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
MrSmith
На чем делал?
на плюсах делал с интферфейсом на питоне.
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Я на плюсах вроде находил пару реализаций
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Мог бы и готовый взять
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
Мне пришлось изобрести новую структуру. Возможно, такие существуют где-то еще, но я про них не знал.
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Так с этого момента по подробней
источник

M

MrSmith in Rust Jobs - вакансии & резюме
И что доизобрел?
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
MrSmith
И что доизобрел?
У меня задача была - поджонить таблички. Есть много стратегий джоина, можно разделить их на две категории: симметричные и несимметричные. Например, среди несимметричных напрашивается наивная: одну таблицу можно положить в хэшмап, и пойти с этим хэшмапом по второй. Я развил эту идею до того, что в хэшмапе хранить только хэши, не храня ключи. И хэши хранить так, как они хранятся в блуме.
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
Плюс к этому - возможность роста фильтра. Классический фильтр фиксированный по памяти. Но что, если ты не знаешь, сколько элементов у тебя будет? Можно, например, создавать второй регистр, когда первый у тебя заполнится. Плюс этого подхода - экономия на памяти. Минус - ослабевающая гарантия на ложноположительную ошибку фильтра.
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
В итоге получилась структура типа хэшмапы, но с потреблением памяти раз в 100 меньше и с возможностью параллельного заполнения (блумы можно составлять параллельно, а потом пересекать побитово).
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
С моей задачей справилась очень хорошо. Петабайтные таблички стали наконец джоинится
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Ну не плохо, я бы конечно залез в слона к примеру и посмотрел а как у больших дядек
источник

P🐈

Pavel Tyavin 🐈 in Rust Jobs - вакансии & резюме
А что такое "большие дядьки"?
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Вообще я хотел написать бд но пест оказался сыроват вот думаю контрибьютить ли
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Pavel Tyavin 🐈
А что такое "большие дядьки"?
Забей
источник

M

MrSmith in Rust Jobs - вакансии & резюме
А вообще мы офтопим походу
источник

M

MrSmith in Rust Jobs - вакансии & резюме
Го в личку
источник

MD

Memory Doctor in Rust Jobs - вакансии & резюме
Pavel Tyavin 🐈
А что такое "большие дядьки"?
Это я
источник