Size: a a a

2021 March 04

i

inqfen in Sysadminka
либо просто #вакансия
источник

AU

Alex U in Sysadminka
Когда публикуешь контактные данные в вакансии хх, начинают писать всякие промоутеры каналов в ВК и хедхантинговые конторы
источник

AU

Alex U in Sysadminka
"за 2т.р. разместим вашу вакансию в пабликах ВК в 450 тысяч человек, найдете работника за пару дней!"

Заходишь туда, а там поваров да дворников ищут.
источник

K

Kirill in Sysadminka
эт самое, мб кто знает по какой дорожке лучше пойти, в общем мне сказали тут "теперь ты hadoop сопровождаешь" а я ваще не алё, есть какойнить изи вей локально поставить, типа как у кубера  hard way, что бы хоть приблизительно понимать чё там и к чему и для чего делается?
источник

AU

Alex U in Sysadminka
Kirill
эт самое, мб кто знает по какой дорожке лучше пойти, в общем мне сказали тут "теперь ты hadoop сопровождаешь" а я ваще не алё, есть какойнить изи вей локально поставить, типа как у кубера  hard way, что бы хоть приблизительно понимать чё там и к чему и для чего делается?
можно, конечно же. ставь и играйся.
источник

K

Kirill in Sysadminka
Alex U
можно, конечно же. ставь и играйся.
да понятно что можно, кто бы мб сказал что "лучше вот по этой ссылке посмотри, я делал, тут норм"
источник

K

Kirill in Sysadminka
в гугле ппц инфы, споткнуться 35 раз конечно можно, но мб кто уже делал и знает где лучше
источник

AU

Alex U in Sysadminka
сам не делал, звиняй. пользовался преупакованными образами от амазона в авс.
источник

K

Kirill in Sysadminka
источник

ВИ

Вадим Исаканов... in Sysadminka
Вадим Исаканов
https://www.youtube.com/watch?v=HVqVEQb991c&feature=youtu.be
Вчера еще митап про Bigdata прошел
Пока полностью не смотрел, ничего сказать не могу, но организовано неплохо
YouTube
Митап «Большие данные: не хайп, а индустрия»
Спикеры из ITSumma и «Слёрма» представят доклады о Big Data и проведут митап. Обсудят как получать и обрабатывать большие данные, какие выгоды и инсайты сможет получить бизнес при правильной работе с данными и какая работа с данными может навредить компании.

Таймлайн:
✅ 14:00 - 14:15 - Иван Сидоров, ITSumma: Где брать большие данные, как их обрабатывать и главное — зачем?
✅14:15 - 14:20 - Вопросы Ивану.
✅ 14:20 - 14:50 - Александр Волынский, Mail.ru Cloud Solutions: Как работать с Big Data в облаке гибко и эффективно с помощью Kubernetes
✅14:50 - 15:00 - Вопросы Александру.
✅ 15:00 - 15:20 - Иван Хозяинов, ITSumma: Обогащение данных — что это и почему без него никак?
✅15:20 - 15:30 - Вопросы Ивану.
✅ 15:30 - 16:00 - Денис Наумов, «Слёрм»: Почему хаотичная работа с большими данными вредит бюджету компании и как с этим бороться?
✅16:00 - 16:10 - Вопросы Денису.
✅16:10 - 16:40 - Тимур Хасанов, ITSumma; Иван Бацуев, ITSumma: Кейс «Тикетница как провайдер больших данных и бизнес-инсайтов»
✅16:40 - 17:00 - Вопросы…
Смотри, может тут чтото полезное было
источник

ВИ

Вадим Исаканов... in Sysadminka
Еще в @devops_ru у нескольких человек точно хадуп был
источник

K

Kirill in Sysadminka
Вадим Исаканов
Смотри, может тут чтото полезное было
смотрел, небыло)
источник

ВИ

Вадим Исаканов... in Sysadminka
а, жаль)
а я пока только пару докладов послушал
источник

AU

Alex U in Sysadminka
хадуп очень по-разному можно запускать. амазоновский, например, сконфигурирован брать все из S3 и складывать результаты тоже в S3. по твоей ссылке хадуп вообще можно запускать одной строчкой - "bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar grep input output 'dfs[a-z.]+'"
источник

AU

Alex U in Sysadminka
весь хадуп - взять данные из инпут, замапить их (map), обработать их (reduce), и сложить в аутпут.
источник

AU

Alex U in Sysadminka
просто шаг map и reduce можно распределить на много компов, чтобы было быстрее.
источник

K

Kirill in Sysadminka
Alex U
весь хадуп - взять данные из инпут, замапить их (map), обработать их (reduce), и сложить в аутпут.
🤔
источник

K

Kirill in Sysadminka
Alex U
просто шаг map и reduce можно распределить на много компов, чтобы было быстрее.
в том числе и ~1000ядер в кластере, там на не занятые распределяется нагрузка?
источник

AU

Alex U in Sysadminka
Kirill
в том числе и ~1000ядер в кластере, там на не занятые распределяется нагрузка?
для этого в хадупе есть scheduler, который задания разным нодам и ядрам выдавать будет.
источник

AU

Alex U in Sysadminka
Alex U
весь хадуп - взять данные из инпут, замапить их (map), обработать их (reduce), и сложить в аутпут.
но принцип соблюдается в любом случае. хоть на одном ядре, хоть на 1000+
источник