Привет!
Мопед в соседнюю команду, но я еще сам не до конца обжился, честно говоря.
Компания: Microsoft, Bing Core Team, Answers & Segments department
Вакансия: Data Engineer, C# (сорри)
Локация: удаленка (ИП)
Вилка: $3500-5500 / mo
Проект: в Bing пилим фактовый ответ. Это когда пользователь задает в поисковик запрос, а ему показывают не просто портянку ссылок, но и собственно ответ / нужное определение / ту информацию, которую пользователь хочет узнать. На текущей стадии решаем эту задачу оффлайн: выгрузить список наиболее популярных запросов из логов, отобрать (прогнать через ручку с готовой ML-моделью) те запросы, на которые нужно ответить, залить их в MTurk / Толоку / UHRS (внутренний инструмент для краудсорсинга), выгрузить ответы, положить в табличку во внутренней MR-системе, смерджить с предыдущими ответами, автоматизировать все это, настроить метрики, алерты, помогать пользователям этих данных (например, фиксить ошибки, когда в ответы пролез стьюпид и его надо срочно убрать).
Стек:
* C# (сорри, это MS)
* внутренние инструменты (UHRS == Толока, Aether == Нирвана, Cosmos == MR, SCOPE == SQL-like язык поверх MR)
* общий клей - python / bash /powershell / younameit
Требования:
* ИП
* английский на нормальном уровне, моего B2 хватает (команда распределенная по миру, все общение реально на английском)
* пересечение по рабочим часам с Сиэтлом (UTC-7). Мне хватает 3 часа пересечения с 19 до 22
* общий опыт DE, понимание, как лучше из bash и существующих систем накодить архитектуру пайплайна данных
* C# 1-2 года опыта
Здорово, если:
* есть опыт с краудсорсингом / в поиске (поэтому яндексоидам мб будет проще)
Нюансы:
* оплата за отработанные дни. Т.е. отпуска, больничные, налоги и все остальное - за свой счет. По моим оценкам, это отнимает где-то 20% зарплаты (6-7% налог, 10% - отложения на отпуск, 3% - ведение ИП, счет в банке, комиссии, оплата онлайн-бухгалтерии и т.д.).
* Это аутстафф, контракт заключается с фирмой-прокладкой (HiTechTalents)
* ноутбук тоже свой, но он будет подключен к AD / контролироваться СБ. Вроде поддерживаются Win + Mac, но не уверен, врать не буду (мне Win-ноута достаточно).
Контакты:
* Рекрутер:
https://www.linkedin.com/in/emma-zhang-9005b7173/* можно через меня резюме заслать, мне дадут на пиво
Описание от рекрутера (не очень внятное, но это my shame):
Providing engineering resources to perform data gathering and collection from crowd sourcing platforms. Running data pipelines and load data from cosmos and other data sources. Perform data analysis for Bing Answers Team. Data gathering and collections will be performed weekly. The results will be reported back and any issues found will be logged as bugs in VSO. Running modules on Aether for data pipeline each week. In the case of pipeline having issue, address the issue, rerun the scripts and backfill the data. Computing relevance metrics, root cause analysis on metric value changes, updating and maintaining dashboard, automation of such process. Monitoring DSATs, performing one off fixes.
It is okay if the candidates does not know these tools. The manager is basically looking for candidates with good programming skills, data science/collection interest and background with background in crowdsourcing + search engine teams e.g. Yandex, Toloka a plus.
1. C# experience with 1-2 years experience, must have good coding skills
2. Strong Problem solving skills
3. Will work on metrics tracking, collaboration and graphics.