Size: a a a

Natural Language Processing

2021 September 14

DS

Dmitry Spodarets in Natural Language Processing
Всем привет!

В четверг вместе с Михаилом Рожковым будем говорить про DVC и переиспользование ML пайплайнов между проектами.
Присоединяйтесь - https://dataphoenix.info/webinar-re-usable-pipelines-for-ml-projects/

А завтра приглашаю всех на онлайн-трансляцию Open Data Science Odessa Meetup на котором мы поговорим про то, как NLP поменялся за последние 10 лет, а также про опыт участия в ML соревнованиях.
Присоединяйтесь - https://dataphoenix.info/ods-ai-odessa-meetup-4/
источник

FF

Futorio Franklin in Natural Language Processing
🔥
источник

M

Maksym in Natural Language Processing
#jobs_Hr
Платим 1000$ за рекомендацию NLP Engineer!

К нам в Metinvest Digital R&D очень нужен NLP Engineer. Ищем уровня Middle/Senior.
Задачи такие, как, conversational solutions, text parsing, mood analysis, Intelligent OCR.

Мало рутины, много рессерча и нестандартных задач. Скучно точно не будет.
Доступен remote, поэтому идеальный кандидат может быть с любой точки Украины.
источник

SancheZz Мов in Natural Language Processing
Может чуть расширить локацию поиска?
источник

SancheZz Мов in Natural Language Processing
СНГ?
источник

M

Maksym in Natural Language Processing
К сожалению нет( наша служба СБ не пропустит
источник

SancheZz Мов in Natural Language Processing
Они бывшие СБУшники?(
источник

AF

Alexander Fedorenko in Natural Language Processing
Может эту 1к зелени заплатить СБ за рекомендацию спеца из-за рубежа?)

UPD Чтобы не только запрещать, пусть и творчески поработают на пользу делу
источник

M

Maksym in Natural Language Processing
Меньше 15к попросили им даже не предлагать))
источник

M

Maksym in Natural Language Processing
Я уверен на просторах Украины есть достаточно классных специалистов)
источник

AF

Alexander Fedorenko in Natural Language Processing
100500
источник

SW

Space Wanderer in Natural Language Processing
Всем привет! :) Ищу работу в области Natural Language Processing/Data Science на полную занятость удалённо.
Уровень junior/middle, ожидаемая зп 70-130 тыс. руб.

Образование:

2016 - 2020 - бакалавриат, Национальный исследовательский университет
"Высшая школа экономики", Фундаментальная и компьютерная лингвистика

2020 - н.в. - магистратура, Национальный исследовательский университет
"Высшая школа экономики", Компьютерная лингвистика

Навыки:

Языки программирования: Python
Пакеты и фреймворки: pytorch, keras, numpy, scipy, scikit-learn,
transformers, nltk, spacy, udpipe, Django, Flask
На базовом уровне: HTML, JavaScript, Docker, git
Дополнительно: Лингвистический анализ и разметка текстов,
парсинг веб-страниц

Опыт работы:

2019-2021 - Национальный исследовательский университет
"Высшая школа экономики", Научно-учебная лаборатория учебных корпусов,
стажёр-исследователь (основное место работы)

2019-2020 - Группа компаний RWAY, текстовый аналитик (по совместительству)

2020-2021 - Группа компаний АНТРАКС, junior data scientist (по совместительству)

Знание английского: умею вести письменную и устную коммуникацию, читать справочную и научную литературу

Моя страница на Github: https://github.com/nicklogin
источник

SN

Shamil Nurkaev in Natural Language Processing
Есть большой геологический архив с десятками документов (по сути, тысячи страниц в формате PDF). В одних участках текста говорится об анализе почвы, о бурении скважин и т.д. Нужно разметить участки текста и создать классификатор, который будет для каждого участка текста выбирать тему (по типу: «Бурение скважины»).
Задача осложняется тем, что нужно построить некий алгоритм, который будет делить документ на участки текста (простой вариант, делить на абзацы), чтобы классификатор выбирал для них тему. Как это можно сделать?
источник

A

Alexander in Natural Language Processing
А зачем разбивать на участки?
источник

SN

Shamil Nurkaev in Natural Language Processing
В документе есть разные темы. Один абзац на одну тему, другой на след. и т.д.
источник

A

Alexander in Natural Language Processing
Есть тематическое моделирование, там тебе скажут какие темы есть в каждом документе
источник
2021 September 15

NS

Nikolay V. Shmyrev in Natural Language Processing
Заходите к нам в @speech_recognition_ru, как раз ищем разработчиков для Воска
источник

TM

Toemik Mnemonic in Natural Language Processing
Кто нибудь пытался получить из объектов -моделей  Simpletransformers Предиктанты как one hot? В общем массивы вероятностей принадлежности к классом а не просто единственный предсказанный лейбл
источник

d

dePuff in Natural Language Processing
Там есть эта фича, только идиотски задаётся

Вроде, списком из нулей и единиц в одной ячейке обучающих данных

Если речь за мультилэйбл классификацию
источник

TM

Toemik Mnemonic in Natural Language Processing
Спасибо . Звучит реально дико, пойду искать
источник