Size: a a a

Natural Language Processing

2021 September 16

VS

Valera Sarapas in Natural Language Processing
Да, с нуля. Классификатор в области ветеринарии работает. На первый взгляд сложно найти что-то предобученное.
А как использовать для разметки. Там же просто комментарий к результату классификации?
источник

Н

Никита in Natural Language Processing
Всем привет! Помогите определиться с методикой выполнения задачи.
У меня есть 8к документов типа help-база знаний.
Мне нужно сделать search engine на основе них.
На вход вопрос пользователя, на выходе ТОП-N документов подходящих для решения его вопроса.
Также я наверное могу собрать выборку Doc_id, Вопрос.
Я знаю про doc2vec, tfidf примерно. Но не знаю где взять ембеддениг ил что щас хорошо работает
источник

NK

Nikolay Karelin in Natural Language Processing
Я бы начал с Elastic Search
источник

PK

Pavel Kalaidin in Natural Language Processing
А если не хочется elastic, то в gensim есть bm25
источник

PK

Pavel Kalaidin in Natural Language Processing
Супербыстро завести поиск — сойдёт
источник

Н

Никита in Natural Language Processing
Спасибо, тоже еластик рассматриваю и там кажется bm25 по дефолту щас
источник

V⚪

Victoria ⚪️🔴⚪️... in Natural Language Processing
Да, все так, у меня PoC с ним получился неплохим
источник

Н

Никита in Natural Language Processing
Честно говоря, я уже в прод хочу пойти, а не PoC))
источник

MA

Mark Averchenko in Natural Language Processing
Привет, есть запись лекции?)
источник

DS

Dmitry Spodarets in Natural Language Processing
https://youtu.be/qWYJYj05tdw тут версия трансляции, более качественное видео выложим на днях.
YouTube
Webinar "Re-usable pipelines for ML projects with DVC"
Четвертый технический вебинар из серии "The A-Z of Data", который посвящен переиспользованию ML пайплайнов между проектами с помощью DVC.
https://dataphoenix.info/webinar-re-usable-pipelines-for-ml-projects/

Хорошие ML пайплайны позволяют обеспечить воспроизводимость результатов ML экспериментов и управляемость процесса разработки. На практике часто встречаются случаи, когда хочется применить наработки одного проекта в новом. Иногда, новый проект (модель) отличается только целевой переменной. В таких случаях можно переиспользовать до 95 % наработок из предыдущего проекта. В данном докладе разберем возможности организации и конфигурации ML пайплайнов с помощью DVC, подходы к переиспользованию пайплайнов, а также типичные кейсы, где это может пригодиться.

Спикер:
Рожков Михаил - Solution Engineer в Iterative.ai. Более 6 лет занимается машинным обучением и Data Science.  Co-creator ML REPA, автор курсов по автоматизации ML экспериментов с DVC и MLOps. В команде Iterative.ai помогает компаниям улучшать ML разработку…
источник

MA

Mark Averchenko in Natural Language Processing
спасибо
источник

M

M in Natural Language Processing
Hello guys
источник

M

M in Natural Language Processing
Anyone here who has worked on a wsd problem in another language other than English,  I need help please
источник

M

M in Natural Language Processing
WSD for Word Sense Disambiguation
источник

NK

Nikolay Karelin in Natural Language Processing
Ну, по пословице, хоть два раза херак надо сделать!
источник

M

M in Natural Language Processing
Привет, ребята, пожалуйста, посоветуйте мне, как устранить неоднозначность Word Sense для языков с низким уровнем ресурсов
источник

M

M in Natural Language Processing
Извините, я пользовался переводчиком, это не мой родной язык
источник
2021 September 17

AK

Angelina Kudriavtcev... in Natural Language Processing
источник

M

M in Natural Language Processing
Thank you 🙏
источник

N

Narges in Natural Language Processing
Can I use Sentence Transformers for spam detection? I used it on my dataset with KNN and i get s good result. also I want to know if I can useit on persian text.
источник