Size: a a a

Natural Language Processing

2021 September 03

d

dePuff in Natural Language Processing
А может сюда скрин с одним примером?

Вангую, выяснится, что какой-нибудь параметр по умолчанию в одной из библиотек указан удачнее для конкретной ситуации
источник

DD

David Dale in Natural Language Processing
Очень разные косинусы. Не думаю, что один из них "корректный", а другой "ошибочный", просто две библиотеки по-разному токенизируют тексты. Надо разбираться, как именно.
источник

AF

Alexander Fedorenko in Natural Language Processing
не спорю. просто частенько взял либу и используешь без всяких проверок...
источник

AF

Alexander Fedorenko in Natural Language Processing
и никто не проверяет как работает косинусное сходство. главное узнать брать минимум или максимум и все
источник

d

dePuff in Natural Language Processing
С тем как оно работает нереально ошибиться 😅

Здесь ролять будет исключительно разбивка на токены, так как никаких вменяемых векторов (которые мы здесь все любим) сравниваемых текстов такие подходы не создадут
источник

d

dePuff in Natural Language Processing
Но с ходу, по картинке, просилось вычесть расстояние из "1"
источник

AF

Alexander Fedorenko in Natural Language Processing
отправил вам в личку скриншот, чтобы не гадали
источник

MV

Manjula Varaganti in Natural Language Processing
Anyone has idea about NLP Query augmentation or Query reframing system ...ie reframing the question
and search for answers....how to approach
источник

A

Andrey in Natural Language Processing
вообще, может это и несколько необычно для чатов в телеге, хотелось бы выразить благодарность @cointegrated , особенно за rut5-base-multitask и rubert-tiny в частности.

отличные модели, которые из коробки хороши. последняя вообще шустрит в одном (внутреннем) боте, поиск с ней просто 🔥

ну короче хорошо когда кто-то темы двигает. вот тот же spacy-ru когда-то в свое время сильно выручил также в проде, спасибо @yuri_baburov .

и natasha, и mystem, и pullenti, и stanza. пушить в open source годное это что-то на грани искусства, я сколько не пробовал было дело, да что-то не то))
источник

d

dePuff in Natural Language Processing
Я присоединюсь к аплодисментам этим двум ребятам
источник

DD

David Dale in Natural Language Processing
❤️
Мне очень приятно, что такой фидбек приходит)
источник

d

dePuff in Natural Language Processing
Они и на вопросы отвечают и выложили в опенсоурс штуки с которых можно начать что-то делать
источник

A

Andrey in Natural Language Processing
кстати, пардон, не упомянул deeppavlov)

на его zero shot ner и эмбеддингов, вообще куча дел наверчено, вплоть до регрессий))
источник

d

dePuff in Natural Language Processing
Этим я благодарен за курс, но с использованием их библиотек пока не сложилось )
источник

d

dePuff in Natural Language Processing
@dropout05 Мы тут вам эго чешем
источник

A

Andrey in Natural Language Processing
тут какая история. Google вроде писал недавно про textcraft, умный такой редактор.

у меня мать на пенсии, сидит на одной из бирж по текстам, в топ40 исполгиелей входит. ей под 70, все руками-мозгами делает... думал ей редактор в помощь сделать, но некогда никак (семья, переезды, это вот такое все).

а дело такое. набираешь текст в обычном каком markdown, например, редакторе, выделяешь кусочек, и биндишь на кнопки таски т5 multitask, или, если идти дальше, clip с поиском по базе картинок для вставки иллюстраций, или pytorch-dalle какую для генерации даже.

давно уже в эверноте концепция, и компоненты испытывал. и даже бы заопенсорсил бы. будь время написать.

труд копирайтеров был бы на стероидах.
источник

d

dePuff in Natural Language Processing
Тсс... Тут и так копирайтерам и рерайтерам пара лет осталась
Если мы про уровень 50р\1000 знаков
источник

A

Andrei in Natural Language Processing
+
источник

AS

Artem Sergeev in Natural Language Processing
pytorch-dalle а что, стала что-то вменяемое выдавать? Или это OpenAI какой-то доступ открыл-таки к своей реализации?
источник

AS

Artem Sergeev in Natural Language Processing
>rubert-tiny в частности

Хорошо ищет, да? А есть несекретные подробности?
источник