Size: a a a

Natural Language Processing

2021 September 01

🐙

🐙 in Natural Language Processing
Choises то подходят, но я не знаю, как в них свои данные запихать. У меня на каждый док есть 2-5 айдишников из большого пула, мне нужно их сматчить со спанами. То есть в идеале интерфейс вида
+ Предложенный id 1
+ Предложенный id 54684
+ Предложенный id 2
+ Текстовое поле, если все неправильные
источник

🐙

🐙 in Natural Language Processing
Ну и поздравляю канал с 3к 💪🏻
источник

RB

Rasool Barlybayev in Natural Language Processing
Интересная статья на Хабре: https://habr.com/ru/post/491576/
источник
2021 September 02

kr

karima rahali in Natural Language Processing
I need help in solving the problem of linking  flask with  xampp
источник

t

tlack in Natural Language Processing
this may be off topic for this channel. are you using JSON as the linking layer? remember php doesnt have tuples so some of your data may come across differently.

это может быть не по теме для этого канала. вы используете JSON в качестве связующего слоя? помните, что в php нет кортежей, поэтому некоторые из ваших данных могут восприниматься иначе.
источник

YB

Yuri Baburov in Natural Language Processing
You stop training when your model doesn't get better any more -- measured by your metric.
источник

D

Data Guy in Natural Language Processing
Any NLP expert? I am looking for some guidance in Entity based Sentiment Analysis. Can anyone help ???
источник

D

Data Guy in Natural Language Processing
Can anyone share some project link or YouTube tutorial?
источник

t

tlack in Natural Language Processing
источник

p

ppetr in Natural Language Processing
Посмотрите библиотеку gensim, возможно там можно приноровиться. Вообще тема тоже актуальна, но пока руки не дошли, можно совместно поизучать
источник

DE

Dani El-Ayyass in Natural Language Processing
Друзья, всем привет! 👋

Новый релиз text-сlassification-baseline v0.1.3, который теперь поддерживает настройку гиперпараметров с помощью поиска по сетке, доступен на PyPI 🥳🎉🍾

Репозиторий GitHub: https://github.com/dayyass/text-classification-baseline
источник

МЕ

Максим Ермаков... in Natural Language Processing
Да, именно это интересовало, спасибо! Я просто сначала наткнулся на spacy-ru  в вашем репо, а даты коммитов не бились с датами релиза модели для spacy, вот и не мог понять, откуда она. Разобрался 👍
источник

AF

Alexander Fedorenko in Natural Language Processing
👍
а что-то такое же, но для файн тюннинг MUSE не планируете?))
источник

DE

Dani El-Ayyass in Natural Language Processing
Не совсем такое, но у меня есть идеи по тому, что можно сделать с моделькой MUSE, правда пока у меня нехватает времени на это…

Но если есть потребность в какой-то функциональности, связанной с MUSE, я готов поменять свою приоритезацию)
источник

AF

Alexander Fedorenko in Natural Language Processing
ну понятно, что не в буквальном смысле "такое", но тюнинговое направление.
И потребность, ну как минимум, интерес есть)

UPD И в сети мало об этом инфы, особенно для MUSE
источник

DE

Dani El-Ayyass in Natural Language Processing
Приятно, что есть интерес/потребность - тогда начну думать в этом направлении)
источник

AF

Alexander Fedorenko in Natural Language Processing
👌
источник

AF

Alexander Fedorenko in Natural Language Processing
Господа, коллеги, менторы и начинающие....  
А вот из вашего опыта, кто использует с его точки зрения,  лучшими на python решениями по определению схожести строк?
Я сам использую традиционную классику difflib и fuzzywuzzy, но может кто-то отказался от таких инструментов в пользу других, которые использует сейчас.
Думаю, не только мне, но многим из 3к+ участникам было бы интересно услышать о причинах выбора и практическом опыте.
источник

A

Andrey in Natural Language Processing
какая нужна схожесть?.. я обычно через sentence-transformers и cosine similarity. но наверное мы про разные задачи
источник

DD

David Dale in Natural Language Processing
Очень зависит от того, что это за строки, и какого рода сходство между ними интересно.
В целом, если нужно сходство по написанию, обычно беру какую-то метрику из пакета https://pypi.org/project/textdistance, а если больше интересует смысловое, пользуюсь предобученными нейронками; для русского хорошо заходят fasttext, Laser, USE и LaBSE.
источник