Size: a a a

Natural Language Processing

2020 November 02

SM

Sasha Marova in Natural Language Processing
А так ?
источник

SM

Sasha Marova in Natural Language Processing
А правда стэковерфлоу ещё не прочитан,ну тут для оследовательностей
источник

SM

Sasha Marova in Natural Language Processing
Граммы можно любое число поставить
источник

SM

Sasha Marova in Natural Language Processing
Т9(
источник

YS

Yaroslav Seliverstov in Natural Language Processing
Там просто два разных списка ключевых слов и необходимо подсчитать частоту их совместной встречаемости в тексте.
источник

МП

Михаил Притугин... in Natural Language Processing
Sasha Marova
Ещё словарь заменить на defaultdict
источник

AK

Alexander Kukushkin in Natural Language Processing
PullEnti 4.0

@ksmith выложил в открытый доступ исходники PullEnti на C# http://pullenti.ru/. Кто не в курсе, PullEnti занял первое место на конкурсе factRuEval в 2016 году.

Интересно, что система построена на правилах. Причём правила здесь это не контекстно свободные грамматики, как например в Natasha, а просто тысячи условий и циклов на C#. Кому интересно как там всё устроено советую начать с вот этого файла на 8 000 строк https://github.com/pullenti/PullentiCSharp/blob/master/Pullenti/Ner/Org/OrganizationAnalyzer.cs#L153
источник

KS

Konstantin Smith in Natural Language Processing
Кстати, этот файл также делается генератором из множества исходных cs-файлов...
источник

AK

Alexander Kukushkin in Natural Language Processing
Konstantin Smith
Кстати, этот файл также делается генератором из множества исходных cs-файлов...
То есть это не совсем исходники PullEnti? А зачем транслировать C# в C#?
источник

KS

Konstantin Smith in Natural Language Processing
Чтобы получить красивый код в одном проекте, очистив его от всякого мусора.
источник
2020 November 04

S

Santhosh in Natural Language Processing
How to get job as a freshers in ml / ai startups?
источник

KL

Kir L in Natural Language Processing
ребята, кросс-пост из Слака сделаю, с вашего позволения:

Подскажите, пожалуйста, какие решения сейчас хороши в качестве сильного бейзлайна для поиска по документации?
Интересует поиск не только по заголовкам документов и разделов, но по самим абзацам текста.
Эластик с какими-то докрученными кастомными фичами? что-то еще? кто-то может знает хороший сёрви по теме.

Пока подсказали: эластик, solr, goldfire.
источник

AS

Alex Surname in Natural Language Processing
Kir L
ребята, кросс-пост из Слака сделаю, с вашего позволения:

Подскажите, пожалуйста, какие решения сейчас хороши в качестве сильного бейзлайна для поиска по документации?
Интересует поиск не только по заголовкам документов и разделов, но по самим абзацам текста.
Эластик с какими-то докрученными кастомными фичами? что-то еще? кто-то может знает хороший сёрви по теме.

Пока подсказали: эластик, solr, goldfire.
сфинкс еще может, непонятно что именно нужно. только разбивка текста на заголовок и само тело?
источник

KL

Kir L in Natural Language Processing
не-не, нужно просто искать по тексту. Например, спрашиваем "что нельзя дарить по работе", а в ответ получаем документ по бизнес-этике и т.п. и раздел, где описаны разрешенные подарки.
источник

KL

Kir L in Natural Language Processing
Alex Surname
сфинкс еще может, непонятно что именно нужно. только разбивка текста на заголовок и само тело?
а что за сфинкс? я только ASR библиотеку такую видел
источник

KL

Kir L in Natural Language Processing
что-то нашел
источник

AS

Alex Surname in Natural Language Processing
Kir L
а что за сфинкс? я только ASR библиотеку такую видел
источник

KL

Kir L in Natural Language Processing
спс
источник

D

Dmitry in Natural Language Processing
Kir L
ребята, кросс-пост из Слака сделаю, с вашего позволения:

Подскажите, пожалуйста, какие решения сейчас хороши в качестве сильного бейзлайна для поиска по документации?
Интересует поиск не только по заголовкам документов и разделов, но по самим абзацам текста.
Эластик с какими-то докрученными кастомными фичами? что-то еще? кто-то может знает хороший сёрви по теме.

Пока подсказали: эластик, solr, goldfire.
Abby Intelligent Search
источник

D

Dmitry in Natural Language Processing
Из платного)
источник