Size: a a a

Natural Language Processing

2021 September 04

OP

Oleg Polivin in Natural Language Processing
Мне вот эта библиотека показалась хорошей
https://github.com/boudinfl/pke
источник

ЛВ

Леха Великолепный... in Natural Language Processing
Большое спасибо, а с русским справится ?
источник

ЛВ

Леха Великолепный... in Natural Language Processing
Переслано от Oleg Polivin
Мне вот эта библиотека показалась хорошей
https://github.com/boudinfl/pke
источник

ЛВ

Леха Великолепный... in Natural Language Processing
Большое спасибо, а как дело с русским обстоят ?
источник

ЛВ

Леха Великолепный... in Natural Language Processing
Переслано от Yuri Baburov
источник

OP

Oleg Polivin in Natural Language Processing
в PKE сразу несколько алгоритмов, какие-то подойдут и для русского. Там же есть и YAKE, который для любого языка подходит. Но оригинальное воплощение более гибкое:
https://github.com/LIAAD/yake
источник

VS

Vyacheslav Sherkunov in Natural Language Processing
Добрый вечер. Снова обращаюсь к знатокам, какие есть варианты получения связанных понятий с их сематической близостью из языковых моделей, например bert, что-то вроде исходное слово график и для него, календарь 0.4, гистограмма 0.5 и т.д.?
источник

N

Natalia in Natural Language Processing
ну для начала https://rusvectores.org/
источник
2021 September 05

N

No_nice in Natural Language Processing
Добрый день, у кого нибудь есть датасет Пикабу или ссылка на него?
источник

KS

Konstantin Shitkov in Natural Language Processing
Брать перплексию от фразы в языковой модели. Т5 это из коробки умеет.
источник

VS

Vyacheslav Sherkunov in Natural Language Processing
Спасибо за наводки, будем думать
источник

SM

S M in Natural Language Processing
источник

N

No_nice in Natural Language Processing
Нет, нетоксичный датасет, есть ли датасет с диалогами Пикабу? Или он в закрытом доступе?
источник

VS

Vladimir Shitov in Natural Language Processing
Не знаю про готовые датасеты, но я пытался парсить Пикабу и не смог: там есть защита. Даже через селениум не пробился, вроде
источник

N

No_nice in Natural Language Processing
Учту, спасибо
источник

d

dePuff in Natural Language Processing
Для Пикабу попадалось только вот такое https://pikastat.d3d.info/
источник

d

dePuff in Natural Language Processing
Помню, что посмотрел на размер, формат и сказал: да проще выпарсить, что нужно самому 😅
источник

VS

Vladimir Shitov in Natural Language Processing
Вот не проще оказалось :(
источник

VS

Vladimir Shitov in Natural Language Processing
Но может, можно пробиться: я только один вечер на это потратил. Или связаться с администрацией, они обычно идут на контакт
источник

d

dePuff in Natural Language Processing
Ну тогда 300Гб места на диске и хороший sql запрос поможет отцам русской демократии
источник