Телеграмм чат группы natural_language

пробуй эту версию

14:15пожаловаться #1

RZ

со старым интерфейсом

14:15пожаловаться #2

RZ

API may change, for realworld tasks consider using low level libraries from Natasha project. Models optimized for news articles, quality on other domain may be lower. To use old NamesExtractor, AddressExtactor downgrade pip install natasha<1 yargy<0.13

14:16пожаловаться #3

RZ

вот из документашки Наташки

14:17пожаловаться #4

A

Версионность библиотеки · Issue #64 · natasha/yargy

Да я тут тоже набрел, видимо не пкрвый сталкиваюсь:

https://github.com/natasha/yargy/issues/64

Спасибо за помощь! Буду пробовать)

GitHub

Добрый день. Около полутора/двух лет назад были написаны правила на движке Yargy. Во время написания версия библиотеки была 0.9.1. Судя по всему, на версии 0.10.0 была проведена реструктуризация пр...

14:20пожаловаться #5

RZ

Напиши, помогло или нет

14:21пожаловаться #6

A

Хорошо

Konstantin Smith in Natural Language Processing

14:22пожаловаться #7

KS

Vitalii Smirnov

Здравствуйте! Добрый день! Есть система, в которой данные представляются пользователю в виде формы ввода на основании дерева связанных показателей (разная степень обобщения данных). Сейчас дерево показателей строится вручную, но мне необходимо автоматизировать построение дерева показателей (дальнейшую детализацию показателей). Дерево показателей также используется для сбора данных из открытых источников. На, Ваш взгляд, насколько это реализуемо с использованием нейронных сетей и в какие деньги обойдётся разработка, включая НИР? Не знаю насколько понятно обозначил задачу. Отвечу на все дополнительные вопросы. Готов также пообщаться лично, либо по телефону

Лет 5 назад у одного заказчика была задача построения онтологии по описаниями (номенклатурам) товара. Они мониторили госзакупки и искали товары медицинской направленности. Моя была задача (1) выделить из документации товарные позиции и (2) разобрать эти товарные позиции на атомарные элементы, которые потом служили для построения онтологии. Элементы были разных типов: ключевые слова, наименования, количественные и качественные атрибуты и пр. Для этого я в Pullenti специально сделал сущности GoodReferent и GoodAttributeReferent для разбора описаний. Можно попробовать использовать их.

15:35пожаловаться #8

A

Roman Zaitsev

Напиши, помогло или нет

Помогло. Установил natasha==0.10.0 и yargy==0.12.0. Все работает отлично

16:00пожаловаться #9

RZ

Anthony

Помогло. Установил natasha==0.10.0 и yargy==0.12.0. Все работает отлично

Понял, спасибо

16:21пожаловаться #10

A

Тебе спасибо )

Fedor Ezhov in Natural Language Processing

16:28пожаловаться #11

FE

Здравствуйте. Впервые работаю с анализом текста, хотел бы спросить совета. Есть следующая задача, нужно по названию профессии вывести список требуемых для нее "скиллов", например: профессия - "Аналитик данных " -> набор скиллов - "Высшее образование по направлению инженер/математик/физик/геофизик/data scientist/data analyst (высокий средний балл). — Опыт работы на Matlab, Python". Общую структуру в данных выделить сложно, т.к. все данные парсятся с анекет hh, которые составляют hr'ы. Составляют они их по разному. Хотел бы узнать каким подходом лучше решать данную задачу, обычный ML или же углубляться в сетки? Сейчас копаю информацию в сторону seq-to-seq моделей.

Defragmented Panda in Natural Language Processing

16:28пожаловаться #12

DP

Fedor Ezhov

Здравствуйте. Впервые работаю с анализом текста, хотел бы спросить совета. Есть следующая задача, нужно по названию профессии вывести список требуемых для нее "скиллов", например: профессия - "Аналитик данных " -> набор скиллов - "Высшее образование по направлению инженер/математик/физик/геофизик/data scientist/data analyst (высокий средний балл). — Опыт работы на Matlab, Python". Общую структуру в данных выделить сложно, т.к. все данные парсятся с анекет hh, которые составляют hr'ы. Составляют они их по разному. Хотел бы узнать каким подходом лучше решать данную задачу, обычный ML или же углубляться в сетки? Сейчас копаю информацию в сторону seq-to-seq моделей.

профессий менее 1000

это быстрее сделать вручную. если хочется забав - бери gpt и дообучай на анкетах hh

Defragmented Panda in Natural Language Processing

16:43пожаловаться #13

DP

но все равно там правильных ответов будет эдак 10%. и ты все равно сам будешь просматривать эти 10к вариантов