Size: a a a

Natural Language Processing

2020 October 03

YB

Yuri Baburov in Natural Language Processing
Андрей Ключаревский
Здравствуйте! Кто может помочь с классификатором ключевых слов на теги "годно", "негодно", "годно+негодно".  Данные разметил как в скрине, но лучше, чтобы перевод не склеивался с оргиналом. Хотел через monkeylearn прогрузить, а там лимит 300 запросов.

Буду запускать с вин10. А еще лучше подскажите что-то с двухкнопочным интерфейсом, а то пробовал knime - не зашло
уж написать что-то с двухкнопочным интерфейсом для веба можно самому за час.
источник

VS

Vitalii Smirnov in Natural Language Processing
Здравствуйте! У кого есть опыт построения информационных систем с микросервисной архитектурой? было бы интересно пообщаться. В первую очередь, интересуют источники, чтобы подтянуть знания? Второе, отклики, насколько реализуемо и целесообразно использовать в наше время. Если, конечно, мои вопросы в тему))))
источник

SK

Sasha Korovii in Natural Language Processing
Привет
Кто-то знает где взять украинский датасет для классификации тональностей? Нужен для учебного проекта.
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Vitalii Smirnov
Здравствуйте! У кого есть опыт построения информационных систем с микросервисной архитектурой? было бы интересно пообщаться. В первую очередь, интересуют источники, чтобы подтянуть знания? Второе, отклики, насколько реализуемо и целесообразно использовать в наше время. Если, конечно, мои вопросы в тему))))
Вы про docker в частности? Или о чем то другом?
источник

VS

Vitalii Smirnov in Natural Language Processing
Здравствуйте, Сергей!
источник

АК

Андрей Ключаревский... in Natural Language Processing
Sergey Dulikov
Логика разметки не очень понятна, поэтому не понятен подоход к задаче
Я таким макаром разметил 1к rows и получил классификатор на три вышеупомянутых тега - точность 90%. Логика у меня в голове:)
В Bad попадают все непонятные каракули, упоминания других брендов без уникальных ключей рядом. "Industrial park Midamerica"('industrial park' упоминается в каждой 10-ой строке и ценности не несет)
В Good все LSI и KWs пригодные для прямого встраивания в текста. "industrial techno park"
В Bad:Good попадает например "Industrial science eco park Baidu" хоть есть и бренд 'Baidu', есть и редкий ключ 'Industrial science eco park'.

Вот скрин настроек машины, которая с точностью 90% крепит нужные мне теги, но там ограничение по обработке 300 запросов.
источник

АК

Андрей Ключаревский... in Natural Language Processing
Igor Panteleev
а почему knime не зашел?
Я все по документации делал. Пытался скормить эксельки, csv с правильными первыми строками, чищенными от всяких пробелов, кириллиц, а он в никакую данные не принимает. Или принимает, но ломает.
источник
2020 October 04

A

Artem in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 Christopher Loebis кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@Joyfulltake, @DefragmentedPanda, @ashatilov, @Nikolay_Karelin, @marylev
Powered by Todorant
источник

ДЛ

Дмитрий Лейкин... in Natural Language Processing
Где найти оцифрованные семантические, идеографические словари, тезаурусы? http://gramota.ru/slovari/types/17_7
источник

A

Artem in Natural Language Processing
добрый вечер! как в yargy пропускать ненужные слова?
разделение  аптечного  бизнеса исключительно в целях получения налоговой выгоды
 нужно извлечь "разделение бизнеса в целях получения налоговой выгоды", получается мне нужно правило в котором все остальные возможные ненужные слова помечены в правиле как optional? есть ли грамема для любого слова? чтобы я в правиле например мог указать AnyWord+ optional?
источник

AK

Alexander Kukushkin in Natural Language Processing
Artem
добрый вечер! как в yargy пропускать ненужные слова?
разделение  аптечного  бизнеса исключительно в целях получения налоговой выгоды
 нужно извлечь "разделение бизнеса в целях получения налоговой выгоды", получается мне нужно правило в котором все остальные возможные ненужные слова помечены в правиле как optional? есть ли грамема для любого слова? чтобы я в правиле например мог указать AnyWord+ optional?
Хорошего варианта нет. Можно использовать предикат true, но это плохо по производительности, есть вариант https://nbviewer.jupyter.org/github/natasha/yargy/blob/master/docs/cookbook.ipynb#%D0%9F%D1%80%D0%BE%D0%BF%D1%83%D1%81%D1%82%D0%B8%D1%82%D1%8C-%D1%87%D0%B0%D1%81%D1%82%D1%8C-%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0
источник

A

Artem in Natural Language Processing
Спасибо, гляну
источник

ДЛ

Дмитрий Лейкин... in Natural Language Processing
Мне кажется проще взять только морфологический анализатор, а поиск паттернов реализовывать самому.
источник

A

Artem in Natural Language Processing
подумал еще может самому расстояние между извелченными фактами мерять
источник

A

Artem in Natural Language Processing
если разделение до 20 символов до следующего факта то тру)
источник

A

Artem in Natural Language Processing
а как выкинуть то что optional из интерпритации?
источник

SZ

Sasha Zhu in Natural Language Processing
Здравствуйте, а есть тут специалисты по nlg/nmt?
источник

ZZ

Zigfrid Zvezdin in Natural Language Processing
У spaCy есть POS (part of speech) и более детализированные TAG - https://spacy.io/api/annotation#pos-en - например, не просто adjective, но adjective, comparative или adjective, superlative. Для существительных это будет, например, noun, proper singular или noun, plural.
А как tag назвать по-русски? Есть какое-то устойчивое название?
источник

SZ

Sasha Zhu in Natural Language Processing
Zigfrid Zvezdin
У spaCy есть POS (part of speech) и более детализированные TAG - https://spacy.io/api/annotation#pos-en - например, не просто adjective, но adjective, comparative или adjective, superlative. Для существительных это будет, например, noun, proper singular или noun, plural.
А как tag назвать по-русски? Есть какое-то устойчивое название?
Части речи
источник