Телеграмм чат группы natural_language

огромное спасибо за информирование, будем следить

21:49пожаловаться #1

YB

!pip install "spacy>=2.3"
In [3]: nlp=spacy.load('releases/2.3beta/ru2_nerus_800ks_96')
In [4]: w = nlp('тачка тачку машина транспорт авто средство колымага')
In [8]: for t in w:
...: print(t, t.has_vector, t.is_oov, t.similarity(w[0]))
...:
...:
...:
тачка True False 1.0
тачку True False 1.0
машина True False 0.46673042
транспорт True False 0.2455553
авто True False 0.39078075
средство True False -0.004572388
колымага True False 0.5910443

а вот для слова "автомобиль":
тачка True False 0.4261163
тачку True False 0.4261163
машина True False 0.77885175
транспорт True False 0.45201242
авто True False 0.69870263
средство True False 0.3050452
колымага True False 0.3159924
автомобиль True False 1.0

21:50пожаловаться #2

YB

Toemik Mnemonic

огромное спасибо за информирование, будем следить

нет, релиз сам-то есть и выложен, просто к нему нет нормальной инструкции! и не измерено нормально качество NER. остальное всё есть.

21:50пожаловаться #3

TM

а вот для слова "автомобиль":
тачка True False 0.4261163
тачку True False 0.4261163
машина True False 0.77885175
транспорт True False 0.45201242
авто True False 0.69870263
средство True False 0.3050452
колымага True False 0.3159924
автомобиль True False 1.0

это тоже dev ветка или релизная?

21:51пожаловаться #4

TM

нет, релиз сам-то есть и выложен, просто к нему нет нормальной инструкции! и не измерено нормально качество NER. остальное всё есть.

понял, нашел! попробую с 2.3

21:51пожаловаться #5

YB

Toemik Mnemonic

это тоже dev ветка или релизная?

просто с обычной spacy загружаешь файл модели, взятой по этой ссыке: https://github.com/buriy/spacy-ru/releases/tag/v2.3_beta

Release spaCy 2.3 beta models · buriy/spacy-ru

Models included in this release:
ru2_nerus_800ks_96

width=96 (for CPU and GPU **)
POS score: 87,9
DEP score: 87,1
NER score: 95,3
trained on Nerus
LICENSE: MIT

Itn Tag Loss Tag % Dep Loss...

21:52пожаловаться #6

TM

просто с обычной spacy загружаешь файл модели, взятой по этой ссыке: https://github.com/buriy/spacy-ru/releases/tag/v2.3_beta

Release spaCy 2.3 beta models · buriy/spacy-ru

Models included in this release:
ru2_nerus_800ks_96

width=96 (for CPU and GPU **)
POS score: 87,9
DEP score: 87,1
NER score: 95,3
trained on Nerus
LICENSE: MIT

Itn Tag Loss Tag % Dep Loss...

👍

21:54пожаловаться #7

TM

@yuri_baburov a ru2 на этом корпусе https://github.com/snakers4/open_stt/ обучен ?

Open STT. Contribute to snakers4/open_stt development by creating an account on GitHub.

snakers4/open_stt

23:17пожаловаться #8

YB

Toemik Mnemonic

@yuri_baburov a ru2 на этом корпусе https://github.com/snakers4/open_stt/ обучен ?

Open STT. Contribute to snakers4/open_stt development by creating an account on GitHub.

snakers4/open_stt

Нет конечно. А чему там учиться?

23:17пожаловаться #9

TM

Нет конечно. А чему там учиться?

Действительно , текста то нет . Не увидел

23:22пожаловаться #10

YB

Нет конечно. А чему там учиться?

Вектора учились на худлите (+ дополнения из pymorphy), так что какие-то пересечения про текстам с подкорпусом buriy_audiobook могут быть. Но тестовый корпус намного крупнее, чем текста в аудиокорпусе.

Nick Mikhailovsky in Natural Language Processing

23:23пожаловаться #11

2020 November 17

NM

Примерно каждый первый, кто занимался вычислительной лингвистикой, делал выявление поименованных сущностей, например, адресов или имен, из неструктурированного текста. Но задача структурирования текста намного обширнее и сложнее: возникают вопросы о связях поименованных сущностей и т.д., и т.п.
Несмотря на то, что выявления поименованных сущностей я так или иначе касался (с перерывами) лет пятнадцать, для меня недавно открытием явилось наличие подходов, связанных с системами переходов. Похоже, они позволяют описать многие задачи структурного предсказания в рамках единого фреймворка.
На очередном научно-техническом вебинаре НТР и HITS ТГУ (сегодня, 17 ноября, в 15 часов по Москве и 19 по Томску) Егор Грибков обсудит структурное предсказание в обработке естественного языка. Если честно, самому очень интересно.
Регистрация по https://us02web.zoom.us/webinar/register/1515989556145/WN_TRftoSBaR-KGXYQW6wlxTg

Zoom Video

Welcome! You are invited to join a webinar: Структурное предсказание в обработке естественного языка. After registering, you will receive a confirmation email about joining the webinar.

Докладчик: Егор Грибков, ML Engineer, TomskSoft

Welcome! You are invited to join a webinar: Структурное предсказание в обработке естественного языка. After registering, you will receive a confirmation email about joining the webinar.

02:24пожаловаться #12

AP

Anatoliy Polischuk in Natural Language Processing

Nick Mikhailovsky

Примерно каждый первый, кто занимался вычислительной лингвистикой, делал выявление поименованных сущностей, например, адресов или имен, из неструктурированного текста. Но задача структурирования текста намного обширнее и сложнее: возникают вопросы о связях поименованных сущностей и т.д., и т.п.
Несмотря на то, что выявления поименованных сущностей я так или иначе касался (с перерывами) лет пятнадцать, для меня недавно открытием явилось наличие подходов, связанных с системами переходов. Похоже, они позволяют описать многие задачи структурного предсказания в рамках единого фреймворка.
На очередном научно-техническом вебинаре НТР и HITS ТГУ (сегодня, 17 ноября, в 15 часов по Москве и 19 по Томску) Егор Грибков обсудит структурное предсказание в обработке естественного языка. Если честно, самому очень интересно.
Регистрация по https://us02web.zoom.us/webinar/register/1515989556145/WN_TRftoSBaR-KGXYQW6wlxTg

Zoom Video

Докладчик: Егор Грибков, ML Engineer, TomskSoft

Спасибо большое за информацию.

Futorio Franklin in Natural Language Processing

09:05пожаловаться #13

FF

Nick Mikhailovsky

Примерно каждый первый, кто занимался вычислительной лингвистикой, делал выявление поименованных сущностей, например, адресов или имен, из неструктурированного текста. Но задача структурирования текста намного обширнее и сложнее: возникают вопросы о связях поименованных сущностей и т.д., и т.п.
Несмотря на то, что выявления поименованных сущностей я так или иначе касался (с перерывами) лет пятнадцать, для меня недавно открытием явилось наличие подходов, связанных с системами переходов. Похоже, они позволяют описать многие задачи структурного предсказания в рамках единого фреймворка.
На очередном научно-техническом вебинаре НТР и HITS ТГУ (сегодня, 17 ноября, в 15 часов по Москве и 19 по Томску) Егор Грибков обсудит структурное предсказание в обработке естественного языка. Если честно, самому очень интересно.
Регистрация по https://us02web.zoom.us/webinar/register/1515989556145/WN_TRftoSBaR-KGXYQW6wlxTg

Zoom Video

Welcome! You are invited to join a webinar: Структурное предсказание в обработке естественного языка. After registering, you will receive a confirmation email about joining the webinar.

Докладчик: Егор Грибков, ML Engineer, TomskSoft

Будет доступна запись?

Sasha Zhu in Natural Language Processing

09:07пожаловаться #14

SZ

Всем привет!
Ищу того, с кем можно было бы проконсультироваться по NLG. Напишите мне, пожалуйста, в лс, если обладаете подобной экспертизой. Спасибо!

Alexander Kukushkin in Natural Language Processing

09:19пожаловаться #15

AK

https://www.facebook.com/olga.kairova/posts/10157719960593034

"Но незадолго до завершения гранта наш курирующий проректор в МФТИ Сергей Гаричев решил взять в свои руки коммерциализацию проекта и настоял на передаче бренда iPavlov, SaaS и всех наших коммерческих активов назначенному им СЕО Лорану Акопяну, с запретом команде оригинального проекта iPavlov заниматься его коммерциализацией"

Кто понял что там написано? Что это означает для библиотеки DeepPavlov? Будет продолжаться research и opensource для русского языка

Sebastian Pereira in Natural Language Processing

11:06пожаловаться #16

SP

Alexander Kukushkin

https://www.facebook.com/olga.kairova/posts/10157719960593034

"Но незадолго до завершения гранта наш курирующий проректор в МФТИ Сергей Гаричев решил взять в свои руки коммерциализацию проекта и настоял на передаче бренда iPavlov, SaaS и всех наших коммерческих активов назначенному им СЕО Лорану Акопяну, с запретом команде оригинального проекта iPavlov заниматься его коммерциализацией"

Кто понял что там написано? Что это означает для библиотеки DeepPavlov? Будет продолжаться research и opensource для русского языка

Не очень понятно, кто теперь правообладатель и какова судьба всего софта с позиции копирайта.

Denis Kirjanov in Natural Language Processing

11:22пожаловаться #17

DK

вроде как диппавлов и айпавлов теперь отдельно, и диппавлов сам по себе

11:38пожаловаться #18

V

Viacheslav in Natural Language Processing

Так как по гранту то возможно код до 22.05 свободен, дальше в него комитить не будут авторы, только сообщество. Дальше будет форк в свой коммерческий репозиторий и развитие в нем.

12:53пожаловаться #19

V

Viacheslav in Natural Language Processing

Я так понял, и конечный продукт ipavlov уходит в коммерческие руки. Авторы именно продукт не могут форкнуть. А библиотека живёт дальше своей жизнью