Телеграмм чат группы natural_language_processing страница 804

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1933 membersпожаловаться на группу

2020 August 26

I9

Ivan 9kin in Natural Language Processing

по 30

источник

09:04пожаловаться #1

YB

Yuri Baburov in Natural Language Processing

понятно, самое хреновое количество.
в общем, посмотри на https://github.com/buriy/nlp_workshop или любые другие материалы по классификации, попробуй у себя что-нибудь такое сделать.

buriy/nlp_workshop

nlp workshop at datafest siberia 2019. Contribute to buriy/nlp_workshop development by creating an account on GitHub.

источник

09:05пожаловаться #2

I9

Ivan 9kin in Natural Language Processing

И насколько это задача сложна? (Я в 10 класс перешёл)

источник

09:05пожаловаться #3

SP

Sebastian Pereira in Natural Language Processing

И насколько это задача сложна? (Я в 10 класс перешёл)

Юрий ее уже решил за тебя. Подставь свои данные и посмотри результат.

источник

09:07пожаловаться #4

I9

Ivan 9kin in Natural Language Processing

спасибо вам огромное

источник

09:07пожаловаться #5

ДЛ

Дмитрий Лейкин... in Natural Language Processing

https://pymorphy2.readthedocs.io/en/latest/user/grammemes.html - тут нет обозначений времени. Как найти слова в прошедшем времени?

источник

14:11пожаловаться #6

FF

Futorio Franklin in Natural Language Processing

Дмитрий Лейкин

https://pymorphy2.readthedocs.io/en/latest/user/grammemes.html - тут нет обозначений времени. Как найти слова в прошедшем времени?

источник

14:12пожаловаться #7

FF

Futorio Franklin in Natural Language Processing

http://opencorpora.org/dict.php?act=gram

opencorpora.org

OpenCorpora: открытый корпус русского языка

источник

14:12пожаловаться #8

ДЛ

Дмитрий Лейкин... in Natural Language Processing

rule(
    and_(
        gram('ADJF'),  # так помечается прилагательное, остальные пометки описаны в
                       # http://pymorphy2.readthedocs.io/en/latest/user/grammemes.html
        is_capitalized()
    ),

Какие обозначения для yargy?

источник

14:13пожаловаться #9

FF

Futorio Franklin in Natural Language Processing

Да

источник

14:13пожаловаться #10

ДЛ

Дмитрий Лейкин... in Natural Language Processing

and_(
gram('past')

не работает.

источник

14:16пожаловаться #11

ДЛ

Дмитрий Лейкин... in Natural Language Processing

а, нет

источник

14:17пожаловаться #12

ДЛ

Дмитрий Лейкин... in Natural Language Processing

мой косяк

источник

14:17пожаловаться #13

ДЛ

Дмитрий Лейкин... in Natural Language Processing

Спасибо, работает!

источник

14:17пожаловаться #14

AK

Alexander Kukushkin in Natural Language Processing

Интересный стрим Татьяны Ландо https://youtu.be/ny3VDGNdlcY?t=111 про лингвистику, Гугл, их чат-бот ассистент и русский язык.
1. Они не используют логи чат-бота, чтобы улучшать ассистент. Чтобы лучше парсить фразы типа "поставь будильник на семь" не смотрят в логи как пользователи пытаются это сделать, а придумывают что-то из головы + как все остальные собирают из открытых источников. По-моему это скорее печально. Интересно как в Алисе, @cointegrated есть что-то публичное на тему?
2. У чат-ботов есть бесполезная часть про болталки и полезная про решение задач (тот же будильник). Сейчас отличный прогресс по болталкам, вспоминаем GPT, и непонятно что делать с решением задач. Похоже, Гугл сейчас как все строит решения на правилах, думает как бы сделать что-то unsupervised как с болталкой

Как компьютерный лингвист учит Google-ассистента говорить по русски

Выступает Татьяна Ландо, компьютерный лингвист и основатель конференции AINL

источник

16:57пожаловаться #15

BS

Bogdan Salyp in Natural Language Processing

Всем привет) Перекатываюсь сейчас в nlp, если более конкретно, занимаюсь задачей извлечения контекста из предложений и статей, как на eng, так и на кириллице

По поводу бекграунда - конкретно по nlp ходил вживую на CS224n

Сюда можно вкидывать что-то интересное по теме на обсуждение?)

источник

17:16пожаловаться #16

AK

Alexander Kukushkin in Natural Language Processing

Всем привет) Перекатываюсь сейчас в nlp, если более конкретно, занимаюсь задачей извлечения контекста из предложений и статей, как на eng, так и на кириллице

По поводу бекграунда - конкретно по nlp ходил вживую на CS224n

Сюда можно вкидывать что-то интересное по теме на обсуждение?)

Ну конечно

источник

18:00пожаловаться #17

A

Anthony in Natural Language Processing

Ребят, а подскажите почему NamesExtractor может не находить имена? Вообще никакие. Natasha==0.10.0 стоит

источник

18:03пожаловаться #18

DD

David Dale in Natural Language Processing

Alexander Kukushkin

Интересный стрим Татьяны Ландо https://youtu.be/ny3VDGNdlcY?t=111 про лингвистику, Гугл, их чат-бот ассистент и русский язык.
1. Они не используют логи чат-бота, чтобы улучшать ассистент. Чтобы лучше парсить фразы типа "поставь будильник на семь" не смотрят в логи как пользователи пытаются это сделать, а придумывают что-то из головы + как все остальные собирают из открытых источников. По-моему это скорее печально. Интересно как в Алисе, @cointegrated есть что-то публичное на тему?
2. У чат-ботов есть бесполезная часть про болталки и полезная про решение задач (тот же будильник). Сейчас отличный прогресс по болталкам, вспоминаем GPT, и непонятно что делать с решением задач. Похоже, Гугл сейчас как все строит решения на правилах, думает как бы сделать что-то unsupervised как с болталкой

Как компьютерный лингвист учит Google-ассистента говорить по русски

Выступает Татьяна Ландо, компьютерный лингвист и основатель конференции AINL

Про работу с логами в Алисе публичных докладов я не помню, кроме короткого рассказа Саши Изосиной про разметку разговоров на Толоке.
Но вообще можно догадаться, что Яндекс в своих продуктах очень data-oriented, и Алиса с ног до головы обвешана разными метриками.
В целом, можно поковыряться в Толоке и найти задания и на транскрибацию аудио, и на классификацию интентов, и на разметку успешности/неуспешности выполнения задач.

источник

18:15пожаловаться #19

DD

David Dale in Natural Language Processing

Alexander Kukushkin

Интересный стрим Татьяны Ландо https://youtu.be/ny3VDGNdlcY?t=111 про лингвистику, Гугл, их чат-бот ассистент и русский язык.
1. Они не используют логи чат-бота, чтобы улучшать ассистент. Чтобы лучше парсить фразы типа "поставь будильник на семь" не смотрят в логи как пользователи пытаются это сделать, а придумывают что-то из головы + как все остальные собирают из открытых источников. По-моему это скорее печально. Интересно как в Алисе, @cointegrated есть что-то публичное на тему?
2. У чат-ботов есть бесполезная часть про болталки и полезная про решение задач (тот же будильник). Сейчас отличный прогресс по болталкам, вспоминаем GPT, и непонятно что делать с решением задач. Похоже, Гугл сейчас как все строит решения на правилах, думает как бы сделать что-то unsupervised как с болталкой

Как компьютерный лингвист учит Google-ассистента говорить по русски

Выступает Татьяна Ландо, компьютерный лингвист и основатель конференции AINL

Что касается "полезной" (goal-oriented) части, Гугл в прошлом году организовывал в рамках dstc-8 дорожку "schema-guided dialogue state tracking", в результате которой должен был хороший few-shot learning получиться для разбора интентов и слотов - на основе схемы (aka правил) и небольшого количества размеченных примеров. Вроде бы даже что-то получилось)
И мне кажется, что примерно в этом направлении индустрия двигаться и будет. Но пока движется очень медленно, конечно.

источник

18:17пожаловаться #20