Size: a a a

Natural Language Processing

2021 January 20

A

AlexandrN in Natural Language Processing
Как вариант, обучить классификатор. Датасет для обучения можно подобрать, наверное, тут https://github.com/natasha/corus
источник

МП

Михаил Притугин... in Natural Language Processing
Max Frai
Привет, подскажите чем лучше определить жанр новости? (политика, спорт, наука, ...)
Тоже задавался этим вопросом
Есть конечно на ленте метки
Но их мало
источник

A

AlexandrN in Natural Language Processing
там несколько новостных датасетов
источник

DD

David Dale in Natural Language Processing
Max Frai
Привет, подскажите чем лучше определить жанр новости? (политика, спорт, наука, ...)
Вроде бы в корпусе taiga много протестированных новостей разных сми
источник

A

AlexandrN in Natural Language Processing
возможно, получиться собрать нужные тематики
источник

YS

Yaroslav Seliverstov in Natural Language Processing
Коллеги, всем привет! Скажите встречал ли кто-нибудь набор русской открытой речи со звуками поезда?
источник

Eg

Elena gisly in Natural Language Processing
Yaroslav Seliverstov
Коллеги, всем привет! Скажите встречал ли кто-нибудь набор русской открытой речи со звуками поезда?
вспоминается, как готовила такой текст в устный подкорпус НКРЯ в студенческие годы) какой-то ужас) извини за оффтопик, думаю, немного такого
источник

YS

Yaroslav Seliverstov in Natural Language Processing
Я вот тоже голову ломаю, не могу найти ничего такого)
источник

GF

Grigory Frantsuzov in Natural Language Processing
Yaroslav Seliverstov
Коллеги, всем привет! Скажите встречал ли кто-нибудь набор русской открытой речи со звуками поезда?
почему бы не смешать самому что угодно со звуками поезда?
источник

GF

Grigory Frantsuzov in Natural Language Processing
или просто сходить поговорить на станцию)
источник

YS

Yaroslav Seliverstov in Natural Language Processing
да так сейчас и делаем) просто вдруг уже есть что-то подобое)
источник

PV

Peter Vanin in Natural Language Processing
Товарищи знатоки, обращаюсь вот с чем. Были ли прецеденты совмещения gpt-подобного чего-либо с поисковым движком? Интересует делали ли подобное совмещение (в принципе) гиганты индустрии, или кто-либо в частном порядке. Может кому-то приходила идея..
источник

PV

Peter Vanin in Natural Language Processing
Речь о получении более продвинутого поиска по разнородно накопленным вещам, типа сайтов, текстовых документов (включая книги в пдф), и прочего прочего
источник

PV

Peter Vanin in Natural Language Processing
Если кто-то из вас уже задумывался, то может знаете насколько задача сложна по доведению до ума, т.е. пояснении машине какая поисковая выдача ложна, а какая точна, и т.д.
источник

PV

Peter Vanin in Natural Language Processing
Ведь если так задуматься, то можно подключить поисковый движок подобного класса к тем же открытым чатам профильных специалистов (например в тг), набирая тем самым непроверенный, но справочник знаний
источник

ni

n i in Natural Language Processing
источник

YB

Yuri Baburov in Natural Language Processing
Peter Vanin
Товарищи знатоки, обращаюсь вот с чем. Были ли прецеденты совмещения gpt-подобного чего-либо с поисковым движком? Интересует делали ли подобное совмещение (в принципе) гиганты индустрии, или кто-либо в частном порядке. Может кому-то приходила идея..
да. гуглите BERT for google search
(GPT — генератор текста, а BERT — хорошие эмбеддинги).
или интересует именно генерация текста? тогда мне непонятна задача
источник

PV

Peter Vanin in Natural Language Processing
Спасибо большое!
Запись неплохая, тезисы есть - хорошо, теперь гуглинг.
источник

DD

David Dale in Natural Language Processing
Peter Vanin
Товарищи знатоки, обращаюсь вот с чем. Были ли прецеденты совмещения gpt-подобного чего-либо с поисковым движком? Интересует делали ли подобное совмещение (в принципе) гиганты индустрии, или кто-либо в частном порядке. Может кому-то приходила идея..
Яндекс недавно писал, как они берт в поиск воткнули
https://habr.com/ru/company/yandex/blog/529658/
источник

SancheZz Мов in Natural Language Processing
Yuri Baburov
да. гуглите BERT for google search
(GPT — генератор текста, а BERT — хорошие эмбеддинги).
или интересует именно генерация текста? тогда мне непонятна задача
Знаю что ребята юзали для токсика гпт эмбеддинги)
источник