Телеграмм чат группы natural_language_processing страница 1329

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

3198 membersпожаловаться на группу

2021 July 14

DD

David Dale in Natural Language Processing

Видимо, речь шла о моей русской T5 (https://huggingface.co/cointegrated/rut5-base-multitask)
Статьи пока нет, но по смыслу там восстанавливались предложения из зашумлённой версии.
В качестве шума я переставлял/удалял слова и склонял их иначе, другие виды шума не вводились.

Если научиться генерировать шум, похожий на ошибки ASR, можно так же обучить T5 восстанавливать из зашумлённой версии предложения исходную.

источник

10:42пожаловаться #1

A

Anton in Natural Language Processing

Понял ))) а я уже перелопатил оригинальную статью на несколько раз.
Да, Давид, ты прав. Сейчас как раз занимаюсь созданием такой генерации шумных данных.

источник

10:43пожаловаться #2

VS

Vladislav Savostin in Natural Language Processing

Всем привет!
На хакатоне "цифровой прорыв" есть кейс от Росатома, который выглядит типовой задачей NLP.

Суть кейса: по записи видеоконференции составить протокол встречи с важными замечаниями и принятыми решениями.

Предлагаю вам принять участие в хакатоне в команде со мной. Я бекэнд разработчик и готов реализовать инфраструктурную обвязку вокруг ml движка.

Пишите в личку - познакомимся ближе и обсудим проект.

Ссылка на кейс Росатома: https://leadersofdigital.ru/event/63009/case/806854#cases

leadersofdigital.ru

Цифровой Прорыв 2021 - Хакатоны. Образование. Акселератор

Всероссийский конкурс для ИТ специалистов. Участвуй в хакатонах, образовательных проектах и акселераторе Цифрового Прорыва!

источник

11:23пожаловаться #3

A

Andrey in Natural Language Processing

да, выше @cointegrated ответил за меня. я именно эту модель и имел ввиду. миль пардон, если где-то ввел в заблуждение

источник

11:27пожаловаться #4

V

Vic in Natural Language Processing

Задача довольно сложная, она в разработке стоит от 1млн руб. интересно послушать согласился ли кто-то
Вангую тут 2 проблемы: с аудио в текст. а потом по тексту модели учить вытягивать решения. Время от 1 мес 2-3 разрабов

источник

11:33пожаловаться #5

VS

Vladislav Savostin in Natural Language Processing

Аудио в текст не проблема

источник

11:35пожаловаться #6

V

Vic in Natural Language Processing

проблема, тк качество будет плохое и диаризация

источник

11:36пожаловаться #7

VS

Vladislav Savostin in Natural Language Processing

Что такое диаризация?

источник

11:36пожаловаться #8

A

Anton in Natural Language Processing

Разделение по спикерам

источник

11:37пожаловаться #9

VS

Vladislav Savostin in Natural Language Processing

А в чем принципиальное отличие в задаче извлечения фактов для одного спикера и нескольких?

источник

11:40пожаловаться #10

A

Andrey in Natural Language Processing

разделить кто что говорит. есть модель от FB для 5ти голосов. sota вроде на момент

источник

11:52пожаловаться #11

VS

Vladislav Savostin in Natural Language Processing

Если все обработать как речь одного спикера, факты выделить не удастся?

источник

11:54пожаловаться #12

A

Andrey in Natural Language Processing

там есть еще требование про протокол

источник

11:55пожаловаться #13

A

Andrey in Natural Language Processing

участвовать не собираюсь, просто вопрос. а есть что-либо для голоса векторизовать? ну там поиск ближайшего чтобы?

источник

11:58пожаловаться #14

VS

Vladislav Savostin in Natural Language Processing

Я бы попробовал выступить с mvp, который формирует текстовый итог встречи, без фиксации кто что сказал.

источник

11:58пожаловаться #15

A

Andrey in Natural Language Processing

нашел, pyannote-audio

источник

12:12пожаловаться #16

RS

Roman Samarev in Natural Language Processing

https://nextjournal.com/Adarshkumar712/gsoc-2021-pplm.jl

GSoC 2021: PPLM.jl - Controlled Text Generation with Julia (Part I)

Being a part of Google Summer of Code 2021 with Julia Community has been one of the most amazing experiences so far. All thanks to my mentors Avik Sengupta and Tejas Vaidhya for their encouragement and support. It has been a month since I started working on PPLM.jl, a Julia based package for controlled text generation, based on Plug and Play Language Models by Uber. Here is my first blog on what PPLM.jl has to offer so far.

источник

16:32пожаловаться #17

AP

Alex Peresmeshnik in Natural Language Processing

Какую видюшку сейчас лучше присмотреть? Что-то типа Nvidia K80, или из геймерских?

источник

20:28пожаловаться #18

AK

Aleksey Kulnevich in Natural Language Processing

3090 может оптимальнее в плане цены / качества

источник

21:26пожаловаться #19

D

Dmitriy in Natural Language Processing

а есть реальный смысл покупать GPU ?
и она окупит себя в сравнении с облаками ?

источник

21:28пожаловаться #20