Size: a a a

2020 October 07

A

ArRR in ntwrk
теперь для видео-звонков хватит 32 кбита? :)
источник

D

Denis in ntwrk
ArRR
теперь для видео-звонков хватит 32 кбита? :)
Маски и обученой матрицы лица
источник

JT

James Town in ntwrk
ArRR
теперь для видео-звонков хватит 32 кбита? :)
а как же звук?
источник

A

ArRR in ntwrk
James Town
а как же звук?
А это уже проблемы другого отдела 😂
источник

D

Denis in ntwrk
ArRR
А это уже проблемы другого отдела 😂
RTX AudioIO
источник

AB

Alexander Biryukov in ntwrk
а потом тебя убивает когда забежал за угол
источник

A

ArRR in ntwrk
James Town
а как же звук?
чисто теоретически, нейросеть может определить тембр, обертона, и передавать звук текстом, генерируя что-то похожее на исходник на выходе
источник

D

Denis in ntwrk
Кот это отдельный объект
источник

С

Сергей Собакин... in ntwrk
Голос переводит в текст, жать и отдавать клиенту. На клиенте в обратно порядке
источник

JT

James Town in ntwrk
ArRR
чисто теоретически, нейросеть может определить тембр, обертона, и передавать звук текстом, генерируя что-то похожее на исходник на выходе
ну звук это не картинка. Смысл такой связи только в звуке, можно даже без картинки. Если вместо голоса будет шум, сервисом никто не будет пользоваться. Не на руках же объяснять.
источник

JT

James Town in ntwrk
Сергей Собакин
Голос переводит в текст, жать и отдавать клиенту. На клиенте в обратно порядке
Даже Сири так не может, а вы в проде в реальном времени хотите определять слова
источник

ИБ

Иван Балакин... in ntwrk
> > > Даже Сири
> > > Даже
источник

С

Сергей Собакин... in ntwrk
Эммм Сири эталон?
источник

JT

James Town in ntwrk
а что эталог?
источник

R

Roman in ntwrk
ага, по ключевым точкам
источник

ИБ

Иван Балакин... in ntwrk
James Town
а что эталог?
Что угодно кроме?
источник

A

ArRR in ntwrk
James Town
ну звук это не картинка. Смысл такой связи только в звуке, можно даже без картинки. Если вместо голоса будет шум, сервисом никто не будет пользоваться. Не на руках же объяснять.
ну говорят же уже нейросети голосами знаменитостей :) Правда, не знаю сколько процесс генерации времени занимает, но это уже в мощности железа упирается
источник

JT

James Town in ntwrk
ну вот что кроме?
источник

R

Roman in ntwrk
Сергей Собакин
Голос переводит в текст, жать и отдавать клиенту. На клиенте в обратно порядке
ну это совсем изварт
источник

С

Сергей Собакин... in ntwrk
Ну зато можно картиночки маркетологам лепить что у нас видеочат 1 КБ/с
источник