Size: a a a

2020 December 17

M

Mia in Япония
Kuroi Kurlyk
Спасибо, доктор. С меня 5000 иен?
источник

AT

Arseny Tolmachev in Япония
мультимодальность - это когда у нас есть работа с разными "модами" одновременно, те текст и что-то ещё (звук, картинки, итд)
источник

ИЯ

Ирина Яковлева... in Япония
Arseny Tolmachev
я занимаюсь NLP и в курсе про это всё -_-
сначала подумала не про то нлп.
источник

f

fakana357 in Япония
Arseny Tolmachev
мультимодальность - это когда у нас есть работа с разными "модами" одновременно, те текст и что-то ещё (звук, картинки, итд)
А, ну это да, потенциально проблема
источник

AT

Arseny Tolmachev in Япония
"научилась кодить приложения" - это небольшие сниппеты по 20 байт с ошибками иногда выводит
источник

AT

Arseny Tolmachev in Япония
потому что в текстах для обучения были небольшие примеры, и как языковая модель она неплохо работает с именами
источник

AT

Arseny Tolmachev in Япония
но как только даже текст становится чуть чуть длиннее, и то уже проблемы с когерентностью дискурса
источник

AT

Arseny Tolmachev in Япония
да, скорее всего такое улучшится в будущем
источник

f

fakana357 in Япония
Arseny Tolmachev
"научилась кодить приложения" - это небольшие сниппеты по 20 байт с ошибками иногда выводит
Ну так или иначе уже ж удивительно что может хотя бы это, прошлая гтп могла тооько в текст, а эта уже столько умеет, мне просто кажется что через несколько итераций с учётом темпа её роста она сможет намного более фантастические вещи. Ну по крайней мере этот подход выглядит самым перспективным на данный момент, не знаю других моделей которые могли бы быть настолько универсальны.
источник

AT

Arseny Tolmachev in Япония
по поводу того что "рисовать что угодно", это они просто натренировали такой же трансформер (в качестве "языковой модели") на картинках
источник

AT

Arseny Tolmachev in Япония
без текста
источник

PT

Philipp Trotsenko in Япония
нужен чат для нлп срочно
источник

AT

Arseny Tolmachev in Япония
имхо, универсальные модели нежизнеспособны, нужна куча специализированных, но связанных друг с другом
источник

f

fakana357 in Япония
Arseny Tolmachev
по поводу того что "рисовать что угодно", это они просто натренировали такой же трансформер (в качестве "языковой модели") на картинках
Ну понятно, но она ж с этой системой научилась додумывать картинки умнее любой другой сети которая создавалась для картинок. Надо ебашить её на все остальные задачи и смотреть что сможет. А потом потенциально можно будет связывать несколько трансформеров между собой воедино, зрение/слух/понимание речи, и появится та самая модальность)
источник

PT

Philipp Trotsenko in Япония
модальный глагол
источник

AT

Arseny Tolmachev in Япония
fakana357
Ну понятно, но она ж с этой системой научилась додумывать картинки умнее любой другой сети которая создавалась для картинок. Надо ебашить её на все остальные задачи и смотреть что сможет. А потом потенциально можно будет связывать несколько трансформеров между собой воедино, зрение/слух/понимание речи, и появится та самая модальность)
трасформер хорошая модель, да, я тоже ими пользуюсь, их можно рассматривать как умные конволюции, которые могут учить форму фильтров вместо кучи 3x3 как в картико-моделях
источник

AT

Arseny Tolmachev in Япония
fakana357
Ну понятно, но она ж с этой системой научилась додумывать картинки умнее любой другой сети которая создавалась для картинок. Надо ебашить её на все остальные задачи и смотреть что сможет. А потом потенциально можно будет связывать несколько трансформеров между собой воедино, зрение/слух/понимание речи, и появится та самая модальность)
проблема в AI в связывании "знаний" с реальным миром, что очень сложно
источник

AT

Arseny Tolmachev in Япония
даже эти "знания" вытаскивать очень сложно
источник

f

fakana357 in Япония
В каком плане?)
источник

PT

Philipp Trotsenko in Япония
до чего боты умные пошли
источник