Size: a a a

Natural Language Processing

2021 September 09

AK

Anton Kolonin in Natural Language Processing
Продолжение на семинаре через два часа, подробности - в группе @agirussia
источник

AK

Anton Kolonin in Natural Language Processing
Нужен ли NLP для AGI и есть ли AGI в GPT-3? Может ли NLP уровня HLAI быть индикатором или критерием AGI? Чего GPT-3 не хватает для NLP уровня HLAI и/или AGI? — Татьяна Шаврина, Татьяна Ландо, Николай Рабчевский, Виктор Носко (модератор Игорь Пивоваров)
https://aigents.timepad.ru/event/1412596/
9 сентября 18:00-20:30 (время Московское)
источник

B

Banof in Natural Language Processing
🔫 Trivikram M кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @alexgambashidze, @Nikitini, @danilamilo, @MashPo, @slava_73
При поддержке Золота Бородача
источник

SK

Sergey Kamenshchikov in Natural Language Processing
Привет :) NLP стартап ищет кофаундера с более чем 2-летним опытом работы в NLP / ML. MVP, бережливая культура, отличная команда и первые клиенты. Входим в акселератор Португалии с перспективой переезда. Мы ищем тех, кто увлечен генерацией текстов. Пишите пожалуйста в личку, если интересно :)
источник

OS

Oleg Serikov in Natural Language Processing
Привет! А где сейчас актуальный варик spacy для русского языка?
у @yuri_baburov (https://github.com/buriy/spacy-ru/) или у @alexkuk (https://github.com/natasha/natasha-spacy)
источник

YB

Yuri Baburov in Natural Language Processing
если тебе нужен 3.0 / 3.1, то natasha-spacy, если 2.3, то spacy-ru
источник

OS

Oleg Serikov in Natural Language Processing
А на что лучше ссылаться?)
источник

OS

Oleg Serikov in Natural Language Processing
в бенчмарке
источник

YB

Yuri Baburov in Natural Language Processing
для natasha-spacy просто ставь обычный spacy 3 и делай spacy download ru и всё.
Он в коробке: https://spacy.io/models/ru
Лицензия/инфа/прочее —
SOURCES
Nerus (Alexander Kukushkin)
Navec (Alexander Kukushkin)
источник

OS

Oleg Serikov in Natural Language Processing
Спасибо!
источник
2021 September 10

DV

Dmitry Valentsev in Natural Language Processing
Добрый день!

Подскажите, чем можно воспользоваться для классификации бухгалтерских наименований товаров, изобилующих сокращениями, артикулами, сверхкраткой записью?
Примеры:
1) ДТ-Л-К5 (3 ТРК)
Нужно отнести к классу "Дизельное топливо"
2) Камера УАЗ/Бычок R-16/225 шт
Нужно отнести к классу "Шины и диски"
3) 121547 Клей для плитки CERESIT Plus/PRO CM11 25кг (шт.)
Нужно отнести к классу "Строительные материалы"

Есть размеченный датасет для обучения.

Спасибо!
источник

A

Andrey in Natural Language Processing
rnn посимвольный может... хотя скорее всего ничего не зайдёт.
источник

DR

Dmitry Romanov in Natural Language Processing
Preferentum.Class
источник

A

Andrey in Natural Language Processing
зашел на сайт... ну мои глаза...
источник

DV

Dmitry Valentsev in Natural Language Processing
Дмитрий, спасибо. Я не уточнил - решение планируется создавать своими силами (например rnn, как предложил выше Андрей), - с нуля или на основе open source.
источник

МА

Максим Антонов... in Natural Language Processing
Привет. Я абсолютный нуб. Поигрался с word2vec на корпусе ruscorpora - там вроде +- понятно что происходит. Пытаюсь поиграть с ruGPT от Сбера. И естественно вообще ничего не понимаю.

Например вот этот первый блокнот. https://github.com/sberbank-ai/ru-gpts/blob/master/examples/Finetune_RuGPTs_with_HF.ipynb
В нем скачиваются файлы train.txt и valid.txt

В обучение передаются оба. Как валидируется модель по данным из файла valid - вообще непонятно. Если я захочу сделать файнтюнинг на своих данных - как готовить train и valid?

Есть где-то такая информация?
Может быть я рано полез в gpt ?  Тогда куда сначала?
источник

KV

Kirill V in Natural Language Processing
источник

МА

Максим Антонов... in Natural Language Processing
Ого. Спасибо. Как раз на степике проходил базовую статистику и введение в ML. Но на этот курс почему-то не наткнулся.
источник

GF

Grigory Frantsuzov in Natural Language Processing
начните с gpt3small от сбера, там очень понятная тетрадка
источник

GF

Grigory Frantsuzov in Natural Language Processing
и учится быстро
источник