Size: a a a

Natural Language Processing

2020 October 11

L

Lalashka in Natural Language Processing
Nikolay V. Shmyrev
Сначала рассказать о текущей модели подробно - код показать, какая библиотека используется, размер модели и так далее.
Вот код: https://github.com/konradmaklaud20/qa-chatbot/blob/main/qa-chatbot_v1.py
Использую tensorflow, количество параметров модели - 81млн
источник

KL

Kir L in Natural Language Processing
если есть пары вопрос ответ, не проще ли использовать retrieval подход? просто искать ближайший вопрос, возвращать парный ему ответ
источник
2020 October 12

NS

Nikolay V. Shmyrev in Natural Language Processing
Трансформер с нуля что-ли тренируется? на 300 тыс пар 80 млн параметров?
источник

AK

Anton Kolonin in Natural Language Processing
Lalashka
Всем привет) Я сейчас занимаюсь созданием qa-бота. Есть датасет с ~300к пар вопросов и ответов. Данные достаточно чистые. Пробую использовать модель transformer, однако бот при тесте просто выдаёт набор несвязанных слов. Хотел бы попросить совета, в каком направлении двигаться, чтобы улучшить модель, где искать информацию по этой теме?
Посмотрите тут последние несколько слайдов про Grammatical Generation http://aigents.com/papers/2020/InterpretableLanguageProcessing2020.pdf и если интересно то гляньте гитхаб по ссылкам. Мы эту задачу решаем для английского, ищем свободные руки и горящие глаза (MIT-license) для расширения предложенного подхода для русского 😉
источник

AK

Anton Kolonin in Natural Language Processing
Anton Kolonin
Посмотрите тут последние несколько слайдов про Grammatical Generation http://aigents.com/papers/2020/InterpretableLanguageProcessing2020.pdf и если интересно то гляньте гитхаб по ссылкам. Мы эту задачу решаем для английского, ищем свободные руки и горящие глаза (MIT-license) для расширения предложенного подхода для русского 😉
источник

AK

Anton Kolonin in Natural Language Processing
Anton Kolonin
Посмотрите тут последние несколько слайдов про Grammatical Generation http://aigents.com/papers/2020/InterpretableLanguageProcessing2020.pdf и если интересно то гляньте гитхаб по ссылкам. Мы эту задачу решаем для английского, ищем свободные руки и горящие глаза (MIT-license) для расширения предложенного подхода для русского 😉
Доклад по этим слайдам: https://www.youtube.com/watch?v=FzKMtNILmDk
источник

AK

Anton Kolonin in Natural Language Processing
Переслано от Anton Kolonin
НА ЭТОЙ НЕДЕЛЕ НА СЕМИНАРЕ 15 ОКТЯБРЯ Я БУДУ ГОВОРИТЬ "О ЯЗЫКАХ И СТРУКТУРАХ ДАННЫХ ДЛЯ ОБЩЕГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА"
https://aigents.timepad.ru/event/1412596/
отталкиваясь от предыдущих докладов Алексей Редозубов Сергей Шумский Mykola Rabchevskiy Evgenii Vityaev Aleksandr Panov Alexey Egorov Dmitriy Salikhov и частично отвечая на возникшие в их процессе вопросы, включая аспекты терминологии и когнитивных архитектур.
http://aigents.com/papers/2020/Data-Structures-2020-en.pdf
Слайды выкладываю заранее с тем, чтобы можно было заранее задать вопросы и сделать устный доклад более содержательным для аудитории (продолжаем эксперименты с формами).
источник

OR

Oleg Radchenko in Natural Language Processing
всем привет! ищем консультанта на проект, связанный с НЛП (распознавание и классификация пользовательских фраз) для русского языка. детали в ЛС.
источник

➔m

➔◾ maria myznikova... in Natural Language Processing
Всем привет!

Можно ли как-то для repeatable-атрибута у факта в yargy доопределить нормализацию или custom()? Не могу найти пример в примерах, буду очень рада, если кто-то подскажет, как это можно сделать.

Я исхожу из предположения, что из строки “штука 1, 2, 3” не получится сделать инстансы факта штука вида “штука: 1” “штука: 2”, “штука: 3” — точнее, в таком случае придется полностью захватить парсинг простых интов, исключая для них возможность попасть в другой факт.

Поэтому нужен attribute(‘штука’).repeatable(). И для него хочется всякие normalized и custom.

Спасибо заранее за ответ.
источник
2020 October 13

S

Sankha Subhra in Natural Language Processing
Please see my contribution in kaggle data sets.

If you found this datasets are helpful to the community please encourage me by upvoting it in kaggle.
And give your valuable suggestions in the comment section.
1. IMBD top Movies --> For movie recommendation system ->
https://www.kaggle.com/sankha1998/tmdb-top-10000-popular-movies-dataset

2. Students' performance in semester exam--> For advance regression solution->
https://www.kaggle.com/sankha1998/student-semester-result

3. Whatsapp Status data --> for NLP based Solution ->
https://www.kaggle.com/sankha1998/emotion
источник

BS

Bogdan Salyp in Natural Language Processing
Ахахах набор рейтинга на кегле, впервые вижу такое
Хотя если так подумать, имеет смысл
источник

AL

Alexey Lemeshevski in Natural Language Processing
На конгрессе ИИ сейчас будет секция по автоматической обработке текста)
источник

AL

Alexey Lemeshevski in Natural Language Processing
источник

YB

Yuri Baburov in Natural Language Processing
Alexey Lemeshevski
На конгрессе ИИ сейчас будет секция по автоматической обработке текста)
там мало чего интересного, но можно поискать:
https://easychair.org/smart-program/CAICS2020/2020-10-13.html#session:48503
источник

OR

Oleg Radchenko in Natural Language Processing
Alexey Lemeshevski
На конгрессе ИИ сейчас будет секция по автоматической обработке текста)
а есть ссылка на вторую часть?
источник

OR

Oleg Radchenko in Natural Language Processing
а,там же
источник

ДС

Дмитрий Симаков... in Natural Language Processing
Не нашёл правила. Но может быть интересно чату.
источник

YB

Yuri Baburov in Natural Language Processing
Oleg Radchenko
а есть ссылка на вторую часть?
вся программа конференции тут: https://caics.ru/ , там кроме общей программы есть и ссылки на эти подсекции.
источник

OR

Oleg Radchenko in Natural Language Processing
Yuri Baburov
вся программа конференции тут: https://caics.ru/ , там кроме общей программы есть и ссылки на эти подсекции.
спасибо, Юрий
источник
2020 October 14

DM

Daniil Minkov in Natural Language Processing
Коллеги, доброй ночи!  Чем черт не шутит)

Ищем ребят, продукты, команды, у кого получилось создать модели, позволяющие генерить  контент по заданным ключевым словам, тематикам (даже если пока плохого качества, задача -  понять, что технически реализовать можно вообще). Буду рад пообщаться. У нас своя "яндекс.толока для копирайтеров", прям нужна помощь очень сильно)
источник