Телеграмм чат группы natural_language

Всем привет) Я сейчас занимаюсь созданием qa-бота. Есть датасет с ~300к пар вопросов и ответов. Данные достаточно чистые. Пробую использовать модель transformer, однако бот при тесте просто выдаёт набор несвязанных слов. Хотел бы попросить совета, в каком направлении двигаться, чтобы улучшить модель, где искать информацию по этой теме?

Посмотрите тут последние несколько слайдов про Grammatical Generation http://aigents.com/papers/2020/InterpretableLanguageProcessing2020.pdf и если интересно то гляньте гитхаб по ссылкам. Мы эту задачу решаем для английского, ищем свободные руки и горящие глаза (MIT-license) для расширения предложенного подхода для русского 😉

источник

06:38пожаловаться #4

Anton Kolonin in Natural Language Processing

Anton Kolonin

https://github.com/aigents/aigents-java/issues/22

GitHub

Natural language production based on formal grammar · Issue #22 · aigents/aigents-java

Overview: In the end, ideally, we want the natural language text to be produced in a quality higher than provided by modern conversational intelligence chatbots (such as https://replika.ai/ ) howev...

источник

06:40пожаловаться #5

Anton Kolonin in Natural Language Processing

Anton Kolonin

Доклад по этим слайдам: https://www.youtube.com/watch?v=FzKMtNILmDk

YouTube

Interpretable Natural Language Processing - by Anton Kolonin

Interpretable Natural Language Processing (INLP) - lecture presented by Anton Kolonin, describing the importance of Explainable and Interpretable Natural Language Processing (NLP) along with solutions for building explainable linguistic models relying on Aigents Deep Patterns as well as OpenCog Link Grammar technologies, and applications for interpretable sentiment analysis, text classification, fact extraction, and entity attribution.

источник

06:41пожаловаться #6

Anton Kolonin in Natural Language Processing

Переслано от Anton Kolonin

Screen Shot 2020-10-11 at 23.45.58.png

(1.91 Мб)

НА ЭТОЙ НЕДЕЛЕ НА СЕМИНАРЕ 15 ОКТЯБРЯ Я БУДУ ГОВОРИТЬ "О ЯЗЫКАХ И СТРУКТУРАХ ДАННЫХ ДЛЯ ОБЩЕГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА"
https://aigents.timepad.ru/event/1412596/
отталкиваясь от предыдущих докладов Алексей Редозубов Сергей Шумский Mykola Rabchevskiy Evgenii Vityaev Aleksandr Panov Alexey Egorov Dmitriy Salikhov и частично отвечая на возникшие в их процессе вопросы, включая аспекты терминологии и когнитивных архитектур.
http://aigents.com/papers/2020/Data-Structures-2020-en.pdf
Слайды выкладываю заранее с тем, чтобы можно было заранее задать вопросы и сделать устный доклад более содержательным для аудитории (продолжаем эксперименты с формами).

источник

06:50пожаловаться #7

Oleg Radchenko in Natural Language Processing

всем привет! ищем консультанта на проект, связанный с НЛП (распознавание и классификация пользовательских фраз) для русского языка. детали в ЛС.

источник

14:17пожаловаться #8

➔m

➔◾ maria myznikova... in Natural Language Processing

Всем привет!

Можно ли как-то для repeatable-атрибута у факта в yargy доопределить нормализацию или custom()? Не могу найти пример в примерах, буду очень рада, если кто-то подскажет, как это можно сделать.

Я исхожу из предположения, что из строки “штука 1, 2, 3” не получится сделать инстансы факта штука вида “штука: 1” “штука: 2”, “штука: 3” — точнее, в таком случае придется полностью захватить парсинг простых интов, исключая для них возможность попасть в другой факт.

Поэтому нужен attribute(‘штука’).repeatable(). И для него хочется всякие normalized и custom.

Спасибо заранее за ответ.

источник

16:01пожаловаться #9

2020 October 13

Sankha Subhra in Natural Language Processing

Please see my contribution in kaggle data sets.

If you found this datasets are helpful to the community please encourage me by upvoting it in kaggle.
And give your valuable suggestions in the comment section.
1. IMBD top Movies --> For movie recommendation system ->
https://www.kaggle.com/sankha1998/tmdb-top-10000-popular-movies-dataset

2. Students' performance in semester exam--> For advance regression solution->
https://www.kaggle.com/sankha1998/student-semester-result

3. Whatsapp Status data --> for NLP based Solution ->
https://www.kaggle.com/sankha1998/emotion

Kaggle

Popular Movies of IMDb

Build Movie Recommender System

источник

00:07пожаловаться #10

Bogdan Salyp in Natural Language Processing

Ахахах набор рейтинга на кегле, впервые вижу такое
Хотя если так подумать, имеет смысл

источник

11:32пожаловаться #11

Alexey Lemeshevski in Natural Language Processing

На конгрессе ИИ сейчас будет секция по автоматической обработке текста)

источник

15:05пожаловаться #12

Alexey Lemeshevski in Natural Language Processing

https://us02web.zoom.us/j/88369596658?pwd=NnkrcU1sSVBmLzZKSzRiUUg0TkpKQT09

Zoom Video

Join our Cloud HD Video Meeting

Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution used around the world in board, conference, huddle, and training rooms, as well as executive offices and classrooms. Founded in 2011, Zoom helps businesses and organizations bring their teams together in a frictionless environment to get more done. Zoom is a publicly traded company headquartered in San Jose, CA.

источник

15:06пожаловаться #13

Yuri Baburov in Natural Language Processing

Alexey Lemeshevski

На конгрессе ИИ сейчас будет секция по автоматической обработке текста)

там мало чего интересного, но можно поискать:
https://easychair.org/smart-program/CAICS2020/2020-10-13.html#session:48503

источник

15:06пожаловаться #14

Oleg Radchenko in Natural Language Processing

Alexey Lemeshevski

На конгрессе ИИ сейчас будет секция по автоматической обработке текста)

а есть ссылка на вторую часть?

источник

17:28пожаловаться #15

Oleg Radchenko in Natural Language Processing

а,там же

источник

17:29пожаловаться #16

ДС

Дмитрий Симаков... in Natural Language Processing

Не нашёл правила. Но может быть интересно чату.

источник

17:36пожаловаться #17

Yuri Baburov in Natural Language Processing

Oleg Radchenko

а есть ссылка на вторую часть?

вся программа конференции тут: https://caics.ru/ , там кроме общей программы есть и ссылки на эти подсекции.

caics.ru

CAICS-2020

I Национальный конгресс по когнитивным исследованиям, искусственному интеллекту и нейроинформатике

источник

18:04пожаловаться #18

Oleg Radchenko in Natural Language Processing

Yuri Baburov

вся программа конференции тут: https://caics.ru/ , там кроме общей программы есть и ссылки на эти подсекции.

caics.ru

CAICS-2020

I Национальный конгресс по когнитивным исследованиям, искусственному интеллекту и нейроинформатике

спасибо, Юрий

источник

18:06пожаловаться #19

2020 October 14

Daniil Minkov in Natural Language Processing

Коллеги, доброй ночи! Чем черт не шутит)

Ищем ребят, продукты, команды, у кого получилось создать модели, позволяющие генерить контент по заданным ключевым словам, тематикам (даже если пока плохого качества, задача - понять, что технически реализовать можно вообще). Буду рад пообщаться. У нас своя "яндекс.толока для копирайтеров", прям нужна помощь очень сильно)

источник

00:54пожаловаться #20