Size: a a a

Natural Language Processing

2021 January 04

SZ

Sasha Zhu in Natural Language Processing
Друзья, а не подскажете, есть ли где-нибудь открытые корпусы русской речи?
источник

SZ

Sasha Zhu in Natural Language Processing
Именно речи, с транскрипциями
источник

ЕЗ

Евгений Зубов... in Natural Language Processing
Darina Dementyeva
мультиязычный NER от deeppavlov работает достаточно неплохо для многих языков
Круто, спасибо
источник

Eg

Elena gisly in Natural Language Processing
Sasha Zhu
Друзья, а не подскажете, есть ли где-нибудь открытые корпусы русской речи?
источник

SZ

Sasha Zhu in Natural Language Processing
Спасибо огромное!
источник
2021 January 05

Б

Баирто in Natural Language Processing
У кого нибудь была ошибка "No sentence features present. Not able to train sklearn policy" при обучении Rasa с space-ru
источник

SZ

Sasha Zhu in Natural Language Processing
Всем привет!
А скажите, есть тут кто-нибудь, кто работал с Яндекс спичкитом?

Я страдаю с документацией у них и не могу понять, то ли со мной что-то не то, то ли действительно не указан в документации требуемый параметр (и не имплементирован), и при этом ошибка выдается, чат по STT найти не могу отдельный(
источник

SK

Sasha Korovii in Natural Language Processing
Привет)
Кто работал с FAISS? Как узнать id  вектора который добавил в индекс, index.add(numpy_vector) возвращает None, а мне нужно узнать id который будет присвоен вектору.
источник

YB

Yuri Baburov in Natural Language Processing
Sasha Zhu
Всем привет!
А скажите, есть тут кто-нибудь, кто работал с Яндекс спичкитом?

Я страдаю с документацией у них и не могу понять, то ли со мной что-то не то, то ли действительно не указан в документации требуемый параметр (и не имплементирован), и при этом ошибка выдается, чат по STT найти не могу отдельный(
источник

SZ

Sasha Zhu in Natural Language Processing
Спасибо!
источник

FF

Futorio Franklin in Natural Language Processing
Sasha Korovii
Привет)
Кто работал с FAISS? Как узнать id  вектора который добавил в индекс, index.add(numpy_vector) возвращает None, а мне нужно узнать id который будет присвоен вектору.
Лучше добавлять явно id через IndexIDMap
источник

SK

Sasha Korovii in Natural Language Processing
Futorio Franklin
Лучше добавлять явно id через IndexIDMap
А можна пример для IndexIDMap?
источник

АК

Александр Короленя... in Natural Language Processing
Sasha Korovii
Привет)
Кто работал с FAISS? Как узнать id  вектора который добавил в индекс, index.add(numpy_vector) возвращает None, а мне нужно узнать id который будет присвоен вектору.
Если не ошибаюсь то первый вектор будет с id=0, второй с 1 и так далее
источник

FF

Futorio Franklin in Natural Language Processing
Sasha Korovii
А можна пример для IndexIDMap?
Как-то так
index2 = faiss.IndexIDMap(index)
index2.add_with_ids(M, i) где M это матрица векторов, а i это вектор айдишников
источник

SK

Sasha Korovii in Natural Language Processing
Futorio Franklin
Как-то так
index2 = faiss.IndexIDMap(index)
index2.add_with_ids(M, i) где M это матрица векторов, а i это вектор айдишников
Спасибо огромное
источник

FF

Futorio Franklin in Natural Language Processing
Sasha Korovii
Спасибо огромное
Айдишники должны быть интами
источник

A

Alexandr in Natural Language Processing
Подскажите, как подступиться к задаче. Есть описание фильма, и надо проставить тэги / жанры фильмов. На основании обучающей выборки конечно. Т .е. это multi label classification, но количество жанорлв варьируется от фильма к фильму
источник

IS

I Sh in Natural Language Processing
Alexandr
Подскажите, как подступиться к задаче. Есть описание фильма, и надо проставить тэги / жанры фильмов. На основании обучающей выборки конечно. Т .е. это multi label classification, но количество жанорлв варьируется от фильма к фильму
Сделайте бинарную метку:

Триллер: 0,
Мультфильм: 1,
Мелодрама: 2

Номера жанров будут индексы в метке, Если 1, то жанр с таким индексом имеется, если 0, то не имеется. И метка будет примерно такая:

[0, 1, 1, 0, 0, ..., 0]
источник

A

Alexandr in Natural Language Processing
I Sh
Сделайте бинарную метку:

Триллер: 0,
Мультфильм: 1,
Мелодрама: 2

Номера жанров будут индексы в метке, Если 1, то жанр с таким индексом имеется, если 0, то не имеется. И метка будет примерно такая:

[0, 1, 1, 0, 0, ..., 0]
Точно. Спасибо!
источник

AO

Alex Orgish in Natural Language Processing
источник