Телеграмм чат группы natural_language_processing страница 73

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1279 membersпожаловаться на группу

1
«
…
‹
68
69
70
71
72
73
74
›
…
»

2018 April 24

D

Dmitry in Natural Language Processing

Ага, совсем не deep )

источник

00:40пожаловаться #1

t2

tonko 22 in Natural Language Processing

А я вот с фасттекстом экспериментирую, крутая модель. Правда пришлось свои эмбеддинги для документов пилить - 4 часа изучал исходники генсима. Весьма трудоемко, учитывая все их deprecated классы.

источник

00:43пожаловаться #2

TY

Timofey Yefimov in Natural Language Processing

А я вот с фасттекстом экспериментирую, крутая модель. Правда пришлось свои эмбеддинги для документов пилить - 4 часа изучал исходники генсима. Весьма трудоемко, учитывая все их deprecated классы.

Свои эмбеддинги?

источник

01:06пожаловаться #3

TY

Timofey Yefimov in Natural Language Processing

Обучать пришлось в смысле?

источник

01:06пожаловаться #4

TY

Timofey Yefimov in Natural Language Processing

Зачем 4 часа изучать, можно было просто спросить)

источник

01:08пожаловаться #5

TY

Timofey Yefimov in Natural Language Processing

В документации что-то непонятно?

https://radimrehurek.com/gensim/models/fasttext.html#module-gensim.models.fasttext

gensim: topic modelling for humans

Efficient topic modelling in Python

источник

01:14пожаловаться #6

t2

tonko 22 in Natural Language Processing

Timofey Yefimov

Зачем 4 часа изучать, можно было просто спросить)

Выбирал наиболее подходящий класс для создания помещения своих док-эмбеддингов)

источник

09:46пожаловаться #7

TY

Timofey Yefimov in Natural Language Processing

Так он же там один для фасттекста

источник

09:46пожаловаться #8

t2

tonko 22 in Natural Language Processing

В фасттексте у меня ворд-левел, док левел я засунул в WordEmbeddingsKeyedVectors

источник

09:47пожаловаться #9

t2

tonko 22 in Natural Language Processing

Там как раз есть методы add, most_similar, в общем все что надо

источник

09:47пожаловаться #10

TY

Timofey Yefimov in Natural Language Processing

У фасттекста тоже это есть

источник

09:47пожаловаться #11

TY

Timofey Yefimov in Natural Language Processing

Через .wv

источник

09:48пожаловаться #12

t2

tonko 22 in Natural Language Processing

В фасттексте проблема в том что сложно добавить новую сущность, например документа, потому что все численные айдишники он генерирует по нграммам

источник

09:48пожаловаться #13

t2

tonko 22 in Natural Language Processing

Я 15 минут пытался придумать какой-то уникальный хэш, который он бы не разбирал на нграммы и решил что проще взять другой класс

источник

09:49пожаловаться #14

t2

tonko 22 in Natural Language Processing

В итоге у меня класс-композиция из gensim.models.fasttext и WordEmbeddingsKeyedVectors

источник

09:50пожаловаться #15

t2

tonko 22 in Natural Language Processing

Пока обучаю-оптимизирую параметры. В проде останется только док-уровень.

источник

09:51пожаловаться #16

AF

Alexander Fedorenko in Natural Language Processing

not so deep, actually, внутри даже нейронки нет

Господа, вы уверены, в том, что доктор наук Радим, автор библиотеки Gensim будет обманывать?! Не надо в след раз торопиться с выводами, особенно если они неверны. Предлагаю ознакомиться со след. материалом: Bases: gensim.models.base_any2vec.BaseWordEmbeddingsModel

Class for training, using and evaluating neural networks described in http://arxiv.org/pdf/1405.4053v2.pdf

источник

10:52пожаловаться #17

AF

Alexander Fedorenko in Natural Language Processing

Кстати Tomas Mikolov его друг. Надеюсь вы знаете кто это)

источник

10:52пожаловаться #18

t2

tonko 22 in Natural Language Processing

То что предложил Миколов и то что реализовал Радим, это разные вещи. Радим оптимизировал код Томаша, изначально написанный на С, кстати, с ошибками. Если у Томаша и была нейронка, то это простой Autoencoder, который нельзя назвать deep. Радим, в целях максимальной оптимизации убрал какие-либо нейросетевые архитектуры и свел задачу отпимизации к простому алгоритму, напрямую уменьшающую косинусную близость исходные векторов слов исходя из их совместной встречаемости. Об этом, кстати, рассказывал Лев Константиновский, бывший представитель gensim в России, в своих презентациях Gensim.

источник

11:03пожаловаться #19

D

Dmitry in Natural Language Processing

Alexander Fedorenko

Господа, вы уверены, в том, что доктор наук Радим, автор библиотеки Gensim будет обманывать?! Не надо в след раз торопиться с выводами, особенно если они неверны. Предлагаю ознакомиться со след. материалом: Bases: gensim.models.base_any2vec.BaseWordEmbeddingsModel

Class for training, using and evaluating neural networks described in http://arxiv.org/pdf/1405.4053v2.pdf

Нейронка то есть, но никак не deep )

источник

11:03пожаловаться #20

1
«
…
‹
68
69
70
71
72
73
74
›
…
»