Size: a a a

Natural Language Processing

2021 February 24

KK

Kira Kirillova in Natural Language Processing
Sergey Shulga
Жаль, под виндой не взлетает
Винда — это печалька(
источник

TT

Timofey Tarusov in Natural Language Processing
Sergey Shulga
Жаль, под виндой не взлетает
Так можно с WSL же, нет?
источник

SS

Sergey Shulga in Natural Language Processing
Kira Kirillova
Винда — это печалька(
Ну так то все под убунтой, а вот с этой либой надо было локальную презу сделать руководству. В общем много чего я попробовал, даже умудрился fasrBPE сбилдить и установить
источник

SS

Sergey Shulga in Natural Language Processing
И затем fairseq, но фиг, все падает на torch.hab... не компилится нормально сам faiseq под окна
источник

M

Mark in Natural Language Processing
Ну для этого только докер
источник

CT

Cookie Thief in Natural Language Processing
Natalia
у меня такой вопросик, даже скорее просьба: посоветуйте, пожалуйста, наиболее вменяемые и внятные тьюториалы по тренировке собственных моделей машинного перевода (типа чем доступнее, тем лучше)

интересно ваше мнение
Как писали выше, fairseq очень даже ок, только доки у них хреновые)
opennmt норм, не совсем привычно, но работать можно, плюс с виндой вроде как проблем нет. У 🤗, имхо, seq2seq в целом так себе реализован, но можно попробовать
источник

SS

Sergey Shulga in Natural Language Processing
Timofey Tarusov
Так можно с WSL же, нет?
Ну так то проще вторую ос заиметь полноценную
источник

OS

Oleg Serikov in Natural Language Processing
Sergey Shulga
Ну так то проще вторую ос заиметь полноценную
а чем именно проще?
источник

AP

Alex Peresmeshnik in Natural Language Processing
Sergey Shulga
Ну так то все под убунтой, а вот с этой либой надо было локальную презу сделать руководству. В общем много чего я попробовал, даже умудрился fasrBPE сбилдить и установить
Сделай на ноутбуке презентацию под нормальной ОС. В чем проблема то? Винду выкинь на помойку, не годится.
источник

SS

Sergey Shulga in Natural Language Processing
@yuri_baburov какой-то глюк, или под спейси 3.0.3 нет модели русского? python -m spacy download ru_core_news_lg выдает отсутствие
источник

SS

Sergey Shulga in Natural Language Processing
хотя точно помню, что было
источник

AC

Alexander C in Natural Language Processing
Cорри, за возможный оффтоп,  но вдруг кто знает или забавным найдет вопросик.
Вот слова - адрес , арест - вопрос одного ли они просхождения ?
Если смотреть виктионари, то
Из нем. Arrest, далее из  лат. arrestum < лат. adrestum «задержка,остановка» далее из adresto «задерживаю,останавливаю» от resto «остаюсь,сохраняюсь»

Видим adresto - то есть явное сходство с АДРЕС и по смыслу - арест = остановка - адрес -то где остановился.
То есть - вероятно - одно и то же.

Но если смотреть то же виктионари -
Из русск. адрес, далее из франц. adresse, далее из франц. adresser «адресовать», далее из франц. dresser «устанавливать, воздвигать», далее из лат. *directiare «устанавливать, поднимать», далее из лат. directus «прямой», от лат. dirigere «направлять», далее из лат. regere «править, направлять», восходит к праиндоевр. *(o)reg' «выпрямлять, направлять».

Другая линия - прописывается - но, мне кажется, это ошибочно
источник

YB

Yuri Baburov in Natural Language Processing
Alexander C
Cорри, за возможный оффтоп,  но вдруг кто знает или забавным найдет вопросик.
Вот слова - адрес , арест - вопрос одного ли они просхождения ?
Если смотреть виктионари, то
Из нем. Arrest, далее из  лат. arrestum < лат. adrestum «задержка,остановка» далее из adresto «задерживаю,останавливаю» от resto «остаюсь,сохраняюсь»

Видим adresto - то есть явное сходство с АДРЕС и по смыслу - арест = остановка - адрес -то где остановился.
То есть - вероятно - одно и то же.

Но если смотреть то же виктионари -
Из русск. адрес, далее из франц. adresse, далее из франц. adresser «адресовать», далее из франц. dresser «устанавливать, воздвигать», далее из лат. *directiare «устанавливать, поднимать», далее из лат. directus «прямой», от лат. dirigere «направлять», далее из лат. regere «править, направлять», восходит к праиндоевр. *(o)reg' «выпрямлять, направлять».

Другая линия - прописывается - но, мне кажется, это ошибочно
этимология очень сложная наука, очень часто (и даже, как правило) похожие на слух слова образуются совершенно разными путями, и эти пути очень редко бывают очевидными.
источник

AC

Alexander C in Natural Language Processing
Yuri Baburov
этимология очень сложная наука, очень часто (и даже, как правило) похожие на слух слова образуются совершенно разными путями, и эти пути очень редко бывают очевидными.
ну например ? Есть вариант - французское кафе Бистро и русское быстро. Гипотеза одного происхождения вроде отвергается на той же вики.
источник

YB

Yuri Baburov in Natural Language Processing
Alexander C
ну например ? Есть вариант - французское кафе Бистро и русское быстро. Гипотеза одного происхождения вроде отвергается на той же вики.
эти два слова могут происходить от одного корня, но нерусского. потому что насколько я помню неверно "быстро -> бистро", и неверно "бистро -> быстро".
источник

AC

Alexander C in Natural Language Processing
Не, ну одна из версий - русские казаки занесли в Париж в 1812 году - забегали в кафешки и говорили быстро-быстро быстро ленивым французам. Но критика, в том , что слово стало часто использоваться во Франции  сильно позже .
https://ru.wikipedia.org/wiki/%D0%91%D0%B8%D1%81%D1%82%D1%80%D0%BE
источник

YB

Yuri Baburov in Natural Language Processing
Alexander C
Не, ну одна из версий - русские казаки занесли в Париж в 1812 году - забегали в кафешки и говорили быстро-быстро быстро ленивым французам. Но критика, в том , что слово стало часто использоваться во Франции  сильно позже .
https://ru.wikipedia.org/wiki/%D0%91%D0%B8%D1%81%D1%82%D1%80%D0%BE
https://rus.stackexchange.com/questions/429281/Этимология-слова-бистро
так что не могут от общего корня происходить тоже (т.е. вообще версия славянского происхождения "бистро" отвергается)
источник

AC

Alexander C in Natural Language Processing
А есть какие-ть нлп подходы и желательно ноутбуки с анализом сходства языков - так чтоб можно было самому поиграться ?  Ну например - восстановить цепочку типа арест - Из нем. Arrest, далее из  лат. arrestum < лат. adrestum «задержка,остановка» далее из adresto «задерживаю,останавливаю» от resto «остаюсь,сохраняюсь»
источник

NC

Nikolay Chudinov in Natural Language Processing
Пытаюсь изобрести велик...
на вход - текст страницы (по сути ключевое слово)
на выходе - список релевантных ключевых слов, якобы которым должен этот текст соответствовать, но получается так себе

Пример:
Базовое ключевое слово:  зарядное устройство для bmw купить
Найдено, 10 вариантов
- купить зарядное устройство для
- зарядное устройство бош купить
- портативные зарядные устройства купить
- купить сетевое зарядное устройство
- фонарик аккумуляторный светодиодный с зарядным устройством купить
- зарядное устройство для авто купить
- какое купить зарядное устройство для автомобильного аккумулятора
- зарядное устройство для шуруповерта 12 вольт купить
- зарядное устройство для автомобиля купить в москве
- пуско зарядное устройство купить в москве

Подскажите, в какую сторону копнуть?
p.s. без апи внешних сервисов
источник

SP

Sebastian Pereira in Natural Language Processing
Alexander C
А есть какие-ть нлп подходы и желательно ноутбуки с анализом сходства языков - так чтоб можно было самому поиграться ?  Ну например - восстановить цепочку типа арест - Из нем. Arrest, далее из  лат. arrestum < лат. adrestum «задержка,остановка» далее из adresto «задерживаю,останавливаю» от resto «остаюсь,сохраняюсь»
Для английского лингвистический дрейф в индоевропейском просчитывали математически - кибуц Стидмана работы
источник