Size: a a a

Natural Language Processing

2021 June 30

A

Alaa in Natural Language Processing
Good morning everyone, may I ask you a question about how can I improve features in deep learning model?
источник

SS

Sergey Sikorskiy in Natural Language Processing
IMHO, более естественно звучит “не в десять часов ровно”.
Это немного меняет линеаризацию, но дерево остается прежним.
источник

SS

Sergey Sikorskiy in Natural Language Processing
"в десять часов" корень — “в”. “в” -> “десять” -> “часов”.  Предлог “в” с винительным падежом.
"к десяти часам" - IMHO, предлоги, требующие только дательного падежа - это особый случай. У них своя модель управления. Скорее всего, на эту тему уже написана не одна статья.
Это - моя гипотеза.
источник

N

Natalia in Natural Language Processing
о десяти часах
десятью часами
источник

N

Natalia in Natural Language Processing
но я-то, ясное дело, меньше вашего знаю о синтаксисе, что мне годы лингвистики в университете и опыта работы потом
источник

DS

Daria Samsonova in Natural Language Processing
IMHO у вас какой-то свой синтаксис с вашей собственной логикой и представлением о том, как вообще работает язык. То, что вы делаете, сродни народной этимологии, кажется, что очень логично и правильно, даже кажется, что выстраивается в систему, но это только кажется.
Синтаксис - это сложно, языки бывают очень разные, делать выводы о синтаксических явлениях по одному языку не получится. Статей на тему синтаксиса написано и правда немало и как и во многих других областях лингвистики учёные создали несколько интерпретаций происходящего, и несколько моделей формализации. Наталья верно уже подметила, что любая система формализации в принципе-то любого уровня языка - это попытка натянуть сову на глобус. С синтаксисом тем более, даже стройная теория Хомского хороша только для английского (да и там случаются несостыковки в логике), но если взять ее для чего-то не особо похожего на английский - она расхваливается на глазах и начинаются танцы с бубнами. UD просто посмотрели на язык чуть шире чем «у нас есть английский ну и хорошо ещё парочка европейских языков», понятно, что у них есть свои проблемы, но с управлением в конкретно этом случае все в порядке. И Наталья не просто так приводит вам контрпримеры из всей словоизменительной парадигмы, потому что никто не делает выводы и не строит гипотезы о целой системе на основании одного единственного примера.
источник

K

Ksenia in Natural Language Processing
Так смешно всегда, когда в лингвистике топают ногами и требуют, чтобы было «однозначно правильно»
источник

K

Ksenia in Natural Language Processing
Это то есть вообще полное непонимание того, что такое язык и как он работает
источник

DM

Dmitry M in Natural Language Processing
Всем привет! Подскажите, как понять, какие sentence-transformers модели работают с русским языком на https://huggingface.co/sentence-transformers ? Как получить список таких моделей?
источник

DD

David Dale in Natural Language Processing
Читать приложенные публикации, по-другому никак, ибо эти ребята почему-то тэги языков к своим моделям не ставят.
Но вообще я рекомендую LaBSE, она работает с русским и 100 другими языками, и супер крутая по качеству эмбеддингов без файнтюнинга.
источник

DM

Dmitry M in Natural Language Processing
Понятно, спасибо! Я подозревал такое, т.к. почитал метаданные к моделям - думал там, может, описано, но не нашел. Странно, конечно. Понятно, что есть "default language", но есть ведь и другие языки :)
источник

AL

Anton Lozhkov in Natural Language Processing
конкретно sentence-transformers для русского не обучали, поскольку ими занимается лаба с не сильно большим бюджетом, но можно поискать альтернативы https://huggingface.co/models?filter=ru
источник

DM

Dmitry M in Natural Language Processing
Спасибо, некоторые да, выносят связь с русским языком в названия или описания, но некоторые просто пишут, что модель поддерживает 15, 50, 100 языков и хотелось бы понять, кроме как читая связанные статьи или другие публикации можно ли быстро понять о каких языках идет речь.
источник

S

S.o.l. in Natural Language Processing
Много читала про базы знаний, типа Prolog, но никак не могу найти в сети наборы знаний описывающих базовые факты из реального мира, вроде Кошка ест мышей, Человек любит деньги и тому подобное. Такие базы вообще есть?
источник

SancheZz Мов in Natural Language Processing
Это вам для пролога нужно?
источник

SancheZz Мов in Natural Language Processing
Чтобы ручками не задавать логику предикатов?
источник

VM

Victor Maslov in Natural Language Processing
опасное это дело, факты про человека писать
источник

SancheZz Мов in Natural Language Processing
Prolog это правда не бд
источник

SancheZz Мов in Natural Language Processing
Это целый язык для логики предикатов)
источник

IK

Ilya Kalinin in Natural Language Processing
Это вы онтологии, наверное, имеете в виду?
источник