Size: a a a

Natural Language Processing

2021 June 30

DS

Daria Samsonova in Natural Language Processing
пусть бы было как в более привычном варианте, вершина "в" ну и что, это все равно не позволило бы без нумерации токенов восстановить предложение, потому что как минимум возможны варианты: "ровно в десять часов", "в десять часов ровно" "ровно часов в десять" и тд
источник

EE

E E in Natural Language Processing
Не,  тут Смысл одинаковый
источник

EE

E E in Natural Language Processing
Автор говорит что порядок слов его не интересует,  пока сохраняется один смысл
источник

DS

Daria Samsonova in Natural Language Processing
ну так вам выше уже объяснили что под этим есть такая лингвистическая теория, что предлог - не совсем самостоятельное слово, а отдельно стоящая морфема (ака часть слова) и поэтому авторы не хотят ее выделять как вершину
источник

DS

Daria Samsonova in Natural Language Processing
ну так а если смысл разный, как в случае с "казнить нельзя помиловать" то там и деревья будут разные (в зависимости от запятой)
источник

DS

Daria Samsonova in Natural Language Processing
и абсолютно неважно, что у нас вершина предлог или существительное
источник

EE

E E in Natural Language Processing
Сорри, но вершина то все равно есть,  просто листовая.
источник

DS

Daria Samsonova in Natural Language Processing
ну да, я имела ввиду корневую вершину естественно
источник

SS

Sergey Sikorskiy in Natural Language Processing
Спасибо! Возможно, пропустил первое сообщение.
источник

EE

E E in Natural Language Processing
Корневая вершина в дерево единственная и это сказуемое. Сорри что придераюсь к словам, но давайте правильно использовать их) так чего же боялись авторы,  запрещая предлогу управлять?
источник

SS

Sergey Sikorskiy in Natural Language Processing
Кстати, да 🙂
источник

EE

E E in Natural Language Processing
@LoneGeek ну так есть контрпример чем такое дерево плохо?
источник

DS

Daria Samsonova in Natural Language Processing
никто ничего не боялся, просто как уже говорили выше UD пытались сделать универсальным, а в мире есть языки, в которых предлоги не будут писаться отдельно, вообще не будут хоть сколько-нибудь самостоятельным словом. Удобно считать, что предлог управляет предложной группой, если мы говорим про английский, где предлогом задается падеж (собственно управление), но в целом по больнице это не всегда так работает. Есть языки, где все это "точно в десять часов" - это вообще одно слово.
источник

SS

Sergey Sikorskiy in Natural Language Processing
Как будет выглядеть отрицание этой фразы? “Ровно в десять не часов”?
Т.е. я хочу ее трансформировать.
источник

SS

Sergey Sikorskiy in Natural Language Processing
корень - час.
источник

DS

Daria Samsonova in Natural Language Processing
то есть "ровно не в десять часов" вам больше нравится?
источник

DS

Daria Samsonova in Natural Language Processing
если корень будет предлогом
источник

SS

Sergey Sikorskiy in Natural Language Processing
Другой вариант - “не ровно в десять часов”.
Ну уж точно корень здесь не “час”.
источник

DS

Daria Samsonova in Natural Language Processing
почему?)
источник

DS

Daria Samsonova in Natural Language Processing
вот у Натальи был хороший контраргумент, если вам кажется, что "часов" здесь не корень
источник