Size: a a a

Natural Language Processing

2021 June 09

A

Alexander in Natural Language Processing
Благодарю 🙏
источник

D

Dmitriy in Natural Language Processing
Подскажите плз
   Замена  tesseart , что бы можно было таблицы распознавать
источник
2021 June 10

SS

Sergey Sikorskiy in Natural Language Processing
Вопрос к лингвистам: в глаголах “ть” и “ти” это суффиксы или глагольные окончания?
В wiktionary всегда пишут, что это глагольные окончания.
В wikipedia нагло утверждают, что это - суффиксы.
В самостоятельных кем-то размеченных словарях Тихонова в интернете это - суффиксы.
Так что же это на самом деле?
TIA
источник

N

Natalia in Natural Language Processing
да нет ответа на этот вопрос, потому что банально даже а какая разница
источник

N

Natalia in Natural Language Processing
в тех же агглютинативных языках тупо принято всё считать суффиксами, и всем нормально
источник

N

Natalia in Natural Language Processing
это просто наш европеоцентризм, да ещё с зацикливанием на конце слова, и вообще это придуманные категории, ну не зацикливайтесь вы на этом так, а
источник

N

Natalia in Natural Language Processing
главное противопоставление — корень и всё, где выражаются грамматические значения внутри слова (что-то изменяющееся), — флексия
источник

N

Natalia in Natural Language Processing
в куче языков (в т.ч. языков России) грамматические значения выражаются в префиксах
источник

N

Natalia in Natural Language Processing
вот хороший пост Аси Перельцвайг, крутой лингвистки с российскими корнями (т.е. она в курсе этой школьной одержимости всё интерпретировать однозначно): https://www.languagesoftheworld.info/morphology/suffix-or-ending-clarifying-the-terminology.html#:~:text=According%20to%20the%20textbook%20definitions,grammatical%20meanings%3A%20number%2C%20gender%2C
источник

A

Andrey in Natural Language Processing
в неопределённой форме глагола суффикс, иначе окончание))

прийти - суффикс. осмотреть
источник

Н

Настя Обрезкова... in Natural Language Processing
Привет! А кто-то обучал SpaCy синтаксису? Если да, можно увидеть примеры, пожалуйста?)
источник

SM

Syuzanna Martirosyan in Natural Language Processing
привет!
подскажите, пожалуйста,
вот pooled_output у берта же нужен, чтобы получать эмбеддинги текста в целом? а как получить эмбеддинги для токенов в отдельности?
источник

IG

Ilya Gusev in Natural Language Processing
не использовать пулинг?
источник

IG

Ilya Gusev in Natural Language Processing
ну то есть явно взять hidden_states последнего слоя
источник

IG

Ilya Gusev in Natural Language Processing
в transformers для этого нужно проставить в forward'е output_hidden_states=True и return_dict=True, и в output.hidden_states будут скрытые состояния всех слоёв
источник

SM

Syuzanna Martirosyan in Natural Language Processing
спасибо!
источник

p🌻

porridge 🌻 in Natural Language Processing
Всем привет! Подскажите пожалуйста полезные ссылки

Задача:
Рерайтинг текста на основе заданных параметров о человеке, под которого этот текст переписывается  (пример параметров: возраст, пол, наличие/отсутствие высшего образования и т.д.)

Языки ввода:
Английский, немецкий

Суть вопроса:
Какие способы реализации и исследования по данной теме существуют, какие модели, алгоритмы и датасеты при этом используются
Заранее благодарю :)
источник

v

viktor in Natural Language Processing
а какую бы вы выбрали модель для fine-tuning классификации русских новостных статей (в основном тексты имееют от 1к до 5к символов)?
очень жирные не подходят, тк скорость важна
источник

E

Elena in Natural Language Processing
любой трансформер, который есть для вашего языка и входит в вашу GPU
источник

v

viktor in Natural Language Processing
ага, но их много. хотелось бы послушать мб кто-то решал похожую задачу и услышать что им зашло
источник