Телеграмм чат группы natural_language

Size: a a a

Natural Language Processing

2814 membersпожаловаться на группу

2021 June 09

Alexander in Natural Language Processing

Благодарю 🙏

источник

21:15пожаловаться #1

Dmitriy in Natural Language Processing

Подскажите плз
Замена tesseart , что бы можно было таблицы распознавать

источник

23:10пожаловаться #2

2021 June 10

Sergey Sikorskiy in Natural Language Processing

Вопрос к лингвистам: в глаголах “ть” и “ти” это суффиксы или глагольные окончания?
В wiktionary всегда пишут, что это глагольные окончания.
В wikipedia нагло утверждают, что это - суффиксы.
В самостоятельных кем-то размеченных словарях Тихонова в интернете это - суффиксы.
Так что же это на самом деле?
TIA

Wikipedia

Суффикс

морфема (часть слова), расположенная обычно после корня

источник

08:12пожаловаться #3

Natalia in Natural Language Processing

да нет ответа на этот вопрос, потому что банально даже а какая разница

источник

08:48пожаловаться #4

Natalia in Natural Language Processing

в тех же агглютинативных языках тупо принято всё считать суффиксами, и всем нормально

источник

08:48пожаловаться #5

Natalia in Natural Language Processing

это просто наш европеоцентризм, да ещё с зацикливанием на конце слова, и вообще это придуманные категории, ну не зацикливайтесь вы на этом так, а

источник

08:54пожаловаться #6

Natalia in Natural Language Processing

главное противопоставление — корень и всё, где выражаются грамматические значения внутри слова (что-то изменяющееся), — флексия

источник

08:55пожаловаться #7

Natalia in Natural Language Processing

в куче языков (в т.ч. языков России) грамматические значения выражаются в префиксах

источник

08:59пожаловаться #8

Natalia in Natural Language Processing

вот хороший пост Аси Перельцвайг, крутой лингвистки с российскими корнями (т.е. она в курсе этой школьной одержимости всё интерпретировать однозначно): https://www.languagesoftheworld.info/morphology/suffix-or-ending-clarifying-the-terminology.html#:~:text=According%20to%20the%20textbook%20definitions,grammatical%20meanings%3A%20number%2C%20gender%2C

Languages Of The World

“Suffix” or “Ending”—Clarifying the Terminology - Languages Of The World

A reader of my earlier post “Some Observations on Morphophonological Adaptation of English-derived Loanwords in Russian Slang” pointed out that my use of the term “suffix” for the plural marker in Russian is incorrect; the term “ending” should be used instead. Although I have already responded to the reader in private, I will also clarify […]

источник

09:03пожаловаться #9

Andrey in Natural Language Processing

в неопределённой форме глагола суффикс, иначе окончание))

прийти - суффикс. осмотреть

источник

09:03пожаловаться #10

Настя Обрезкова... in Natural Language Processing

Привет! А кто-то обучал SpaCy синтаксису? Если да, можно увидеть примеры, пожалуйста?)

источник

12:53пожаловаться #11

Syuzanna Martirosyan in Natural Language Processing

привет!
подскажите, пожалуйста,
вот pooled_output у берта же нужен, чтобы получать эмбеддинги текста в целом? а как получить эмбеддинги для токенов в отдельности?

источник

12:53пожаловаться #12

Ilya Gusev in Natural Language Processing

не использовать пулинг?

источник

12:56пожаловаться #13

Ilya Gusev in Natural Language Processing

ну то есть явно взять hidden_states последнего слоя

источник

12:56пожаловаться #14

Ilya Gusev in Natural Language Processing

в transformers для этого нужно проставить в forward'е output_hidden_states=True и return_dict=True, и в output.hidden_states будут скрытые состояния всех слоёв

источник

12:57пожаловаться #15

Syuzanna Martirosyan in Natural Language Processing

спасибо!

источник

13:10пожаловаться #16

p🌻

porridge 🌻 in Natural Language Processing

Всем привет! Подскажите пожалуйста полезные ссылки

Задача:
Рерайтинг текста на основе заданных параметров о человеке, под которого этот текст переписывается (пример параметров: возраст, пол, наличие/отсутствие высшего образования и т.д.)

Языки ввода:
Английский, немецкий

Суть вопроса:
Какие способы реализации и исследования по данной теме существуют, какие модели, алгоритмы и датасеты при этом используются
Заранее благодарю :)

источник

14:05пожаловаться #17

viktor in Natural Language Processing

а какую бы вы выбрали модель для fine-tuning классификации русских новостных статей (в основном тексты имееют от 1к до 5к символов)?
очень жирные не подходят, тк скорость важна

источник

14:13пожаловаться #18

Elena in Natural Language Processing

любой трансформер, который есть для вашего языка и входит в вашу GPU

источник

14:14пожаловаться #19

viktor in Natural Language Processing

ага, но их много. хотелось бы послушать мб кто-то решал похожую задачу и услышать что им зашло

источник

14:16пожаловаться #20