Size: a a a

Natural Language Processing

2020 September 26

DK

Denis Kirjanov in Natural Language Processing
в этом смысле больше, да
для меня ресурс -- это все-таки корпуса + парсеры

хотя понятно, что утром деньги, вечером стулья, да
источник

E

Elena in Natural Language Processing
Меня вот бесит что в NLP английский дефолтный язык
источник

E

Elena in Natural Language Processing
Некоторые пейперы даже не упоминают, с каким языком работают
источник

N

Natalia in Natural Language Processing
ха-ха, если бы "некоторые"
источник

DM

Dmitry Morozov in Natural Language Processing
если работаете с иностранным необычным языком, можно посмотреть на language-independent токенайзеры и поверх их уже тренировать модели
источник

DM

Dmitry Morozov in Natural Language Processing
например такое
https://github.com/google/sentencepiece
источник

E

Elena in Natural Language Processing
Bogdan Salyp
На инглише(((
источник

E

Elena in Natural Language Processing
я имела в виду вот эту конструкцию, когда у тебя и энкодер, и декодер bert
источник

SP

Sebastian Pereira in Natural Language Processing
Elena
Меня вот бесит что в NLP английский дефолтный язык
Во всем мире) не только в NLP
источник

E

Elena in Natural Language Processing
в общем, я считаю, что надо бороться против гегемонии английского языка
источник

SP

Sebastian Pereira in Natural Language Processing
Ну эта борьба очень сильно на  финансирование заточена. В университете Тарту оно есть и там допустим, для языковых актов лучше больше размеченных текстов чем для русского.
источник

E

Elena in Natural Language Processing
я согласна про финансирование
источник

E

Elena in Natural Language Processing
как тут уже сказали, национализм + выбивание денег любыми способами
источник

AS

Alex Surname in Natural Language Processing
Elena
в общем, я считаю, что надо бороться против гегемонии английского языка
зачем?
источник

AS

Alex Surname in Natural Language Processing
хорошо когда есть один язык, который условно "все" понимают
источник

E

Elena in Natural Language Processing
затем, что не только английский в этом мире существует
источник

AS

Alex Surname in Natural Language Processing
так нет постановки вопроса, чтоб остался только один язык в мире
источник

AS

Alex Surname in Natural Language Processing
научному сообществу нужно ведь между собой как-то общаться, но и они делают это на английском
источник

E

Elena in Natural Language Processing
речь шла про разработку NLP  для разных языков, не про общение
источник

DK

Denis Kirjanov in Natural Language Processing
Alex Surname
хорошо когда есть один язык, который условно "все" понимают
это правда
но это же не отменяет того, что вы примерно в 6 тысяч раз уменьшаете языковое разнообразие и, значит, объект лингвистических и нлпшных штудий, если занимаетесь только английском

если вы хотите, чтобы модельки действительно имели хорошую языковую обобщающую способность, то только английский -- это дикий оверфит
источник