Size: a a a

Natural Language Processing

2020 September 26

AS

Alex Surname in Natural Language Processing
вообще-то в статтьях указано для какого языка было проведено исследование(сама статтья обычно на английском написана)
источник

AS

Alex Surname in Natural Language Processing
не понимаю вообще проблемы, 50% интернета на англйиском, понятно дело что основная масса исследований для него
источник

E

Elena in Natural Language Processing
ну еще потому что у англоязычных стран есть деньги
источник

AS

Alex Surname in Natural Language Processing
Denis Kirjanov
это правда
но это же не отменяет того, что вы примерно в 6 тысяч раз уменьшаете языковое разнообразие и, значит, объект лингвистических и нлпшных штудий, если занимаетесь только английском

если вы хотите, чтобы модельки действительно имели хорошую языковую обобщающую способность, то только английский -- это дикий оверфит
и зачем нам одна модель под все языки? у каждого языка своя особенность, на этом можно играть
источник

DK

Denis Kirjanov in Natural Language Processing
Alex Surname
не понимаю вообще проблемы, 50% интернета на англйиском, понятно дело что основная масса исследований для него
с утилитарной точки зрения, действительно, почти никакой проблемы
с точки зрения науки -- огромная
источник

SS

Sergey Sikorskiy in Natural Language Processing
Alex Surname
не понимаю вообще проблемы, 50% интернета на англйиском, понятно дело что основная масса исследований для него
Согласно вот этому вторым по к-ву статей на Википедиа является некий язык Cebuano. Так что все относительно …
источник

N

Natalia in Natural Language Processing
Alex Surname
вообще-то в статтьях указано для какого языка было проведено исследование(сама статтья обычно на английском написана)
да вы что! по приколу регулярно занимаюсь тем, что беру и поиском ищу хотя бы слово English в тексте, особенно там, где не заявлена многоязычность экспериментов
источник

V

Victoria in Natural Language Processing
А разве не логично, что если язык нигде отдельно не указан, а статья написана на английском, то она об обработке английского?
Понятно, что хорошим тоном было бы указать язык, но в чем, собственно, проблема, если он не указан?
источник

OS

Oleg Serikov in Natural Language Processing
Victoria
А разве не логично, что если язык нигде отдельно не указан, а статья написана на английском, то она об обработке английского?
Понятно, что хорошим тоном было бы указать язык, но в чем, собственно, проблема, если он не указан?
Даже если логично, то расходится с моим опытом.
источник

OS

Oleg Serikov in Natural Language Processing
Не видел статей об обработке каталанского, написанных на каталанском)
источник

V

Victoria in Natural Language Processing
Oleg Serikov
Не видел статей об обработке каталанского, написанных на каталанском)
И много статей про обработку каталанского, где узнать, что она про каталанский, можно только с помощью ясновидения?
источник

OS

Oleg Serikov in Natural Language Processing
Victoria
И много статей про обработку каталанского, где узнать, что она про каталанский, можно только с помощью ясновидения?
Не знаю)
источник

V

Victoria in Natural Language Processing
Oleg Serikov
Не знаю)
вы ж только что написали про личный опыт
источник

OS

Oleg Serikov in Natural Language Processing
Victoria
вы ж только что написали про личный опыт
да!
источник

OS

Oleg Serikov in Natural Language Processing
а
источник

OS

Oleg Serikov in Natural Language Processing
ну на моём опыте статей про каталанский вообще мало
но я и статей про английский, в которых непонятно, что они про английский, не видел, так что полагаться на него я стал бы не
источник

NK

Nikolay Karelin in Natural Language Processing
Victoria
И много статей про обработку каталанского, где узнать, что она про каталанский, можно только с помощью ясновидения?
Выглядит, как отличная задача для студента или стажера: собрать датасет из arXiv и ACL,  и затем проанализовать, какие языки там анализируются (и в какой части статей вовсе нет упоминания языков).
источник

LM

Lev Morozov in Natural Language Processing
Valentin Malykh
коллеги, мы все-таки делаем новый запуск нашего курса Natural Language Processing; курс в этот раз будет онлайн, занятия будут по Zoom; вести буду я, все материалы будут на английском, но сами занятия будут на русском; квизы и задания будут на Степике, приглашения на него разошлем всем, кто зарегистрируется в форме; первая лекция будет в 18:30 во вторник, 29 сентября; канал для общения по курсу будет ODS.ai #huawei_nlp_course

форма регистрации: https://forms.gle/EjLbmRjCyH6YEqNx8
Бесплатный курс это круто. Но форма несколько странная. Зачем, например, вопрос "Any limitations by health/ disability (if have)" ?
источник

VM

Valentin Malykh in Natural Language Processing
это следствие политики МФТИ об инклюзивности обучения
источник

VM

Valentin Malykh in Natural Language Processing
они теперь везде это спрашивают
источник