Size: a a a

Natural Language Processing

2021 February 05

D•

Dan • Captain in Natural Language Processing
вот такой закреп (https://t.me/natural_language_processing/25846) надо вообще в виде ссылки в инфу канала написать, это очень полезно :)
источник

AK

Alexander Kukushkin in Natural Language Processing
Там ограниченное число символов, но согласен
источник

NK

Nikolay Karelin in Natural Language Processing
Alexander Kukushkin
Там ограниченное число символов, но согласен
Было бы супер иметь в описании канала ссылочку на сайт, на котором будет накапливаться важная инфа, в т.ч. с закрепов.
источник

AK

Alexander Kukushkin in Natural Language Processing
Угу, хорошая идея
источник

N

Natalia in Natural Language Processing
закрепов же несколько вроде можно даже теперь делать
источник

YB

Yuri Baburov in Natural Language Processing
может сделать канал с анонсами к группе, и туда закрепы будут идти?
источник

AA

Anton A in Natural Language Processing
Можно, в некоторых группах так делают, общение отдельно, канал с важными анонсами отдельно, очень удобно
источник

YB

Yuri Baburov in Natural Language Processing
здесь тоже можно их оставить как закрепы, конечно
источник

A

Anton in Natural Language Processing
Alexander Kukushkin
Новые соревнования на Диалоге http://www.dialog-21.ru/evaluation/. Датасеты на русском языке на вес золота.
- seq2seq сложное предложение -> простое, симплификация
- Генерация заголовка для кластера новостей
- Нормализация именованных сущностей
По генерации заголовка кластера у меня есть наработки. Попробую свои силы
источник

A

Anton in Natural Language Processing
Alexander Kukushkin
Новые соревнования на Диалоге http://www.dialog-21.ru/evaluation/. Датасеты на русском языке на вес золота.
- seq2seq сложное предложение -> простое, симплификация
- Генерация заголовка для кластера новостей
- Нормализация именованных сущностей
А как зарегиться не описано
источник
2021 February 06

d

dePuff in Natural Language Processing
UKPLab/sentence-transformers
В частности Sentence-BERT

Какой порядок размера корпуса нужен для файнтюнинга?
источник

KS

Konstantin Smith in Natural Language Processing
Alexander Kukushkin
Новые соревнования на Диалоге http://www.dialog-21.ru/evaluation/. Датасеты на русском языке на вес золота.
- seq2seq сложное предложение -> простое, симплификация
- Генерация заголовка для кластера новостей
- Нормализация именованных сущностей
Не понял про "нормализацию именованных сущностей" - там что-то другое в соревновании, какие-то "диахронические семантические сдвиги".
источник

AK

Alexander Kukushkin in Natural Language Processing
Konstantin Smith
Не понял про "нормализацию именованных сущностей" - там что-то другое в соревновании, какие-то "диахронические семантические сдвиги".
Вроде бы и то и другое http://www.dialog-21.ru/information2021/ см "Нормализация именованных сущностей"
источник

KS

Konstantin Smith in Natural Language Processing
Значит, отменили, так как инфоомации об этом больше нигде нет
источник

SancheZz Мов in Natural Language Processing
dePuff
UKPLab/sentence-transformers
В частности Sentence-BERT

Какой порядок размера корпуса нужен для файнтюнинга?
Для ру языка можно в 10к влезть
источник

d

dePuff in Natural Language Processing
SancheZz Мов
Для ру языка можно в 10к влезть
Спасибо
источник

SancheZz Мов in Natural Language Processing
Коллега бывший диппавловец говорил, что у них получалось
источник

YB

Yuri Baburov in Natural Language Processing
Alexander Kukushkin
Вроде бы и то и другое http://www.dialog-21.ru/information2021/ см "Нормализация именованных сущностей"
http://www.dialog-21.ru/evaluation/
здесь пока что есть только 4 из 6 , обычно в феврале все начинаются, т.к. в начале марта уже сдавать задачи...
источник

N

Natalia in Natural Language Processing
ну они только начали инфу в лингв. рассылки кидать, так что медленно раскачиваются как-то
источник

SP

Sebastian Pereira in Natural Language Processing
dePuff
UKPLab/sentence-transformers
В частности Sentence-BERT

Какой порядок размера корпуса нужен для файнтюнинга?
На мой взгляд, для Bert сложно сдвинуть веса, если целевой домен сильно отличается лексически и грамматически (медицинские рецепты, например) либо очень большой домен, либо обучайте с нуля и комбинируйте с общей лингвистической.
источник