Size: a a a

Natural Language Processing

2020 September 04

N

Natalia in Natural Language Processing
а скажите ещё, пожалуйста, какие вообще теггеры и что-нибудь знают старую орфографию? вроде mystem справляется, но я пока не успела проверить
источник
2020 September 05

ER

Ed Ryzhov in Natural Language Processing
Приезжай, хочу тебя увидеть
источник

m

mel kaye in Natural Language Processing
okay
источник
2020 September 06

RI

Roman Inflianskas in Natural Language Processing
Привет!
Подскажите, пожалуйста, есть ли свободные многоязычные словари, в которых есть финский? Я нашёл https://www.wikdict.com/ на основе Wiktionary, но там не хватает некоторых смыслов (см. https://bitbucket.org/serasset/dbnary/issues/67/missing-senses-for-finnish-wiktionary).
UPD: интересуют варианты, легко доступные из Python.
источник

OM

Oleg Mosalov in Natural Language Processing
Можно у коллег вот тут спросить https://blogs.helsinki.fi/language-technology/, если, конечно, вы не оттуда как раз.
источник

RI

Roman Inflianskas in Natural Language Processing
Спасибо за ссылку. Я не оттуда)
источник

N

Natalia in Natural Language Processing
источник

N

Natalia in Natural Language Processing
но см. лицензию или что там
источник

N

Natalia in Natural Language Processing
а вообще словник большой нужен?
источник

RI

Roman Inflianskas in Natural Language Processing
Natalia
а вообще словник большой нужен?
Я хочу сделать свободного бота для изучения языков а-ля альтернатива Duolingo. Слова пока беру из Wiktionary (wikdict), фразы по уровню буду брать из параллельного корпуса. Желательно иметь большой словарь, чтобы можно было учить слова из разных сфер. В общем, я именно поэтому изобретаю велосипед: Duolingo мне предлагает слова типа "волшебник", а мне про программирование интересно. Ну и, конечно, по идеологическим причинам хочется сделать свободное, бесплатное ПО (и без рекламы) для изучения языков.
источник

RI

Roman Inflianskas in Natural Language Processing
Спасибо!
источник

N

Natalia in Natural Language Processing
ну, во-первых, должны быть какие-то переводческие базы данных ЕС (терминология и что-нибудь ещё)
источник

N

Natalia in Natural Language Processing
но вообще, если честно, не очень понятно, почему не начать с хороших двуязычных словарей и тех языковых пар, для которых вообще хорошие источники есть
источник

N

Natalia in Natural Language Processing
а вообще ещё giellatekno нужно посмотреть ещё, конечно, но он что-то лежит
источник

RI

Roman Inflianskas in Natural Language Processing
Natalia
но вообще, если честно, не очень понятно, почему не начать с хороших двуязычных словарей и тех языковых пар, для которых вообще хорошие источники есть
Я рассчитывал, что если есть многоязычный Wiktionary, то должен быть и нормальный многоязычный словарь, который без особых проблем можно дёргать из Python (то есть без парсинга Викисловаря).
И если бы не баг в dbnary, то мне бы и хватило wikdict.
Понятно, что если каждую языковую пару делать отдельно, то можно более хороших результатов достичь. Но это мой проект в свободное нерабочее время, хочется как-то попроще сделать, чтобы вообще доделать;)
источник

NK

Nikolay Karelin in Natural Language Processing
Roman Inflianskas
Я рассчитывал, что если есть многоязычный Wiktionary, то должен быть и нормальный многоязычный словарь, который без особых проблем можно дёргать из Python (то есть без парсинга Викисловаря).
И если бы не баг в dbnary, то мне бы и хватило wikdict.
Понятно, что если каждую языковую пару делать отдельно, то можно более хороших результатов достичь. Но это мой проект в свободное нерабочее время, хочется как-то попроще сделать, чтобы вообще доделать;)
Есть вот такой словарь с API: https://glosbe.com/
источник

N

Natalia in Natural Language Processing
ну как сказать - чтобы и в wiktionary нормальный словник сделать, и какой угодно ещё нормальный многоязычный словарь, кому-то нужно было сидеть ручками вбивать это (и скорее всего, в свободное время), так что там везде разное качество или же словник небольшой. ну или пары конкретные
источник

N

Natalia in Natural Language Processing
glosbe - это хорошая идея, но качество там тоже никто не гарантирует для любого случайного примера (т.е. оно явно может быть хуже лексикографических специзданий)
источник

RI

Roman Inflianskas in Natural Language Processing
Спасибо, подумаю над его применением! Правда мне он показался немного замусоренным: https://glosbe.com/fi/en/kiitos (куча похожих смыслов из разных версий Викисловаря).
источник

bx

berkut x in Natural Language Processing
Подскажите каким путём пойти: хочу чтобы нейросетка отвечала на несложные вопросы, но только заранее подготовленными цитатами(к примеру из тройки больших книг). Другое запрещено.
Может готовое видели что-то?
источник