Size: a a a

2020 October 28

SI

Sigurður Ingvarsson in 囫囫字
Polina Rysakova
@killeryoghurt Марианна, скажите пожста, почему Нельзя машину научить читать 也 乎и прочее
через собачку спросите, так никто ничего не видит
источник

PR

Polina Rysakova in 囫囫字
Так я ж не знаю ника) но по сути это вопрос риторический
источник

狄安

狄 安福 in 囫囫字
Polina Rysakova
Так я ж не знаю ника) но по сути это вопрос риторический
Он есть в описании канала, откуда вы сделали репост
источник

狄安

狄 安福 in 囫囫字
Polina Rysakova
Добрый день, а можно профанный вопрос - а все специальные слова, заменяющие знаки препинания, это как бы просто так?


https://t.me/digitalsinologist/29
Telegram
Цифровой китаист
Поговорим сегодня про сегментацию китайского. Что это такое? Сегментация (или токенизация) – это членение текста на слова. В китайской письменности нет пробелов, и поэтому мы учимся находить границы слов при чтении, а программисты ищут способы автоматизировать этот процесс. Пользы от сегментации текстов много: она необходима для машинного перевода и нормальной работы онлайн-услуг вроде поиска или спам-фильтров, может помочь при чтении, необходима для любого вида компьютерного анализа языка (а многие направления современной лингвистики без него невозможны). Если ввести целое предложение в БКРС, он даёт словарные статьи для всех возможных сочетаний смежных иероглифов, из которых выходят значимые слова – и это тоже способ сегментации, хоть и не самый точный. Алгоритмов для поиска границ слов сейчас много, но новичкам советую начать с SegmentAnt  – это пользовательский интерфейс для нескольких наиболее распространённых на рынке решений. Помимо китайского умеет работать и с японским языком, а если у вас технический…
Давайте вместе позовём Мариану @killeryoghurt
источник

AK

Albert Krisskoy in 囫囫字
Ольга К
Все думаю, почему в квадрате? Объясните
Не могу объяснить ;)
источник

SI

Sigurður Ingvarsson in 囫囫字
Polina Rysakova
Так я ж не знаю ника) но по сути это вопрос риторический
в описании канала есть ссылка на профиль автора, на риторический вопрос будет риторический ответ :)
источник

SI

Sigurður Ingvarsson in 囫囫字
Albert Krisskoy
Не могу объяснить ;)
я попытался объяснить необъяснимое? стыдно..
источник

k

killeryoghurt in 囫囫字
Polina Rysakova
@killeryoghurt Марианна, скажите пожста, почему Нельзя машину научить читать 也 乎и прочее
Здравствуйте! Можно научить. Проблема в том, что всё эти 也 и 乎 стоят далеко не в конце каждого предложения. Их функция — не заменить знак препинания
источник

k

killeryoghurt in 囫囫字
Тут такой поток сообщений, что я слегка выпала из этого чата :)
источник

k

killeryoghurt in 囫囫字
Ну то есть с одной стороны они приносят дополнительный смысл, с другой — предложение часто может замечательно обойтись без них. Я в посте писала про деление на слова, а не предложения. Но если мы будем обучать алгоритм искать предложения, то все эти слова будут играть большую роль, так как статистически очень большая вероятность, что там граница. Только это не может быть единственным фактором
источник

k

killeryoghurt in 囫囫字
Как-то так :)
источник

ЕШ

Егор Шаповалов... in 囫囫字
Помогите пожалуйста со стихом разобраться
飘浮勃逢敖,
вихрь ? неожиданно встретить ?
曹云石滋芝。
Группа многочисленные камни увеличиваются ?
一英不须润,
цветок не требует полива
至德与时期。
доводить благодетельность со временем?
神仙岂虚感,
небо житель как может слабость испытать
应运来相之。
придерживаясь должного (того что приходит согласно судьбе)
纳我荣五族,
?мои славные 5 родственников
逆我致祸菑
наперекор мне попадающимся бедам

Это из одного 文言小说
Название не нашёл
источник

狄安

狄 安福 in 囫囫字
Егор Шаповалов
Помогите пожалуйста со стихом разобраться
飘浮勃逢敖,
вихрь ? неожиданно встретить ?
曹云石滋芝。
Группа многочисленные камни увеличиваются ?
一英不须润,
цветок не требует полива
至德与时期。
доводить благодетельность со временем?
神仙岂虚感,
небо житель как может слабость испытать
应运来相之。
придерживаясь должного (того что приходит согласно судьбе)
纳我荣五族,
?мои славные 5 родственников
逆我致祸菑
наперекор мне попадающимся бедам

Это из одного 文言小说
Название не нашёл
Это из 搜神记, рассказ 弦超与神女
источник

ЕШ

Егор Шаповалов... in 囫囫字
Он самый
источник

ЕШ

Егор Шаповалов... in 囫囫字
Остальное в рассказе понятно, но вот этот стих не осилил
источник

狄安

狄 安福 in 囫囫字
Егор Шаповалов
Остальное в рассказе понятно, но вот этот стих не осилил
Там в разметке небольшая проблема, как пишут умные дядьки.

Должно быть так:

飘浮勃逢,
敖曹云石滋,
芝一英不须润,
至德与时期
источник

狄安

狄 安福 in 囫囫字
И в первой строчке там смотрите как [я вижу]:

漂浮渤逢
Слоняться по бохайскому Пэнлаю

Там либо опечатка, либо ошибка OCR. Или ещё что. Конечно, у 逢 есть чтение peng. Но там 蓬[莱]
источник

狄安

狄 安福 in 囫囫字
Короче, нашёл вот такой перевод:

我在蓬莱仙境飘游,

云板石磬发出乐声。

灵芝不用雨水滋润,

至高德行等待机遇。

神仙哪是凭空感应,

是顺天意来帮助你。

容我将会五族荣耀,

违我就会招来灾祸。
источник

狄安

狄 安福 in 囫囫字
Я от Бохая отталкивался, здесь тоже на 蓬莱 указывают
источник

狄安

狄 安福 in 囫囫字
Сам я ни за что бы не додумался, что 云石 это 云板 и 石磬
источник