Телеграмм чат группы docsascode страница 822

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

DocOps-сообщество

843 membersпожаловаться на группу

2021 March 12

DL

Dmytro Lispyvnyi '(🌲... in DocOps-сообщество

ворд вообще не скейлится, потому что надо разделять:
- текстовое представление и диффы-мержи
- визуальное представление
- экспортирование конечного продукта

источник

01:20пожаловаться #1

2021 March 17

NK

ID:0 in DocOps-сообщество

У меня сейчас есть интересная дилемма по организации работы над переводом. Чтобы её объяснить, сначала расскажу про механику перевода.

Перевод устроен так: исходный текст нарезается на единицы перевода (translation units, TU). Заголовки, абзацы, пункты списков, ячейки в таблицах. Каждый юнит переводится целиком. Переводить куски текста большего размера — неэффективно, а если нарезать ещё меньше, то потеряется смысл.

Внутри системы переводы хранятся в структуре ключ-значение (ассоциативный массив, dictionary, map). Оригинальный текст — это ключ, а перевод — значение.

При сборке документации на переводном языке на место каждого юнита подставляется текст перевода. Но если перевода нет, остаётся оригинальный текст. Не нашли значение по ключу — используем сам ключ.

Как вы думаете, что происходит, когда перевод уже есть, но вдруг поменялся оригинальный текст? Мы ищем по новому ключу, значения там нет, перевод «слетает».

Представьте, что есть старый текст на английском. Его написали давно, но ещё не перевели. Его нужно когда-то перевести, и когда-то вычитать и поправить язык, стиль и оформление.

Можно переводить как есть, когда-нибудь потом вычитывать английский текст, а потом допереводить ещё раз. Получается лишняя работа переводчика.

А ещё можно вычитывать оригинал до перевода. Тогда у переводчика меньше работы, но мы добавляем техписателям срочных задач, которые блокируют работу над переводом. И эти задачи конкурируют за время с другими, более важными задачами по документации.

Кажется, что оба варианта плохи, но второй — хуже. А можно как-то иначе? Отдать пруфрид переводчику или другому внештатному сотруднику? Что бы вы сделали?

источник

10:11пожаловаться #2

СФ

Семён Факторович... in DocOps-сообщество

volatile primary key? месье знают толк в извращениях!

источник

10:20пожаловаться #3

СФ

Семён Факторович... in DocOps-сообщество

он же на то и primary, чтобы быть неизменным

источник

10:21пожаловаться #4

D

Denis in DocOps-сообщество

ID:0

У меня сейчас есть интересная дилемма по организации работы над переводом. Чтобы её объяснить, сначала расскажу про механику перевода.

Перевод устроен так: исходный текст нарезается на единицы перевода (translation units, TU). Заголовки, абзацы, пункты списков, ячейки в таблицах. Каждый юнит переводится целиком. Переводить куски текста большего размера — неэффективно, а если нарезать ещё меньше, то потеряется смысл.

Внутри системы переводы хранятся в структуре ключ-значение (ассоциативный массив, dictionary, map). Оригинальный текст — это ключ, а перевод — значение.

При сборке документации на переводном языке на место каждого юнита подставляется текст перевода. Но если перевода нет, остаётся оригинальный текст. Не нашли значение по ключу — используем сам ключ.

Как вы думаете, что происходит, когда перевод уже есть, но вдруг поменялся оригинальный текст? Мы ищем по новому ключу, значения там нет, перевод «слетает».

Представьте, что есть старый текст на английском. Его написали давно, но ещё не перевели. Его нужно когда-то перевести, и когда-то вычитать и поправить язык, стиль и оформление.

Можно переводить как есть, когда-нибудь потом вычитывать английский текст, а потом допереводить ещё раз. Получается лишняя работа переводчика.

А ещё можно вычитывать оригинал до перевода. Тогда у переводчика меньше работы, но мы добавляем техписателям срочных задач, которые блокируют работу над переводом. И эти задачи конкурируют за время с другими, более важными задачами по документации.

Кажется, что оба варианта плохи, но второй — хуже. А можно как-то иначе? Отдать пруфрид переводчику или другому внештатному сотруднику? Что бы вы сделали?

Обычно с этим помогают CAT tools. Типа Smartcat

источник

10:22пожаловаться #5

СФ

Семён Факторович... in DocOps-сообщество

Семён Факторович

volatile primary key? месье знают толк в извращениях!

(но я ненастоящий сварщик, не работал с CAT-ами и не знаю их теории и фундаментальных ограничений)

источник

10:25пожаловаться #6

N

Nikita in DocOps-сообщество

ID:0

У меня сейчас есть интересная дилемма по организации работы над переводом. Чтобы её объяснить, сначала расскажу про механику перевода.

Перевод устроен так: исходный текст нарезается на единицы перевода (translation units, TU). Заголовки, абзацы, пункты списков, ячейки в таблицах. Каждый юнит переводится целиком. Переводить куски текста большего размера — неэффективно, а если нарезать ещё меньше, то потеряется смысл.

Внутри системы переводы хранятся в структуре ключ-значение (ассоциативный массив, dictionary, map). Оригинальный текст — это ключ, а перевод — значение.

При сборке документации на переводном языке на место каждого юнита подставляется текст перевода. Но если перевода нет, остаётся оригинальный текст. Не нашли значение по ключу — используем сам ключ.

Как вы думаете, что происходит, когда перевод уже есть, но вдруг поменялся оригинальный текст? Мы ищем по новому ключу, значения там нет, перевод «слетает».

Представьте, что есть старый текст на английском. Его написали давно, но ещё не перевели. Его нужно когда-то перевести, и когда-то вычитать и поправить язык, стиль и оформление.

Можно переводить как есть, когда-нибудь потом вычитывать английский текст, а потом допереводить ещё раз. Получается лишняя работа переводчика.

А ещё можно вычитывать оригинал до перевода. Тогда у переводчика меньше работы, но мы добавляем техписателям срочных задач, которые блокируют работу над переводом. И эти задачи конкурируют за время с другими, более важными задачами по документации.

Кажется, что оба варианта плохи, но второй — хуже. А можно как-то иначе? Отдать пруфрид переводчику или другому внештатному сотруднику? Что бы вы сделали?

Вроде бы логичное и понятное поведение. У меня sphinx c .po файлами аналогичным образом работает. Если изменения небольшие, gettext умеет находить похожие переводы и отмечать их как fuzzy (https://www.gnu.org/software/gettext/manual/html_node/Fuzzy-Entries.html). Здесь, насколько я понимаю, используется какое-то самописное решение, поэтому поиск похожих записей придётся прикручивать самостоятельно.
Далее возникает чисто организационная задача: мониторинг непереведённых юнитов и обнаруженных fuzzy-переводов.

GNU gettext utilities: Fuzzy Entries

Next: Untranslated Entries, Previous: Translated Entries, Up: PO Mode [Contents][Index]

источник

10:26пожаловаться #7

VK

Vladimir Kasatkin in DocOps-сообщество

ID:0

У меня сейчас есть интересная дилемма по организации работы над переводом. Чтобы её объяснить, сначала расскажу про механику перевода.

Перевод устроен так: исходный текст нарезается на единицы перевода (translation units, TU). Заголовки, абзацы, пункты списков, ячейки в таблицах. Каждый юнит переводится целиком. Переводить куски текста большего размера — неэффективно, а если нарезать ещё меньше, то потеряется смысл.

Внутри системы переводы хранятся в структуре ключ-значение (ассоциативный массив, dictionary, map). Оригинальный текст — это ключ, а перевод — значение.

При сборке документации на переводном языке на место каждого юнита подставляется текст перевода. Но если перевода нет, остаётся оригинальный текст. Не нашли значение по ключу — используем сам ключ.

Как вы думаете, что происходит, когда перевод уже есть, но вдруг поменялся оригинальный текст? Мы ищем по новому ключу, значения там нет, перевод «слетает».

Представьте, что есть старый текст на английском. Его написали давно, но ещё не перевели. Его нужно когда-то перевести, и когда-то вычитать и поправить язык, стиль и оформление.

Можно переводить как есть, когда-нибудь потом вычитывать английский текст, а потом допереводить ещё раз. Получается лишняя работа переводчика.

А ещё можно вычитывать оригинал до перевода. Тогда у переводчика меньше работы, но мы добавляем техписателям срочных задач, которые блокируют работу над переводом. И эти задачи конкурируют за время с другими, более важными задачами по документации.

Кажется, что оба варианта плохи, но второй — хуже. А можно как-то иначе? Отдать пруфрид переводчику или другому внештатному сотруднику? Что бы вы сделали?

Могу привести аналогию из Django (babel)

Каждому кусочку текста присваивается уникальный id, например «welcome text screen 1», а дальше тексты на всех языках ссылаются на этот id

источник

10:26пожаловаться #8

VS

Vadim Smelyanskiy in DocOps-сообщество

Семён Факторович

volatile primary key? месье знают толк в извращениях!

Или это immutable translation unit? 😄
Т.е. относимся к изменённому исходному тексту как к совершенно новому объекту

источник

10:28пожаловаться #9

СФ

Семён Факторович... in DocOps-сообщество

Vladimir Kasatkin

Могу привести аналогию из Django (babel)

Каждому кусочку текста присваивается уникальный id, например «welcome text screen 1», а дальше тексты на всех языках ссылаются на этот id

когда-то я писал десктопные приложения на .NET, там точно так же было

источник

10:28пожаловаться #10

AT

Anton Tatsienko in DocOps-сообщество

Vladimir Kasatkin

Могу привести аналогию из Django (babel)

Каждому кусочку текста присваивается уникальный id, например «welcome text screen 1», а дальше тексты на всех языках ссылаются на этот id

+ к этому накрутить версионирование и когда появляется новая версия оригинального текста - можно создавать таску на перевод

источник

10:41пожаловаться #11

D

Denis in DocOps-сообщество

ID:0

У меня сейчас есть интересная дилемма по организации работы над переводом. Чтобы её объяснить, сначала расскажу про механику перевода.

Перевод устроен так: исходный текст нарезается на единицы перевода (translation units, TU). Заголовки, абзацы, пункты списков, ячейки в таблицах. Каждый юнит переводится целиком. Переводить куски текста большего размера — неэффективно, а если нарезать ещё меньше, то потеряется смысл.

Внутри системы переводы хранятся в структуре ключ-значение (ассоциативный массив, dictionary, map). Оригинальный текст — это ключ, а перевод — значение.

При сборке документации на переводном языке на место каждого юнита подставляется текст перевода. Но если перевода нет, остаётся оригинальный текст. Не нашли значение по ключу — используем сам ключ.

Как вы думаете, что происходит, когда перевод уже есть, но вдруг поменялся оригинальный текст? Мы ищем по новому ключу, значения там нет, перевод «слетает».

Представьте, что есть старый текст на английском. Его написали давно, но ещё не перевели. Его нужно когда-то перевести, и когда-то вычитать и поправить язык, стиль и оформление.

Можно переводить как есть, когда-нибудь потом вычитывать английский текст, а потом допереводить ещё раз. Получается лишняя работа переводчика.

А ещё можно вычитывать оригинал до перевода. Тогда у переводчика меньше работы, но мы добавляем техписателям срочных задач, которые блокируют работу над переводом. И эти задачи конкурируют за время с другими, более важными задачами по документации.

Кажется, что оба варианта плохи, но второй — хуже. А можно как-то иначе? Отдать пруфрид переводчику или другому внештатному сотруднику? Что бы вы сделали?

Айдишники хорошо сработают и их легко реализовать. Но если в будущем планируется добавлять языки локализации и отдавать перевод на аутсорс, лучше сразу переходить на CAT.

источник

10:42пожаловаться #12

M

Max in DocOps-сообщество

ID:0

У меня сейчас есть интересная дилемма по организации работы над переводом. Чтобы её объяснить, сначала расскажу про механику перевода.

Перевод устроен так: исходный текст нарезается на единицы перевода (translation units, TU). Заголовки, абзацы, пункты списков, ячейки в таблицах. Каждый юнит переводится целиком. Переводить куски текста большего размера — неэффективно, а если нарезать ещё меньше, то потеряется смысл.

Внутри системы переводы хранятся в структуре ключ-значение (ассоциативный массив, dictionary, map). Оригинальный текст — это ключ, а перевод — значение.

При сборке документации на переводном языке на место каждого юнита подставляется текст перевода. Но если перевода нет, остаётся оригинальный текст. Не нашли значение по ключу — используем сам ключ.

Как вы думаете, что происходит, когда перевод уже есть, но вдруг поменялся оригинальный текст? Мы ищем по новому ключу, значения там нет, перевод «слетает».

Представьте, что есть старый текст на английском. Его написали давно, но ещё не перевели. Его нужно когда-то перевести, и когда-то вычитать и поправить язык, стиль и оформление.

Можно переводить как есть, когда-нибудь потом вычитывать английский текст, а потом допереводить ещё раз. Получается лишняя работа переводчика.

А ещё можно вычитывать оригинал до перевода. Тогда у переводчика меньше работы, но мы добавляем техписателям срочных задач, которые блокируют работу над переводом. И эти задачи конкурируют за время с другими, более важными задачами по документации.

Кажется, что оба варианта плохи, но второй — хуже. А можно как-то иначе? Отдать пруфрид переводчику или другому внештатному сотруднику? Что бы вы сделали?

Оригинальный текст как ключ это плохое решение. Представление о том, что в переводе фрагменты переведенного однозначно соответствуют фрагментам переводимого - неверно.

источник

10:49пожаловаться #13

NV

Nick Volynkin in DocOps-сообщество

ахаха, опубликовался отложенный пост, который был не готов к публикации

источник

10:53пожаловаться #14

NV

Nick Volynkin in DocOps-сообщество

люблю такое

источник

10:54пожаловаться #15

NV

Nick Volynkin in DocOps-сообщество

пойду что ли доведу его до ума )

источник

10:54пожаловаться #16

NV

Nick Volynkin in DocOps-сообщество

Обычно с этим помогают CAT tools. Типа Smartcat

Используем, там есть память переводов, но она не делает всю работу за нас. В параграфе могло поменяться true на false, изменение небольшое, но нельзя же его вслепую применить и жить с этим.

источник

11:01пожаловаться #17

NV

Nick Volynkin in DocOps-сообщество

Вроде бы логичное и понятное поведение. У меня sphinx c .po файлами аналогичным образом работает. Если изменения небольшие, gettext умеет находить похожие переводы и отмечать их как fuzzy (https://www.gnu.org/software/gettext/manual/html_node/Fuzzy-Entries.html). Здесь, насколько я понимаю, используется какое-то самописное решение, поэтому поиск похожих записей придётся прикручивать самостоятельно.
Далее возникает чисто организационная задача: мониторинг непереведённых юнитов и обнаруженных fuzzy-переводов.

GNU gettext utilities: Fuzzy Entries

Next: Untranslated Entries, Previous: Translated Entries, Up: PO Mode [Contents][Index]

Да-да, у нас именно Sphinx. Fuzzy он находит через расстояние Левенштейна, но то же самое есть в CAT (мы используем Crowdin). Но это только помощь переводчику. Строки всё равно временно слетают.

источник

11:02пожаловаться #18

NV

Nick Volynkin in DocOps-сообщество

Вроде бы логичное и понятное поведение. У меня sphinx c .po файлами аналогичным образом работает. Если изменения небольшие, gettext умеет находить похожие переводы и отмечать их как fuzzy (https://www.gnu.org/software/gettext/manual/html_node/Fuzzy-Entries.html). Здесь, насколько я понимаю, используется какое-то самописное решение, поэтому поиск похожих записей придётся прикручивать самостоятельно.
Далее возникает чисто организационная задача: мониторинг непереведённых юнитов и обнаруженных fuzzy-переводов.

GNU gettext utilities: Fuzzy Entries

Next: Untranslated Entries, Previous: Translated Entries, Up: PO Mode [Contents][Index]

Мониторинг есть, мы точно знаем, где и что не переведено. Вот прямо сейчас переведено 60% документации, 170 000 слов из 283 000. Работа переводчика улучшает этот показатель, работа писателей ухудшает.

Переводчик эффективно работает большими блоками, потому что погружается в контекст. Взять и перевести целый документ и раздел. Бегать и допереводить кусочки, которые только что слетели — неэффективно.

источник

11:05пожаловаться #19

NV

Nick Volynkin in DocOps-сообщество

Vladimir Kasatkin

Могу привести аналогию из Django (babel)

Каждому кусочку текста присваивается уникальный id, например «welcome text screen 1», а дальше тексты на всех языках ссылаются на этот id

Это хорошо работает в интерфейсных текстах, где действительно у каждого текста есть место и элемент. Но в документации я не представляю как бы это выглядело. Вот у нас есть эти 283 тысячи слов в нескольких сотнях документов. Пронумеровать абзацы?

Sphinx/Gettext умеет генерировать UUID, впрочем. Может быть, это помогло бы с технической стороны.

источник

11:07пожаловаться #20