Size: a a a

R (язык программирования)

2020 October 30

PU

Philipp Upravitelev in R (язык программирования)
но без семпла файла сложно что-то подсказать, конечно
источник

PU

Philipp Upravitelev in R (язык программирования)
впрочем, я в любом случае не помогу, у меня linux
источник

IS

Ivan Struzhkov in R (язык программирования)
Я на маке - но семпл бы реально помог - хотя бы убедились что данные не битые
источник

PU

Philipp Upravitelev in R (язык программирования)
вообще, кириллица должна читаться почти всегда в винде, если файл не битый
а дальше уже можно пробовать разные кодировки и перекодировщики, типа utf-8, utf-16, cp1251 и так далее
поставьте uchardet и попробуйте протестировать, что у вас за кодировка в реальности
источник

FA

Fyodor Alekhin in R (язык программирования)
Utf16le попробуй кодировку
источник

FA

Fyodor Alekhin in R (язык программирования)
Работало в 90% случаев
источник

PU

Philipp Upravitelev in R (язык программирования)
насколько я помню, она пишется вот так UTF-16LE
источник

FA

Fyodor Alekhin in R (язык программирования)
Да да именно так
источник
2020 October 31

ВН

Вадим Николаенко... in R (язык программирования)
Philipp Upravitelev
попробуйте Sys.setlocale("LC_CTYPE", "ru_RU")
Ставил Sys.setlocale("LC_ALL", "ru_RU")
источник

ВН

Вадим Николаенко... in R (язык программирования)
Ivan Struzhkov
Я на маке - но семпл бы реально помог - хотя бы убедились что данные не битые
Данные не битые, потому что, нормально открываются в Word
источник

ВН

Вадим Николаенко... in R (язык программирования)
По поводу кодировок.
Взял stri_encod_list или как-то так называется. Там больше 370 кодировок.
С помощью цикла применил каждую из них.
НИЧЕГО 🤦‍♂🤦‍♂🤦‍♂🤦‍♂🤦‍♂
источник

A

Andrey in R (язык программирования)
enc2utf8() тоже не помогает?
источник

PU

Philipp Upravitelev in R (язык программирования)
Вадим Николаенко
По поводу кодировок.
Взял stri_encod_list или как-то так называется. Там больше 370 кодировок.
С помощью цикла применил каждую из них.
НИЧЕГО 🤦‍♂🤦‍♂🤦‍♂🤦‍♂🤦‍♂
говорил же, uchardet :))))
источник

ВН

Вадим Николаенко... in R (язык программирования)
Philipp Upravitelev
говорил же, uchardet :))))
Да я сегодня без компа ))
Обязательно попробую. Спасибо
источник

ВН

Вадим Николаенко... in R (язык программирования)
Andrey
enc2utf8() тоже не помогает?
Не-а
источник

АК

Артём Клевцов... in R (язык программирования)
Вадим Николаенко
Да я сегодня без компа ))
Обязательно попробую. Спасибо
Без самого файла вряд ли тебе кто-то поможет. Это всё больше смахивает на гадание сейчас.
источник

ВН

Вадим Николаенко... in R (язык программирования)
Артём Клевцов
Без самого файла вряд ли тебе кто-то поможет. Это всё больше смахивает на гадание сейчас.
Большую часть из того, что полсказали я уже пробовал.
Файл смогу скинуть только в понедельник.
В нэте эта тема не очень популярна 🤷‍♂
Я думал, что может кто-то сталкивался с подобным и уже есть рецепт))
источник

ВН

Вадим Николаенко... in R (язык программирования)
Вообще, ощущение, что там несколько кодировок (если вообще такое возможно)
источник

АК

Артём Клевцов... in R (язык программирования)
RTF - не самый распространённый формат документа.
источник

ВН

Вадим Николаенко... in R (язык программирования)
Вадим Николаенко
Заметил, что там где слово написано через пробелы (п р и м е р), то оно отображается нормально. Почти все последние буквы слов, тоже кирилличные 🤦‍♂
Как я тут писал, там где буква окружена пробелами, она отображается правильно
источник