Size: a a a

R (язык программирования)

2020 August 26

ЕТ

Евгений Томилов... in R (язык программирования)
Спасибо всем.
источник

a

aGricolaMZ in R (язык программирования)
в самом PCA есть аргумент
источник

ЕТ

Евгений Томилов... in R (язык программирования)
aGricolaMZ
в самом PCA есть аргумент
Это да, просто я предварительно данные через конвейер прогонял, но в нём шаг шкалирования не сработал почему-то.
источник

a

aGricolaMZ in R (язык программирования)
Переслано от aGricolaMZ
не получается нагуглить, как заставить R читать utf-16.

> head(readLines("2016_D1_abg__uih.TextGrid", encoding = "UTF-16"))
[1] "\xfe\xff" ""         ""         ""         ""         ""        
There were 50 or more warnings (use warnings() to see the first 50)

Если сделать вид, что это таблица, то читает read.table() (но это какое-то кривое решение):

> head(read.table("2016_D1_abg__uih.TextGrid", fileEncoding = "UTF-16", sep = "*"))
                        V1
1    File type = ooTextFile
2   Object class = TextGrid
3                 xmin = 0
4 xmax = 9.002666666666666
5          tiers? <exists>
6                 size = 2
источник

АК

Артём Клевцов... in R (язык программирования)
aGricolaMZ
не получается нагуглить, как заставить R читать utf-16.

> head(readLines("2016_D1_abg__uih.TextGrid", encoding = "UTF-16"))
[1] "\xfe\xff" ""         ""         ""         ""         ""        
There were 50 or more warnings (use warnings() to see the first 50)

Если сделать вид, что это таблица, то читает read.table() (но это какое-то кривое решение):

> head(read.table("2016_D1_abg__uih.TextGrid", fileEncoding = "UTF-16", sep = "*"))
                        V1
1    File type = ooTextFile
2   Object class = TextGrid
3                 xmin = 0
4 xmax = 9.002666666666666
5          tiers? <exists>
6                 size = 2
Без файл вряд ли удастся помочь. Ну или нужен код генерации аналогичного. Ещё есть разница на какой ОС читать.
источник

a

aGricolaMZ in R (язык программирования)
источник

a

aGricolaMZ in R (язык программирования)
linux
источник

АК

Артём Клевцов... in R (язык программирования)
con <- file(f, encoding = "utf-16")
readLines(con)
close(con)
источник

a

aGricolaMZ in R (язык программирования)
спасибо... У меня почему-то аналогичное не работало, а теперь работает
источник

АК

Артём Клевцов... in R (язык программирования)
Можно написать обёртку с детектом кодировки:
uchardet::detect_file_enc(f)
Downloads/Telegram Desktop/2016_D1_abg__uih.TextGrid
                                           "UTF-16"
источник

a

aGricolaMZ in R (язык программирования)
А-а-а-а....
источник

a

aGricolaMZ in R (язык программирования)
потому что у меня разные кодировки в файлах
источник

АК

Артём Клевцов... in R (язык программирования)
источник

АК

Артём Клевцов... in R (язык программирования)
источник

a

aGricolaMZ in R (язык программирования)
я вроде в своем пакете на него ссылаюсь
источник

a

aGricolaMZ in R (язык программирования)
но он кстати читает любую кодировку...
источник

АК

Артём Клевцов... in R (язык программирования)
aGricolaMZ
но он кстати читает любую кодировку...
источник

АК

Артём Клевцов... in R (язык программирования)
.ReadPraatFile <- function(file, encoding) {
 .con <- file(file, open = "rt", encoding = encoding)
 .praat_text <- readLines(.con)
 close(.con)
 return(.praat_text)
}
источник

АК

Артём Клевцов... in R (язык программирования)
Только он ради readr::guess_encoding тащит readr и stringi прицепом.
источник

a

aGricolaMZ in R (язык программирования)
А я буду делать что-то такое же, но, видимо, с uchardet, так как там меньше зависимостей
источник