Size: a a a

R (язык программирования)

2020 November 21

ЕТ

Евгений Томилов... in R (язык программирования)
А то так и пакет свой выпустить недолго.
источник

JS

Jury Sergeev in R (язык программирования)
Евгений Томилов
Так самому-то легко (ну, не прямо легко, но легко). А я хочу, чтобы за меня было уже сделано, а я только написал две функции и сразу 300к получил.
Ну это как повезёт, бывает есть такое в фреймворках, бывает - чуть своего дописать, а бывает - извращаться приходится
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Вообще, неплохая идея. Надо бы заморочиться этим.
источник

JS

Jury Sergeev in R (язык программирования)
Мне вот пришлось лирнер для mlr3 делать, внутри хгбуст, которому на вход спарс матрица - веторизированный текст, ну дак вот векторизацию пришлось делать в лирнере
источник

JS

Jury Sergeev in R (язык программирования)
Долго делается - на каждом шаге CV векторизация, зато без утечек
источник

АК

Артём Клевцов... in R (язык программирования)
Готовится релиз bs4Dash. Будет много интересных изменений. Например, вот.
https://twitter.com/divadnojnarg/status/1329818104835301379
источник

A

Andrey in R (язык программирования)
> f <- function(x, y = a) {a <- 1; x + y}
> a <- 100
> f(1)
[1] 2
> f(x = 1, y = a)
[1] 101

Однако!
источник

A

Andrey in R (язык программирования)
из рекомендованного ранее Майлунда решил полуркать эту книжку. Очень солидно!
источник

A

Andrey in R (язык программирования)
все это документировано в https://cran.r-project.org/doc/manuals/r-release/R-lang.html, но как-то раньше этот нюанец не осознавал
источник
2020 November 22

PU

Philipp Upravitelev in R (язык программирования)
майлунд очень солидный
по сути, единственный из немногих, кто глубоко в кишки лезет
правда, местами сильно глубоко и все равно путано
источник

JS

Jury Sergeev in R (язык программирования)
Andrey
> f <- function(x, y = a) {a <- 1; x + y}
> a <- 100
> f(1)
[1] 2
> f(x = 1, y = a)
[1] 101

Однако!
действительно, однако... интересно, как такое же в других языках
источник

PU

Philipp Upravitelev in R (язык программирования)
да также, по идее, это ж все то же самое лексическое связывание и правила поиска объектов по иерархии окружений
источник

PU

Philipp Upravitelev in R (язык программирования)
хотя не совсем
R лениво использует аргументы, поэтому нет необходимости создавать а при объявлении функции
источник

PU

Philipp Upravitelev in R (язык программирования)
вот в питоне, если a создано, в противном случае не функция не создается
>>> a = 100
>>> def f(x, y = a):
...     a = 1
...     return x + y
...
>>> f(1)
101
>>> f(1, y = 1)
2
источник

PU

Philipp Upravitelev in R (язык программирования)
ну и вот так. то есть, все же, иное поведение.
>>> a = 200
>>> f(1)
101
источник

ЕТ

Евгений Томилов... in R (язык программирования)
А тут есть же NLP-щики? Вот, есть у меня тексты короткие, я хочу их кластеризовать. Предположим, сделал этот tf-idf, на руках есть разреженная матрица.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
А потом я хочу к ней приклеить ещё данные, которые характеризуют тексты.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
1) Мне теперь заново рассчитывать расстояния?
2) Как вообще это сделать? Перевести разреженную матрицу в плотную == взрыв памяти.
источник

a

aGricolaMZ in R (язык программирования)
Евгений Томилов
А тут есть же NLP-щики? Вот, есть у меня тексты короткие, я хочу их кластеризовать. Предположим, сделал этот tf-idf, на руках есть разреженная матрица.
Так надо использовать функции из tidytext, тогда данные и не открепятся
источник

БА

Байкулов Антон... in R (язык программирования)
Утренний вопрос:

Есть df, где две колонки имеют class list

Делаю unlist по одному столбцу, и получаю ошибку:
x Existing data has 60000 rows.
x Assigned data has 59905 rows.
ℹ️ Only vectors of size 1 are recycled.

Сперва думал что причина в NA в некоторых строчках. Но в соседней колонке проблем нет, хотя там тоже NA есть
источник