Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 October 14

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
можно что то почитать про это, есть рекомендации ?
По всей видимости, метрика пространства не та.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
По всей видимости, метрика пространства не та.
ну это всего лишь плот tSNE многомерной даты, а не сама дата, в смысле метрика ? плота ?
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
ну это всего лишь плот tSNE многомерной даты, а не сама дата, в смысле метрика ? плота ?
tSNE тоже использует метрики для многомерного пространства и конечного двумерного. https://habr.com/ru/post/267041/
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Вот суть kernel trick. Вводя дополнительное измерение, легче разделять группы объектов ==> кластеризация тоже может сработать лучше.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну он мне только для визуализации и интуиции. Как индикитор насколько дата хорошо разделяема. Без какой либо нормализации:
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
но кластеринг все равно плохой. И в issue того гита говорят, первое что сделайте это нормализацию.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
Вот суть kernel trick. Вводя дополнительное измерение, легче разделять группы объектов ==> кластеризация тоже может сработать лучше.
добавляется ровно одно измерение ?
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
ну он мне только для визуализации и интуиции. Как индикитор насколько дата хорошо разделяема. Без какой либо нормализации:
Строго говоря, на t-sne нельзя опираться в этом вопросе, поскольку он не говорит ничего про соотношение точек в пространстве. Для этого лучше тогда использовать, не знаю даже, сеть Кохонена.
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
добавляется ровно одно измерение ?
Или больше. Или мы просто используем другую метрику расстояния. Я не настолько хорош в теме, чтобы за минуту составить полноценное объяснение, так что лучше загуглить будет. =)
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
понял. Но в общем у меня тема такая, все в один кластер дипом толкает. А если k-means, с любым значением k распределение в каждом кластере примерно такое же как по всей дате, то есть какое то равномерное оно, и кластеры также его воспринимают.
Что в целом сходится с фактом, что если scale применить, то deviation —>0. Там амплитуды сердца, все сходится. В среднем занчение одно, и раз в секунду допустим пик, но там 2049 фреймов, то есть большинство фреймов значение амплитуды одинаковое, одно сердцебиение в секунду пусть будет, 2049 фреймов это 8 секунд,  значит каждые 250 фреймов значение допустим высокое.
Тут понятное почему (x-E(X)) / Variance —>

пока непонятно что с этой информацией делать ))
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
Вот суть kernel trick. Вводя дополнительное измерение, легче разделять группы объектов ==> кластеризация тоже может сработать лучше.
посмотрел, он уже есть в коде.
источник

МС

Мария Строгова... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Kostas PONOMAREW
Всем здравствуйте, вопрос по Pandas, как можно идти в датафрейме по строкам? А не по отдельным колонкам
iterrows, например
источник

KP

Kostas PONOMAREW in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Мария Строгова
iterrows, например
Спасибо большое
источник

AN

Alpha Nerd in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Есть вопрос по обучению модели с генератором:
- используется два TimeseriesGenerator для обучения и валидации
- при вызове model.fit(...) указываю x=train_gen и validation_data=test_get
- получаю ошибку ValueError: cannot copy sequence with size 8 to array axis with dimension 1, где 8 — это параметр length=8 генератора
источник

AN

Alpha Nerd in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Кто-нибудь сталкивался?
источник

A

Anton in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Alpha Nerd
Кто-нибудь сталкивался?
Какой input указан на входе?
источник

AN

Alpha Nerd in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Anton
Какой input указан на входе?
В конструкторе TimeseriesGenerator data и targets — имеют тип Series
источник

AN

Alpha Nerd in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Оба одинаковой длины, офк.
источник

A

Anton in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Input сети, ошибка же при обучении сети
источник

AN

Alpha Nerd in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А, понял: x=train_gen, y указывать не стал, т.к. в документации написано что fit(...) сам разберётся с генератором.
источник