Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 November 05

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
взял 0.01 от датасета. Я в y_pred ожидал увидеть одномерный массив. Хотел classification_report распечатать
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Чё-то вторая матрица подозрительно большая.
Судя по трейсбеку, там exog (входные фичи) умножаются на params (коэффициенты), и вторая матрица имеет размер (1080334, 2). Кажется, если в модель запихнуто столько коэффициентов, это ненормально, и проблема была ещё на этапе обучения - видимо, с содержанием или форматом обучающих данных.
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Сергей Васильев
взял 0.01 от датасета. Я в y_pred ожидал увидеть одномерный массив. Хотел classification_report распечатать
Ну значит не то транспонировал
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Evgenii Zheltonozhskii🇮🇱
Ну значит не то транспонировал
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Попробуй трейн
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
В фромформула
источник

AB

Arcady Balandin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Библиотеку Jax в реальных проектах
Анонимный опрос
8%
Использую
92%
Не использую
Проголосовало: 12
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Чё-то вторая матрица подозрительно большая.
Судя по трейсбеку, там exog (входные фичи) умножаются на params (коэффициенты), и вторая матрица имеет размер (1080334, 2). Кажется, если в модель запихнуто столько коэффициентов, это ненормально, и проблема была ещё на этапе обучения - видимо, с содержанием или форматом обучающих данных.
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Переслано от @
В таком виде у меня пандасовский датафрейм
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Чё-то вторая матрица подозрительно большая.
Судя по трейсбеку, там exog (входные фичи) умножаются на params (коэффициенты), и вторая матрица имеет размер (1080334, 2). Кажется, если в модель запихнуто столько коэффициентов, это ненормально, и проблема была ещё на этапе обучения - видимо, с содержанием или форматом обучающих данных.
вот так блин
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Гляди на документацию от метода predict: https://www.statsmodels.org/stable/generated/statsmodels.discrete.discrete_model.MNLogit.predict.html#statsmodels.discrete.discrete_model.MNLogit.predict
Он там первым аргументом принимает вовсе не матрицу с фичами, а какие-то params. Откуда они должны браться - вопрос к разработчикам statsmodels)
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А, понял
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Гляди на документацию от метода predict: https://www.statsmodels.org/stable/generated/statsmodels.discrete.discrete_model.MNLogit.predict.html#statsmodels.discrete.discrete_model.MNLogit.predict
Он там первым аргументом принимает вовсе не матрицу с фичами, а какие-то params. Откуда они должны браться - вопрос к разработчикам statsmodels)
прикол в том, что я так уже делал, но на простом примере
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Прикол в том, что метод predict надо вызывать не у model, а у объекта, который возвращает её метод fit!
Вот минимальный пример
import pandas as pd
from statsmodels.discrete.discrete_model import MNLogit
df = pd.DataFrame({'x': [1,2,3,4,5,6,7,8,9], 'y': [1,2,3,1,2,3,1,2,3]})
model = MNLogit.from_formula('y~x', df)
result = model.fit()
result.predict(df)
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Прикол в том, что метод predict надо вызывать не у model, а у объекта, который возвращает её метод fit!
Вот минимальный пример
import pandas as pd
from statsmodels.discrete.discrete_model import MNLogit
df = pd.DataFrame({'x': [1,2,3,4,5,6,7,8,9], 'y': [1,2,3,1,2,3,1,2,3]})
model = MNLogit.from_formula('y~x', df)
result = model.fit()
result.predict(df)
крыша совсем едет
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Прикол в том, что метод predict надо вызывать не у model, а у объекта, который возвращает её метод fit!
Вот минимальный пример
import pandas as pd
from statsmodels.discrete.discrete_model import MNLogit
df = pd.DataFrame({'x': [1,2,3,4,5,6,7,8,9], 'y': [1,2,3,1,2,3,1,2,3]})
model = MNLogit.from_formula('y~x', df)
result = model.fit()
result.predict(df)
уже что то. Блин, теперь как classification_report посчитать. Какой то max взять что ли?
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Сергей Васильев
уже что то. Блин, теперь как classification_report посчитать. Какой то max взять что ли?
Да, бери y_pred.idxmax(axis=1), чтобы получить порядковый номер самого вероятного класса.
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Да, бери y_pred.idxmax(axis=1), чтобы получить порядковый номер самого вероятного класса.
print(classification_report(y_pred= y_pred.max(axis=1), y_true=test["PKT_CLASS"]))
такая конструкция не помогла
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Да, бери y_pred.idxmax(axis=1), чтобы получить порядковый номер самого вероятного класса.
idxmax, я поправил
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Чувак, ты вообще сам понимаешь, что кодишь?)
источник