Size: a a a

AI / Искусственный Интеллект

2019 July 22

DP

Defragmented Panda in AI / Искусственный Интеллект
so, you want your forest to solve a task that human cannot do, even given a long time for analysis?
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
I am not sure I understand
источник

О

Орхан in AI / Искусственный Интеллект
Кстати, хороший вопрос, самому стало интересно - как находить зависимости между фичами?
источник

DP

Defragmented Panda in AI / Искусственный Интеллект
Орхан
Кстати, хороший вопрос, самому стало интересно - как находить зависимости между фичами?
удалять одну и смотреть ухудшился ли результат модели - самый дорогой и точный метод
источник

О

Орхан in AI / Искусственный Интеллект
Я думаю это грубо, т.к. может быть парная зависимость, коррелирующая в точность предсказания
источник

DP

Defragmented Panda in AI / Искусственный Интеллект
Luke Skywalker
I am not sure I understand
you want to guess a cancer status

lets say a doctor wants to do the same

how would a doctor do this job?
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
Yes deleting 1 by 1 is also knows as backward feature elimination technique
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
I tried that already gave me 39 features out of 150
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
Defragmented Panda
you want to guess a cancer status

lets say a doctor wants to do the same

how would a doctor do this job?
Machine learning is all about finding pattern in data than humans cannot. Otherwise why use machine learning at all if humanly possible
источник

DP

Defragmented Panda in AI / Искусственный Интеллект
Орхан
Я думаю это грубо, т.к. может быть парная зависимость, коррелирующая в точность предсказания
можно сделать автоэнкодер

он конкретно эту задачу решает - восстановление потерянных данных имея большую часть данных

чем лучше восстанавливается фича если ее удалить - тем больше она предсказуема из других

это намного дешевле чем тренировать новую модкль на каждую удаленную фичу
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
Autoencoder is in neural networks right ? Unfortunately cannot use neural as data very less
источник

DP

Defragmented Panda in AI / Искусственный Интеллект
Luke Skywalker
Machine learning is all about finding pattern in data than humans cannot. Otherwise why use machine learning at all if humanly possible
im not saying its not possible

its just a question to determine how complex is your task
источник

О

Орхан in AI / Искусственный Интеллект
There were quite good count of materials when I googled feature selection
источник

О

Орхан in AI / Искусственный Интеллект
One I liked is: Correlation Matrix with Heatmap
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
I tried : hybrid feature selection like genetic algorithm/simulated annealing and wrapper feature selection like recursive feature elimination. But performance was best with accuracy of 69 only. Problem is most feature selection don't work good with mixed data
источник

О

Орхан in AI / Искусственный Интеллект
What do you mean - mixed?
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
Mixed : numeric+ categorical
источник

DP

Defragmented Panda in AI / Искусственный Интеллект
so, to summarize

you use random forests
you give it data like this:
age 18 - no
age 25 - yes
age 30 - no
blood pressure 100 - no
blood pressure 120 - yes
blood pressure 140 - no
female - no
male - yes (as a category?)

at the end you want to receive a chance of cancer for this data entry.

and you have a data values of real patients who were suffering cancer or not, and you check the performance of your forest against this data of real patients
источник

LS

Luke Skywalker in AI / Искусственный Интеллект
Can I share photo here of my data
источник

DP

Defragmented Panda in AI / Искусственный Интеллект
i think yes
источник