итак, упрощенно, по моей памяти, я не специалист, я так, мимо пробегала, пока что я умею только в дата аналитику, до машинного обучения на полном серьезе руки еще не дошли:
мы берем упрощенную модельку ганглия, состоящую из нескольких слоев нейронов, даем этой системе "систему поощрения" (один из вроде трех способов), даем на первый слой нейронов входные данные и "запускаем жить" эту систему бесчисленное множество субъективного времени, называют это время "эпоха". каждое установленное количество эпох мы проверяем, что эта штука сделала, и если она сделала не то, что нам надо - мы "делаем ей больно", если все ок - "не делаем ей больно". повторяем до тех пор, пока наш младенчик не будет обыгрывать нави в доту.