Взять разное количество слоёв, например 10, 20, 40. Взять разное количество нейронов на каждом слое, например 10, 50, 200. Итого получается 9 вариантов конфигураций. Обучить на каждом из них, желательно по нескольку раз, понять, при каких значениях ошибка меньше при приемлемом времени обучения. Сузить границы согласно полученным знаниям и повторить опыт. Делать до тех пор, пока не надоест, после чего взять типичную конфигурацию сети и обучать на ней до победного