Ну я ваших скилов не знаю, но за месяц я бы писал обертку к готовому любому софту и в дипломе описывал бы теорию как тот софт работает.
Если путь джедая то вам надо: определить фичи на каждом фото, соотнести, выполнить преобразование в пространство по сопоставленным фичам, по полученному облаку точек получить 3д модель, и дальше по вкусу натягивать на него текстуры и прочее...
У меня есть один безумный алгоритм. Что если фотографировать объект сверху, тем самым получаем его размер. После этого фотографируем объект справа и слева, и в конце спереди и сзади, обрезаем фон. Потом все это переносим в 3д и склеиваем подгоняя по размеру фото сверху, возможно по схожим точкам и в итоге получается псевдо 3д