Рассуждения совершенно мне непонятные, они как-будто подразумевают либо дифференцирование дельта-функций, либо "прирост" KL дивергенций между парами атомов. И то, и другое не звучит как хороший план.
Я бы сказал так. По сути матрица фишера оценивает возможность оценить параметры по значению случайной величины. В случае дельта функции мы всегда можем восстановить точно, т.е. среди ваших вариантов это будет "large norm", хотя по факту - бесконечность.
Если бы она была сингулярная, то, например, по Крамеру-Рао у нас бы не было бы возможности оценить параметры с конечной дисперсией, что неверно.