а всякие тесты помогли не делать это таким мучительным?
а то я, грешно признаться, тесты использовал в пакетах, скорее, чтобы поднять coverage потсфактум, проверяя работает ли функция, а не перед тем как начать разрабатывать, написав осмысленные тесты...
скажем, мы пошли брутальным путем
на самом деле, я плохо представляю, как это тестировать. наверное, ниндзя умеют, но на то они и ниндзя
вот, допустим, в пандах ввели новое обозначение для пропущенных, независимо от типа серии
как это тестировать в коде, который собирает данные и делает их них агрегаты для дашбордов - не очень понятно
аналогично - если вдруг они когда-нибудь решат не исключать NA-значения в значениях группирующей переменной при группировке, явно сломается очень многое. но как это хорошо оттестировать - непонятно.
плюс есть другие проблемы - иногда нарушается совместимость пакетов. типа, ты обновил пакет, в коде сейчас ничего не сломалось.
но какой-нибудь другой древний пакет, который использовал одну функцию из этого, взял и сломался. и увидишь ты это только в результате
так как кодовая база всяких отчетов и прочего уже очень большая, всюду проверки не воткнешь