Если прям кратко: копать пхп скрипты на данном этапе не стоит, лучше начать копать в сторону кролика и его коннектов, потому что это именно ошибка кролика. И не играет роли, что у тебя коннект прописан правильно, потому что иногда он не работает. Вот эти "иногда" случаи тебе и нужно обуздать. Если ты начнёшь с пхп скриптов, вероятно, ты просто потратишь больше времени и не факт, что решишь проблему (найдёшь источник такого поведения).
Начал делать по конфигам TCP кролика, что ты скинул.
по рекомендациям из доки выставил
{tcp_listen_options, [binary,
{packet, raw},
{reuseaddr, true},
{backlog, 4096},
{sndbuf, 196608},
{recbuf, 196608},
{nodelay, true},
{exit_on_close, false}]}
улимит проверил ещё раз, там значение в 20млн.
теперь хер знает куда дальше копать