Стандартные настройки для архивации выглядят вот так
wget --warc-cdx -b --mirror -w 1 --random-wait -e robots=off --limit-rate=512k --cookies=on --keep-session-cookies --no-check-certificate -v --save-cookies=[domain].cookie.txt -o [domain].log domain --warc-file=[domain]
расшифровка опций:
--mirror - зеркалирование сайта, чтобы можно было делать оффлайн навигацию
--warc-cdx - генерировать CDX файл для WARC файла
--warc-file - сохранение сайта в единый WARC файл веб архива
--save-cookies - файл для сохранения кук
--keep-session-cookies - сохранять сессионные куки
--cookies - поддерживать куки
--limit-rate - ограничивать выгрузку этим лимитом
-w 1 - пауза между запросами в секундах, для сайтов имеющих блокировки по частоте запросов
-e robots=off - игнорировать инструкции в robots.txt
--random-wait - произвольное время ожидания между запросами, для сайтов умеющих отслеживать ожидание
-b - запуск на заднем фоне (background)
-v - подробный вывод о запросах
--no-check-certificate - не проверять https сертификаты, помогает когда сертификаты устаревают или невалидны
-o - файл для вывода логов
[domain] - название домена