wget - скачать сайт целиком
wget -r -k -p -l 7 -E -nc http://site.com/
r | рекурсивно переходить по ссылкам на сайте |
k | преобразовал все ссылки в скаченных файлах таким образом, чтобы по ним можно было переходить на локальном компьютере (в автономном режиме) |
p | указывает на то, что нужно загрузить все файлы, которые требуются для отображения страниц (изображения, css и т.д.) |
l | определяет максимальную глубину вложенности страниц |
E | добавлять к загруженным файлам расширение .html |
nc | при использовании данного параметра существующие файлы не будут перезаписаны. Это удобно, когда нужно продолжить загрузку сайта, прерванную в предыдущий раз |
wget - скачать одну страницу
Найти битые ссылки
wget --spider -r -nd -nv -H -l 1 -w 2 -o run1.log http://site.ru
Картинки с другого домена
wget -r -k -p -E -nc -l 10 -H -D tilda.ws,static.tildacdn.com https://site.ru/