Como usar WGET para copiar un website ó Como usar WGET para hacer backup de un website con Mac OS X

Todo programador o diseñador de sitios web debe de tener una lista de comandos útiles para manipular y configurar websites desde un terminal de comandos. Y uno de esos comandos UNIX es WGET. Yo he venido usando WGET en los últimos 10 años pero nunca le había dado tanta importancia y hace poco descubrí un parametro que hace mucho mas fácil mi trabajo.

Que hace WGET?

WGET simplemente baja los archivos de cualquier website, a través del protocol HTTP, HTPPS ó FTP. Es bastante útil si se usa en CRON Jobs o scripts. Para mas información de lo mucho que puedes hacer con este comando visita el sitio oficial de WGET.

Este tutorial esta enfocado para usuarios de Apple Mac OS X.

Como instalar WGET en Apple Mac OS X:

Desafortunadamente WGET no viene incluido con ninguna version de Apple Mac OS X, y CURL que es otro comando muy útil para transferir archivos y viene incluido en Apple Mac OS X  no es un reemplazo de WGET.
Lo primero que haremos es bajar la version 1.12 de WGET haciendo clic en el enlace o puedes ir directamente a: http://ftp.gnu.org/gnu/wget/wget-1.12.tar.gz 

Luego lo vamos a expandir desde la ventana de comandos usando tar
tar -xvzf wget-latest.tar.gz

Al finalizar la extracción debes de tener un directorio llamado wget-1.12. Abre ese directorio y ejecuta:
./configure

Si te aparece el siguiente error al finalizar el comando ‘configure’:

configure: error: --with-ssl was given, but GNUTLS is not available.

Vas a volver a correr el comando ‘configure’ pero esta vez, con el siguiente parámetro:

./configure --with-ssh=openssl

Una vez termine de configurar, haz el instalador:
make

Por último, procede a instalar WGET en tu Mac, debes de correr el siguiente comando con privilegios ROOT o Administrador:
sudo make install

Esto es todo, ya debes de tener instalado este poderoso comando en tu Apple Mac OS X, en /usr/local/bin/wget. Ahora solo necesitas probarlo, digamos que quieres bajar el index de un website:
wget http://www.example.com/
Esta es la forma más básica de usar este comando, simplemente escribes el URL completo del sitio que deseas bajar archivos. Ahora lo interesante es cuando empiezas a usar las diferentes opciones, por ejemplo: como bajar todas las imagenes y archivos CSS o JS que componen una página del website y asi poderla ver offline:
wget -p –convert-links http://www.example.com/index.html

Opciones Avanzadas

Ahora digamos que deseas bajar todos los archivos que componen un website, “mirror”, y así poder verlo offline, siempre y cuando el sitio sea estático, ó  para hacer un backup de algún website:
wget –mirror http://www.example.com/
Así obtendrás todos los archivos que componen el website, incluyendo todas las carpetas y dependencias del mismo.
Con las siguientes opciones también podras bajar todos los archivos del website, crear una carpeta independiente y crear un archivo con el LOG de todo lo que hizo:

wget -r -t1 http://www.example.com/ -o gnulog

Bueno, la lista de opciones es infinita, solo es cuestión de jugar con el comando. Por ahora espero hayan podido instalar este comando y le den uso propio.

Si tienen preguntas no duden en dejar un comentario, gracias.

2 thoughts on “Como usar WGET para copiar un website ó Como usar WGET para hacer backup de un website con Mac OS X

  1. Wget guarda el espejo en la carpeta en la que usted lo ejecuta. Si, por ejemplo, ejecuta wget desde su escritorio y realiza un espejo de http://www.gnu.org, creará una carpeta nueva en su escritorio llamada http://www.gnu.org que contiene todos los archivos de su espejo. Puede abrir los archivos HTML con un explorador web. La página de inicio se llamará index.html.

Add Comment