aspirer un site

Aspirer un site web avec wget

Dernière mise-à-jour: 17 août 2009

Vous avez trouvé un site web intéressant et vous voudriez enregistrer le site au complet sur votre disque dur pour pouvoir le consulter hors ligne ? Pas de problème, le programme wget fera très l'affaire. Wget est déjà installé dans Ubuntu.


D'abord, ouvrez un terminal dans le menu Applications -> Accessoires -> Terminal.

Dans l'exemple ci-dessous, le site sera téléchargé dans le répertoire courant où vous êtes. Si vous ne savez dans quel répertoire où vous êtes taper la commande pwd.

Exemple :
wget -r -k -np -T 10 -t 1 http://www.pedagonet.com/other/enigme13.html

-r : signifie que le téléchargement sera récursif (il télécharge aussi les liens de la page)

-k : permet de reconstituer le site localement afin d'être consultable hors connexion dans votre ordi (les liens sont modifié pour pointer localement)

-np empêche de remonter dans le répertoire parent.

-T 10 : Time connection. Le temps max en seconde pour aspirer un lien. Quand cette option est omis, un lien difficilement accessible peut ralentir considérablement l'aspiration du site.

-t 1 : nombre de tentative de connexion si il y a erreur 404 (pas de lien). Ici, on veut qu'il n'y ait qu'une seule tentative de connexion afin d'accélérer le traitement d'aspiration.


Connexion a la base impossible