Léa-Linux & amis :   LinuxFR   GCU-Squad   Zarb.Org   GNU
Aspiration des images d'un blog impossible
Envoyé par: veners

Bonjour toutes et tous,

Avec mes excuses c'est un peu par urgence que je me permet de poster. Je vais essayer de faire concis.
Nous avons des raisons de penser qu'un blog satirique existant animé par des amis d'un presque pays du moyen orient est sous contrainte: depuis hier il n'est plus accessible dans le pays en question par modification des dns locales sans doute déjà. Nous émettons l'hypothèse qu'une vitesse supérieure puisse être passée et nous voulons mirrorer d'urgence, au moins sauvegarder ce qui n'a jamais été fait (je sais, je me tue à le dire).
Dans ce but j'ai tenté une brutale aspiration du blog complet avec la commande:
wget -r -k -E -np [<http] site>
Mais j'ai constaté que les images et d'autres objets (css, d'autres bricoles mais surtout les dessins !) n'étaient pas téléchargés. Ce n'est pas qu'ils aient l'air bien loin sur d'autres serveurs (les images sont à bp.blogspot.com) mais ce sont des requêtes que l'option "-r" ne semble pas autorisé à résoudre pour une raison que j'ignore et l'option "-k" écrit la requête Web résultante.
À tout hasard j'ai non moins sauvagement (après un laps quand même) réitéré avec un UserAgent, sait-on jamais :
wget -r -k -np --user-agent=Firefox [le_site]
Sans plus de succès.

Tout en continuant de chercher de mon coté je suis venu à la pêche à la formule magique smiling smiley nan j'déconne (quoique grinning smiley )
À l'aide siouplait

Poste le Thursday 20 October 2016 23:08:15
Répondre     Citer    
Re: Aspiration des images d'un blog impossible
Envoyé par: Jiel

Ce qui me vient à l'esprit, en dehors d'avoir un accès ssh au serveur hébergeant le blog, c'est de récupérer les dessins séparemment : faire un script qui récupère (grep) dans le code source des pages toutes les urls finissant en jpg, jpeg, png, gif, svg, les mets dans une liste qui est ensuite fournie à wget. Oui, ce n'est pas élégant, mais cela fonctionne.

Poste le Monday 31 October 2016 12:53:05
Répondre     Citer    

Veuillez vous authentifier auparavant pour commenter.

 

Ce forum !
Aspiration des images d'un blog impossible
Un problème avec une commande du shell ? Comment utiliser la crontab ? Vous avez des soucis pour la gestion réseau sous Linux ? Pour vous la gestion des utilisateurs/groupes est du chinois ? Etc... Posez donc vos questions ici.

Serveur hébergé par ST-Hebergement et Lost-Oasis / IRC hébergé par FreeNode / NS secondaire hébergé par XName
Sauf mention contraire, les documentations publiées sont sous licence Creative-Commons