Le forum qui se la pète des BD-blogueurs modestes
 
AccueilAccueil  S'enregistrerS'enregistrer  Connexion  GRIBOUZINE  Gribouill'Town  

Partagez | 
 

 TUTO - Récupérer son blog (bêta)

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
Marguerite
Vache sacrée
avatar

Nombre de messages : 2895
Age : 43
Localisation : Angoulême
Date d'inscription : 03/03/2008

MessageSujet: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 7:27

Bonjour

Ce petit tuto vous montre comment récupérer son blog "en local" (c'est à dire sur son disque dur) pour pouvoir ensuite le balancer sur un ftp, par exemple. C'est aussi assez utile si, comme moi, vous avez posté d'un peu n'importe où et que vous souhaitez récupérer toutes vos images. La méthode présentée ici permet de récuperer :
- le design général du blog
- une page "style CSS" bien utile pour modifier le blog ensuite
- les posts (incluant bien-sûr les images, les éventuels "thumbnails")
- les commentaires
- La navigation pour le visiteur se fait comme "en ligne".

Elle ne permet pas (pour l'instant) :
- d'ajouter des "commentaires" sur la version disque dur

Je précise qu'il s'agit d'une récupération de blog type "miroir". Cette méthode ne sert pas à récuperer ses posts pour passer d'un hébergeur spécialisé en blog à un autre (canalblog à overblog par exemple). Le seul intérêt de l'utiliser dans ce cas là est pour récupérer les images.

Moino m'a signalé que si on souhaite migrer un blog vers Dotclear, il existe des plugin qui font la conversion. Après quelques recherches, j'ai trouvé les plugin "import blogs B2", "Ublog" et "Movable Type". Si votre objectif dans l'import/export est de passer sur dotclear, jetez un oeil à ces plugins, on ne sait jamais !



Enfin, nous allons essayer de générer un code html "propre", ce qui ne veut pas forcément dire "optimisé". Le tuto est réalisé à partir de mon blog (sur canalblog - 900 posts environ). A titre indicatif, la récupération du site dure environ 1h30 et génère à peu près 3000 fichiers (150 Mo) dont 1000 fichiers html environ. Si certains gribouillelandeurs veulent apporter des précisions pour un autre hébergeur, ils sont les bienvenus.

Ce tuto est en "bêta" pour l'instant, vous le suivez à vos risques et périls !



ETAPE 1 : Aspirer le blog

Nous allons "aspirer" le blog sur disque dur, en utilisant un petit logiciel libre et gratuit : Winhttrack (Google est ton ami).
C'est tout bête


Cliquez sur suivant


Choisir le nom du projet, le chemin dans lequel il sera sauvegardé


Entrer l'adresse du blog et choisir "définir les options"


Je conseille de ne toucher qu'aux options "filtres", httrack etant assez malin pour le reste. Vous pouvez éventuellement modifier le "contrôle de flux" si vous souhaitez changer le nombre de connexions simultanées, mais httrack prônant le principe de "connexion respectueuse", c'est déconseillé. Aspirer un site web n'est pas anodin. Aussi, meme si l'opération est longue, il est conseillé de rester dans le coin pour jeter un coup d'oeil de temps en temps à son écran, afin de s'assurer qu'on n'aspire pas tout le web ! Si vraiment vous ne pouvez pas rester à coté, je suggère de fixer une limitation en "taille" d'aspirage (onglet "limites"), par exemple 300Mo. Ainsi, meme si l'aspirateur se perd de lien en lien, vous ne remplirez pas votre disque dur.
Vous voyez dans ma fenetre les "filtres" que j'ai utilisé. Certains sont déjà présents par défaut. Je conseille d'aspirer le css, le js... de signaler explicitement aussi qu'on souhaite aspirer le gif et jpg. J'ai signalé par "-*.EXE" que je ne voulais aspirer aucun exécutable. Lors d'une première aspiration (l'aspiration est souvent empirique) j'ai remarqué que l'aspirateur avait des soucis avec Imageshak, sur lequel un de mes commentateurs avait mis un lien. J'ai donc précisé que je ne souhaitais rien aspirer de ce site.

A moins d'avoir un blog très simple (ou aucun commentaire avec des liens sur l'extérieur), la première tentative ne sera pas la bonne ! Mais courage ! Pour moi, c'est la seconde qui fut "parfaite".

Ne vous inquietez pas si vous voyez un nombre impressionnant de lien : l'aspirateur reconstitue toutes les pages, récupère les images éventuellement publiées ailleurs (moi, j'héberge ma bannière sur free par exemple)... Comme je le disais en intro, pour 900 posts, j'ai récupéré environ 3000 fichiers.



Etape 2: On vérifie
On clique sur "index.html", sur le disque dur, et on se ballade un peu sur le blog pour vérifier que tout va bien. Horreur ! On s'apercoit qu'on a aussi récupéré les PUBS de Canalblog, et que deux ou trois trucs pourraient être améliorés... Vous remarquerez sur l'avant dernière capture d'écran, colonne de gauche, que plein de "sites" ont été créés. Ne vous inquietez pas, c'est normal : De mon blog, il y a des images hébergées, par exemple sur bubbledog.free.fr, sur membres.lycos.fr etc... il s'agit de bannières ou d'images postées en "commentaires"...
Pas de panique ! On va faire du ménage. Mais avant, on fait une copie, hein, histoire de pas travailler directement sur le site récupéré...

Etape 3: Le grand ménage

1- Supprimer les pubs
La première chose à faire est de supprimer les pubs. Problême : j'ai récupéré 1000 fichiers html et je n'ai pas envie de tout faire à la main. Solution : il existe un petit logiciel, Remplacevite, qui se trouve ici http://www.codeodis.com/divers/developpement-de-logiciels.asp
qui est gratuit et qui fera ca très bien.
(nb: j'ai essayé des softs type searchandreplace ou findreplace... ils n'ont pas réussi car le code à remplacer contient des caractères bizarres, ce qui ne gêne pas "remplacevite).

Il y a plusieurs manières de supprimer une pub dans une page web. La plus simple (et surtout la plus "industrialisable",vu le nombre de pages) consiste à supprimer le petit code-script du HTML de la page.

Pour repérer ce code, ouvrez n'importe laquelle des pages HTML avec le bloc-note et essayez de repérer l'adresse qui renvoie la pub. Sur Canalblog, il s'agit de ads.canalblog... Sélectionnez le code autour de cette adresse. Sur canalblog, il faut sélectionner

Citation :
<!--
if (!document.phpAds_used) document.phpAds_used = ',';
phpAds_random = new String (Math.random()); phpAds_random = phpAds_random.substring(2,11);
document.write ("<" + "script language='JavaScript' type='text/javascript' src='");
document.write ("http://ads.canalblog.com/adjs.php?n=" + phpAds_random);
document.write ("&amp;what=zone:65");
document.write ("&amp;exclude=" + document.phpAds_used);
if (document.referer)
document.write ("&amp;referer=" + escape(document.referer));
document.write ("'><" + "/script>");
//-->


Démarrez "Remplacevite" et utilisez l'onglet "Dans le contenu des fichiers"

Copiez collez le code à supprimer dans la fenetre du haut. cochez "inclure les sous dossiers, respecter la casse" et "mots entiers uniquement". faites gaffe, hein, c'est du code ! On travaille que sur des COPIES !
Choisissez en dessous le "dossier racine" (celui ou vous avez copié votre site) et le type de fichiers. Sur Canalblog, il s'agit de *.html . Sur d'autres hébergeurs, il peut s'agir de *.htm - je déconseille d'utiliser le *.* (il faut mieux faire plusieurs étapes en sachant ce qu'on fait que de tirer au bazooka sur votre site). Vous pouvez laisser la fenêtre "remplacer" vide (si vous souhaitez simplement supprimer la pub) ou mettre du code à vous : par exemple de la pub qui VOUS rapporte, ou une bannière, ou du n'importe quoi.

Cliquez sur "Rechercher / rafraichir", Remplacevite listera les fichiers concernés. Puis "appliquer le remplacement". En cas d'erreur, vous pourrez toujours annuler (ce qui est bien pratique). Attention , vos corrections ne seront définitive que quand vous aurez cliqué sur "QUITTER". Ne quittez pas l'application "sauvagement".



ETAT DU BLOG APRES CETTE ETAPE
Voilà, j'en suis là. J'ai donc sur disque-dur mon blog, sans pub. On peut naviguer dedans comme si on était en ligne. On voit les coms etc...

A améliorer (je le ferai d'ici peu et continuerai alors ce tuto) : On voit toujours sur les pages la possibilité de poster des commentaires. Hors, si on rempli les champs et qu'on clique sur "'Publier", il ne se passe rien. Il n'y a pas d'erreur, mais la page est rechargée sans le commentaire que l'on vient d'entrer (ce qui est logique car aucun script n'est relié aux pages). Ce que je me propose donc, c'est de remplacer ce formulaire par une phrase du type "Les commentaires sont fermés pour ce billet", dans un premier temps. On ne peut pas utiliser la méthode utilisée pour les pubs car le code change à chaque fois. Une solution serait peut etre de fermer les commentaires AVANT de faire l'extraction web (et de les réouvrir après) mais bon, on devrait pouvoir trouver mieux Smile

Suite du tuto à une date indéterminée !


Dernière édition par Marguerite le Lun 9 Juin 2008 - 9:37, édité 6 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://chezmarguerite.canalblog.com
Samboyy
Admin
Admin
avatar

Nombre de messages : 1469
Age : 35
Localisation : Lyon
Date d'inscription : 19/12/2007

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 7:33

Marguerite était-elle toujours aussi douée ?? Wink

_________________
http://samboyy.free.fr
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://samboyy.free.fr
Marguerite
Vache sacrée
avatar

Nombre de messages : 2895
Age : 43
Localisation : Angoulême
Date d'inscription : 03/03/2008

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 7:53

contente si ca peut servir ! Si vous avez l'expérience avec d'autres hébergeurs....
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://chezmarguerite.canalblog.com
jojo
distributeur de bonne humeur
avatar

Nombre de messages : 1503
Age : 39
Localisation : Moulins (enfin Yzeure en fait)
Date d'inscription : 07/12/2007

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 8:00

Mais c'est carrément génial !!! justement moi j'ai perdu des images (à cause de transferts et tout ) et elle se trouve sur mon ancien blog, je vais donc tenter de les récupérer avec ta méthode Marg ;-) Trop bien !!! cheers
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://jojoletirebouchon.com
Marguerite
Vache sacrée
avatar

Nombre de messages : 2895
Age : 43
Localisation : Angoulême
Date d'inscription : 03/03/2008

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 8:12

Merci ! Je sais que je suis assez géniale !
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://chezmarguerite.canalblog.com
Riff
dieu celtique nudiste
avatar

Nombre de messages : 4860
Age : 41
Localisation : Breizh
Date d'inscription : 09/05/2007

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 8:25

attation je me permet de transférer ce message en catégorie "boites à crayon".

_________________
http://ysckemia.eklablog.fr

"pourquoi contredire une femme, il suffit d'attendre qu'elle change d'avis"
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://ysckemia.eklablog.fr
Marguerite
Vache sacrée
avatar

Nombre de messages : 2895
Age : 43
Localisation : Angoulême
Date d'inscription : 03/03/2008

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 8:28

tu as bien fait ! J'ai hésité sur l'endroit où le poster ! Je pense qu'à terme, on devrait pouvoir faire une tite rubrique "tuto" sur le site, hein Moino ?

Nb : Avant que Riff ne me tape, promis, je "resize" les images dans la journée !
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://chezmarguerite.canalblog.com
Invité
Invité



MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Lun 9 Juin 2008 - 10:15

Samboyy a écrit:
Marguerite était-elle toujours aussi douée ?? Wink

Bien sûr ! c'est une vache Geek, ne l'oublions pas !!! Very Happy

Bon sinon, moi si jamais je passe de Dotclear 1 à Dotclear 2 sur mon compte free... je vous ferai un petit tuto expliquant comment j'ai fais Wink
Revenir en haut Aller en bas
jojo
distributeur de bonne humeur
avatar

Nombre de messages : 1503
Age : 39
Localisation : Moulins (enfin Yzeure en fait)
Date d'inscription : 07/12/2007

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Mar 17 Juin 2008 - 14:28

Heuuu je sais pas si c'est trop exactement le thème ... mais j'aimerais récupérer toutes les images une à une d'une page html (en fait j'avais mis une image sur une page d'overblog) et j'ai du mal à les retrouver puis j'aimerais bien les réorganiser autrement ... vous avez une idée de comment faire ?
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://jojoletirebouchon.com
Marguerite
Vache sacrée
avatar

Nombre de messages : 2895
Age : 43
Localisation : Angoulême
Date d'inscription : 03/03/2008

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Mar 17 Juin 2008 - 14:36

J'ai rien compris à ta question ! Smile

Toutes tes images sont sur la même page ?
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://chezmarguerite.canalblog.com
jojo
distributeur de bonne humeur
avatar

Nombre de messages : 1503
Age : 39
Localisation : Moulins (enfin Yzeure en fait)
Date d'inscription : 07/12/2007

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Mar 17 Juin 2008 - 14:37

oui exactement !!!
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://jojoletirebouchon.com
Marguerite
Vache sacrée
avatar

Nombre de messages : 2895
Age : 43
Localisation : Angoulême
Date d'inscription : 03/03/2008

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Mar 17 Juin 2008 - 14:38

bin si t'as pas bcp d'images, le plus rapide est le clicdroit sur chaque image (uhuh) et si t'en a bcp, l'étape 1 de ma méthode "aspiration" peut te servir. Comme ca tu récupère tout, pi t'efface les fichiers HTML qui t'interessent pas !
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://chezmarguerite.canalblog.com
jojo
distributeur de bonne humeur
avatar

Nombre de messages : 1503
Age : 39
Localisation : Moulins (enfin Yzeure en fait)
Date d'inscription : 07/12/2007

MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Mar 17 Juin 2008 - 14:53

Merci !!! je vais tenter comme ça Very Happy
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://jojoletirebouchon.com
Invité
Invité



MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Jeu 10 Juil 2008 - 16:15

Ça a l'air génial mais j'ai rien compris Shocked scratch
Revenir en haut Aller en bas
Invité
Invité



MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Jeu 10 Juil 2008 - 17:27

C'est parce que t'es pas encore assez geek Wink ... ou informaticienne, tout simplement ! Smile
Revenir en haut Aller en bas
Invité
Invité



MessageSujet: Re: TUTO - Récupérer son blog (bêta)   Jeu 10 Juil 2008 - 17:37

Si si, je suis assez geek crois moi Very Happy Par contre informaticienne... lol!
Revenir en haut Aller en bas
Contenu sponsorisé




MessageSujet: Re: TUTO - Récupérer son blog (bêta)   

Revenir en haut Aller en bas
 
TUTO - Récupérer son blog (bêta)
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» tuto dinette au crochet...............et autre
» Tuto cigale en patch ....chez Celaceci
» Le bouton Planète couture sur nos blogs- Tutos
» Mettre un "Design Blog" dans over-blog (modifier la feuille de style .css)
» tuto sac cabas ecolo pliable ...chez pamina

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
GRIBOUILLELAND :: Notre Communauté :: L'atelier :: Informatique & cie...-
Sauter vers: