Petites nouvelles du front
L'aspiration des zones privées fonctionne super bien avec wget, une fois qu'on balance les cookies au bon format (pas taper

, j'avais pas vu le blème).
Mais... Pour isoler une zone privée en particulier (ce qui serait plus pratique pour la suite - si le fofo n'est pas exporté vers phpBB et reste en archive flat/statique - pour accorder des droits d'accès spécifiques ; autrement ça va être un b*rdel sans nom, vu le nombre de cas possibles dans la combinatoire des droits), il faut préciser une accept list (-A ou --accept), autrement on downloade encore tout... Même en précisant une page/rubrique particulière comme
http://grand-sud-medieval.aceboard.fr/312954-5750-0-BAINS-PUBLICS.htm. Au départ, ça marche, mais wget trouve les liens vers la page d'accueil et c'est reparti pour un tour complet... Bonjour le nombre de downloads et d'uploads si on fait une capture complète pour chaque combinaison de droits possible...
Comme on peut faire des filtres du genre -A
312954-5750*.htm (pour reprendre l'exemple des Bains), je pense que ça devrait coller puisque la rubrique mère est référencée (ici,
5750), et toutes les pages filles reproduisent cette ref en plus de leur nom de fichier (genre 312954-
5750-7091-0-quelles-rubriques-supplementaires-souhaitez-vous.htm). Alors qu'une page dans une autre rubrique (type "http://grand-sud-medieval.aceboard.fr/312954-
5357-1503-1-PRESENTER-LUXE-INUTILE.htm") va présenter un ID de rubrique différent. Donc avec l'accept list, elle devrait être exclue du download. Enfin, si j'ai bien read TFM
