Aide:Pywikipedia/replace.py
Un article de Wikipédia, l'encyclopédie libre.
Replace.py est un script en Python pour les bots Pywikipédia. Ce script permet d'effectuer des remplacements de texte. Lorsqu'il est lancé, il récupère les informations sur les pages à modifier à partir d'un dump XML, ou d'un fichier texte. Il peut également modifier une seule page.
Ce bot peut être lancé à l'aide des paramètres suivants :
- -xml
- Récupère les informations à partir d'un dump XML local (pour les dumps, voir http://download.wikimedia.org/). L'argument est utilisé avec la syntaxe
-xml:nomdefichier
.
- -file
- Travaille sur toutes les pages listées dans un fichier texte local. Le script interprètera chaque lien wiki (entre doubles crochets) pour modifier les articles. L'argument est utilisé avec la syntaxe
-file:nomdefichier
.
- -cat
- Travaille sur toutes les pages qui appartiennent à la catégorie spécifiée. La syntaxe est
-cat:nomcategorie
.
- -page
- Modifie uniquement la page spécifiée. La syntaxe est
-page:nompage
. Cet argument peut être employé plusieurs fois pour éditer un nombre multiple de pages.
- -ref
- Travaille sur toutes les pages liées à la page spécifiée. La syntaxe est
-ref:nompagereferee
.
- -start
- Travaille sur toutes les pages du wiki, en partant de la page donnée. Choisissez
-start:!
pour commencer depuis le tout début. Cette option est à éviter, excepté dans le cas où il n'existe aucun dump XML récent.
- -regex
- Utilise des expressions rationnelles pour faire les remplacements. Si cet argument n'est pas donné, le bot fera des remplacements de texte basiques.
- -except:XYZ
- Ignore les pages qui contiennent XYZ. Si l'argument
-regex
est donné, XYZ seront considérés comme des expressions rationnelles.
- -fix:XYZ
- Effectue l'une des tâches prédéfinies, données dans le dictionnaire 'fixes' défini dans ce fichier. L'argument
-regex
et les remplacements spécifiés seront ignorés si vous utilisez-fix
. - Les tâches prédinies actuellement disponibles sont :
- -namespace:n
- Numéro de l'espace de nom à traiter.
- -always
- Évite de devoir confirmer chaque remplacement. N'utilisez cet argument que si vous êtes certain que vous n'allez pas modifier certaines pages par erreur.
- Autres arguments
- Le premier argument est le texte initial (à corriger), le second est le nouveau texte. Si l'argument
-regex
est utilisé, le premier argument sera considéré comme une expression rationnelle, et le second pourra contenir des des chaînes de caractères comme \\1 ou \g<name>.
Note : Utilisez l'un des arguments -xml
ou -file
ou -page
, mais n'en utilisez pas plus d'un à la fois.
[modifier] Exemples
Si vous souhaitez changer des modèles de l'ancienne syntaxe (par exemple {{msg:ébauche}}) à la nouvelle syntaxe ({{ébauche}}), téléchargez un dump XML (table cur) à l'adresse http://download.wikimedia.org, puis utilisez la commande :
python replace.py -xml -regex "{{msg:(.*?)}}" "{{\1}}"
Si vous possédez un dump nommé foobar.xml et souhaitez faire des corrections typographiques (par exemple : Errreur -> Erreur), utilisez la commande :
python replace.py -xml:foobar.xml "Errreur" "Erreur"
S'il y a une page appelée 'John Doe' et que vous souhaitez convertir les balises HTML en syntaxe wiki, la commande est :
python replace.py -page:John_Doe -fix:HTML
Si vous lancez le bot sans les arguments, les remplacements à faire vous seront demandés plusieurs fois :
python replace.py -file:blah.txt
Le script demande à l'utilisateur avant de modifier un article. Il est recommandé de vérifie le résultat pour être sûr que le bot n'a pas introduit des erreurs (en particulier avec des mots mal orthographiés).
Il est possible de spécifier un groupe d'articles avec un fichier texte externe, contenant des liens wiki :
[[avion]] [[véhicule]] [[train]] [[automobile]]
Le bot est ensuite lancé à l'aide d'une commande du type :
python replace.py -file:liste_articles.txt "errreur" "erreur"