Da Wikipedia, l'enciclopedia libera.
# esempio di linea di comando da usare (tutto su una riga sola!):
# python replace.py -log -xml:dumps/itwiki-*-current.xml -except:"[Cc]ategoria:[Ww]ikipedia[_ ]Bar"
# -except:"accento si mette sulle vocali" -except:"pronome personale di terza persona riflessivo" -namespace:0
# -namespace:4 -namespace:6 -namespace:10 -namespace:12 -namespace:14 -namespace:100 -regex -fix:errori_comuni
#
# i namespaces sono: principale(0), wikipedia(4), immagine(6), template(10),
# aiuto(12), categoria(14) e portale(100)
#
# gli "-except" servono ad escludere le sottopagine del bar, e le pagine "Sé (grammatica)", "Accento (ortografia)"
# inoltre questa serie di voci deve esse controllata manualmente dopo le sostituzioni: [[Lingue retoromanze]],
# [[Lingua corsa]], [[Giacomo Leopardi]], [[Vanitas vanitatum et omnia vanitas]], [[Carlo Porta]],
# [[Lingua ladina]], [[È asciuto pazzo 'o padrone]]
#
'errori_comuni': {
'regex': True,
'msg': {
'it':u'Bot: sistemo degli [[Wikipedia:Bot/Richieste/Errori_comuni|errori comuni]]...'
},
'replacements': [
(u"(?m)([ .,:;\n\r^][Ss])cenza([ .,:;\n\r$])", ur"\1cienza\2"),
(u"(?m)([ .,:;\n\r^][Ss])cenze([ .,:;\n\r$])", ur"\1cienze\2"),
(u"(?m)([ .,:;\n\r^][Cc])oscenza([ .,:;\n\r$])", ur"\1oscienza\2"),
(u"(?m)([ .,:;\n\r^][Cc])oscente([ .,:;\n\r$])", ur"\1osciente\2"),
(u"(?m)([ .,:;\n\r^][Cc])oscenti([ .,:;\n\r$])", ur"\1oscienti\2"),
(u"(?m)([ .,:;\n\r^][Ii])ncoscenza([ .,:;\n\r$])", ur"\1ncoscienza\2"),
(u"(?m)([ .,:;\n\r^][Ii])ncoscente([ .,:;\n\r$])", ur"\1ncosciente\2"),
(u"(?m)([ .,:;\n\r^][Ii])ncoscenti([ .,:;\n\r$])", ur"\1ncoscienti\2"),
(u"(?m)([ .,:;\n\r^][Oo])nniscente([ .,:;\n\r$])", ur"\1nnisciente\2"),
(u"(?m)([ .,:;\n\r^][Oo])nniscenti([ .,:;\n\r$])", ur"\1nniscienti\2"),
(u"(?m)([ .,:;\n\r^][Cc])onoscienza([ .,:;\n\r$])", ur"\1onoscenza\2"),
(u"(?m)([ .,:;\n\r^][Cc])onosciente([ .,:;\n\r$])", ur"\1onoscente\2"),
(u"(?m)([ .,:;\n\r^][Cc])onoscienti([ .,:;\n\r$])", ur"\1onoscenti\2"),
(u"(?m)([ .,:;\n\r^][Rr])iconoscienza([ .,:;\n\r$])", ur"\1iconoscenza\2"),
(u"(?m)([ .,:;\n\r^][Rr])iconosciente([ .,:;\n\r$])", ur"\1iconoscente\2"),
(u"(?m)([ .,:;\n\r^][Rr])iconoscienti([ .,:;\n\r$])", ur"\1iconoscenti\2"),
(u"(?m)([ .,:;\n\r^][Ss])ufficenza([ .,:;\n\r$])", ur"\1ufficienza\2"),
(u"(?m)([ .,:;\n\r^][Ii])nsufficenza([ .,:;\n\r$])", ur"\1nsufficienza\2"),
(u"(?m)([ .,:;\n\r^][Dd])eficenza([ .,:;\n\r$])", ur"\1eficienza\2"),
(u"(?m)([ .,:;\n\r^][Ss])ufficente([ .,:;\n\r$])", ur"\1ufficiente\2"),
(u"(?m)([ .,:;\n\r^][Ss])ufficenti([ .,:;\n\r$])", ur"\1ufficienti\2"),
(u"(?m)([ .,:;\n\r^][Ii])nsufficente([ .,:;\n\r$])", ur"\1nsufficiente\2"),
(u"(?m)([ .,:;\n\r^][Ii])nsufficenti([ .,:;\n\r$])", ur"\1nsufficienti\2"),
(u"(?m)([ .,:;\n\r^][Dd])eficente([ .,:;\n\r$])", ur"\1eficiente\2"),
(u"(?m)([ .,:;\n\r^][Dd])eficenti([ .,:;\n\r$])", ur"\1efficienti\2"),
(u"(?m)([ .,:;\n\r^][Cc])oefficente([ .,:;\n\r$])", ur"\1oefficiente\2"),
(u"(?m)([ .,:;\n\r^][Cc])oefficenti([ .,:;\n\r$])", ur"\1oefficienti\2"),
(u"(?m)([ .,:;\n\r^][Pp])rospicente([ .,:;\n\r$])", ur"\1rospiciente\2"),
(u"(?m)([ .,:;\n\r^][Pp])rospicenti([ .,:;\n\r$])", ur"\1rospicienti\2"),
(u"(?m)([ .,:;\n\r^][Pp])ropio([ .,:;\n\r$])", ur"\1roprio\2"),
(u"(?m)([ .,:;\n\r^][Pp])ropietà([ .,:;\n\r$])", ur"\1roprietà\2"),
(u"(?m)([ .,:;\n\r^][Pp])ropietari([ .,:;\n\r$])", ur"\1roprietari\2"),
(u"(?m)([ .,:;\n\r^][Pp])ropietaria([ .,:;\n\r$])", ur"\1roprietaria\2"),
(u"(?m)([ .,:;\n\r^][Pp])ropietarie([ .,:;\n\r$])", ur"\1roprietarie\2"),
(u"(?m)([ .,:;\n\r^][Pp])ropietario([ .,:;\n\r$])", ur"\1roprietario\2"),
(u"(?m)([ .,:;\n\r^][Cc])ompropietari([ .,:;\n\r$])", ur"\1omproprietari\2"),
(u"(?m)([ .,:;\n\r^][Cc])ompropietaria([ .,:;\n\r$])", ur"\1omproprietaria\2"),
(u"(?m)([ .,:;\n\r^][Cc])ompropietarie([ .,:;\n\r$])", ur"\1omproprietarie\2"),
(u"(?m)([ .,:;\n\r^][Cc])ompropietario([ .,:;\n\r$])", ur"\1omproprietario\2"),
(u"(?m)([ .,:;\n\r^][Aa])ppropiato([ .,:;\n\r$])", ur"\1ppropriato\2"),
(u"(?m)([ .,:;\n\r^][Aa])ppropiati([ .,:;\n\r$])", ur"\1ppropriati\2"),
(u"(?m)([ .,:;\n\r^][Aa])ppropiata([ .,:;\n\r$])", ur"\1ppropriata\2"),
(u"(?m)([ .,:;\n\r^][Aa])ppropiate([ .,:;\n\r$])", ur"\1ppropriate\2"),
(u"(?m)([ .,:;\n\r^][Aa])ereoporto([ .,:;\n\r$])", ur"\1eroporto\2"),
(u"(?m)([ .,:;\n\r^][Aa])ereoporti([ .,:;\n\r$])", ur"\1eroporti\2"),
(u"(?m)([ .,:;\n\r^][Aa])reoporto([ .,:;\n\r$])", ur"\1eroporto\2"),
(u"(?m)([ .,:;\n\r^][Aa])reoporti([ .,:;\n\r$])", ur"\1eroporti\2"),
(u"(?m)([ .,:;\n\r^][Aa])reazione([ .,:;\n\r$])", ur"\1erazione\2"),
(u"(?m)([ .,:;\n\r^][Mm])etereologia([ .,:;\n\r$])", ur"\1eteorologia\2"),
(u"(?m)([ .,:;\n\r^][Mm])etereologico([ .,:;\n\r$])", ur"\1eteorologico\2"),
(u"(?m)([ .,:;\n\r^][Cc])orrezzione([ .,:;\n\r$])", ur"\1orrezione\2"),
(u"(?m)([ .,:;\n\r^][Ee])ccezzione([ .,:;\n\r$])", ur"\1ccezione\2"),
(u"(?m)([ .,:;\n\r^][Ee])ccezzionale([ .,:;\n\r$])", ur"\1ccezionale\2"),
(u"(?m)([ .,:;\n\r^][Ee])ccezzionali([ .,:;\n\r$])", ur"\1ccezionali\2"),
(u"(?m)([ .,:;\n\r^][Pp])rofiquo([ .,:;\n\r$])", ur"\1roficuo\2"),
(u"(?m)([ .,:;\n\r^][Cc])osidetto([ .,:;\n\r$])", ur"\1osiddetto\2"),
(u"(?m)([ .,:;\n\r^][Ss])opratutto([ .,:;\n\r$])", ur"\1oprattutto\2"),
(u"(?m)([ .,:;\n\r^][Ss])enonch[èé]([ .,:;\n\r$])", ur"\1ennonché\2"),
(u"(?m)([ .,:;\n\r^][Oo])vverossia([ .,:;\n\r$])", ur"\1vverosia\2"),
(u"(?m)([ .,:;\n\r^][Aa])ggiottaggio([ .,:;\n\r$])", ur"\1ggiotaggio\2"),
(u"(?m)([ .,:;\n\r^][Aa])pprovigionamento([ .,:;\n\r$])", ur"\1pprovvigionamento\2"),
(u"(?m)([ .,:;\n\r^][Pp])ocanzi([ .,:;\n\r$])", ur"\1oc'anzi\2"),
(u"(?m)([ .,:;\n\r^][Dd])accordo([ .,:;\n\r$])", ur"\1'accordo\2"),
(u"(?m)([ .,:;\n\r^][Dd])altronde([ .,:;\n\r$])", ur"\1'altronde\2"),
(u"(?m)([ .,:;\n\r^][Ff])in'ora([ .,:;\n\r$])", ur"\1inora\2"),
(u"(?m)([ .,:;\n\r^][Aa])ccellerare([ .,:;\n\r$])", ur"\1ccelerare\2"),
(u"(?m)([ .,:;\n\r^][Ss])è([ .,:;\n\r$])", ur"\1é\2"),
# Disabilitati per troppe polemiche
# (u"(?m)([ .,:;\n\r^][Ss])e stesso([ .,:;\n\r$])", ur"\1é stesso\2"),
# (u"(?m)([ .,:;\n\r^][Ss])e stessa([ .,:;\n\r$])", ur"\1é stessa\2"),
# Aggiunti su condiglio di Nemo_bis
# (u"(?m)([ .,:;\n\r^][Aa]) se([ .,:;\n\r$])", ur"\1 sé\2")
(u"(?m)([ .,:;\n\r^][Pp])ercui([ .,:;\n\r$])", ur"\1er cui\2"),
(u"(?m)([ .,:;\n\r^][Qq])ual'è([ .,:;\n\r$])", ur"\1ual è\2"),
(u"(?m)([ .,:;\n\r^][Ff])ù([ .,:;\n\r$])", ur"\1u\2"),
(u"(?m)([ .,:;\n\r^][Ff])à([ .,:;\n\r$])", ur"\1a\2"),
(u"(?m)([ .,:;\n\r^][Dd])ò([ .,:;\n\r$])", ur"\1o\2"),
]
},