New Immissions/Updates:
boundless - educate - edutalab - empatico - es-ebooks - es16 - fr16 - fsfiles - hesperian - solidaria - wikipediaforschools
- wikipediaforschoolses - wikipediaforschoolsfr - wikipediaforschoolspt - worldmap -

See also: Liber Liber - Libro Parlato - Liber Musica  - Manuzio -  Liber Liber ISO Files - Alphabetical Order - Multivolume ZIP Complete Archive - PDF Files - OGG Music Files -

PROJECT GUTENBERG HTML: Volume I - Volume II - Volume III - Volume IV - Volume V - Volume VI - Volume VII - Volume VIII - Volume IX

Ascolta ""Volevo solo fare un audiolibro"" su Spreaker.
CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Utilisateur:Vincent Ramos/Scripts - Wikipédia

Utilisateur:Vincent Ramos/Scripts

Un article de Wikipédia, l'encyclopédie libre.

[modifier] Convertisseur de texte utf-8 en latin-1 avec entités html pour les pages de Wikipédia

Ceci étant mon premier script, merci de votre indulgence. Il m'est cependant bien pratique, et pouvant l'être pour d'autres éditeurs, je pense utile de le rendre public.

#!/bin/sh 
# Ce script convertit un fichier texte utf-8 en latin-1. Il conserve les caractères non inclus dans latin-1 en les transformant en
# entités html. Le résultat obtenu peut être directement collé dans une page de Wikipédia dont le jeu de caractères est 
#latin-1. Recode doit être installé pour que le script fonctionne, disponible ici <http://recode.progiciels-bpi.ca/>.
#Auteur de ce modeste script : Vincent Ramos <siva-nataraja(à)alussinan.org>.
#License : GNU.

#Se placer par défaut sur le bureau.
cd ~/Desktop

echo -n "Nom du fichier à convertir : "
read fichier

#Si le nom du fichier à convertir représente un fichier existant et si la chaîne tapée n'est pas vide, le script propose 
#plusieurs possibilités.
if [ -f $fichier ] && [ -n "$fichier" ] ;
        then
                echo -n "Écraser le fichier (oui par défaut) ? "
                read reponse
                        case $reponse in
                                non)
#Si l'on ne désire pas écraser le fichier d'origine, un fichier « sortie_wiki.txt » sera crée.
                                        fichier2=sortie_wiki.txt;;
                                oui)
                                        fichier2=$fichier;;
                                *)
#Toute absence de réponse valide (dont l'absence de réponse pure) est interprétée comme un « oui ». 
                                        fichier2=$fichier;;
                        esac
#D'abord, le fichier est recodé depuis utf-8 vers html, les caractères non ASCII devenant des entités html.
                recode -i ..html < $fichier > temp.txt
#Ensuite, on repasse à utf-8. L'option -d de recode permet de ne convertir que les caractères propres à latin-1. De sorte, le 
#fichier d'arrivé ne contient, comme entités numériques, que celles qui sont exclues de latin-1.
                recode -d -i html..u8 < temp.txt > $fichier2
#Un peu de maintenance : on se débarrasse des fichiers temporaires.
                rm temp.txt
                echo "Opération correctement effectuée."
        else 
        
#Si le nom de fichier indiqué au départ n'est pas valide ou bien est nul, le script recherche un fichier « wiki.txt ». Cela permet 
#d'accélérer les opérations : il suffit d'utiliser par défaut un fichier portant ce nom pour éviter de l'entrer à l'invite.
                echo "Fichier introuvable ! Utilisation de « wiki.txt » avec remplacement par défaut."
                if [ -f "wiki.txt" ] ;
                        then
                                recode -i ..html < wiki.txt > temp.txt
                                recode -d -i html..u8 < temp.txt > wiki.txt
                                rm temp.txt
                                echo "Opération correctement effectuée."
                        else 
#S'il n'existe cependant pas de fichier « wiki.txt », le script l'indique sans n'avoir pu modifier quoi que ce soit.
                                echo "Impossible de parachever l'opération : aucun fichier accessible."
                fi      
fi

[modifier] Correcteur d'espaces insécables

#!/bin/sh
#Ce simple script permet de corriger les documents (dont de nombreuses pages de Wikipédia) 
#dans lesquels les espaces insécables ont été remplacées par des espaces justifiantes 
#simples, pour des raisons diverses. La plupart du temps, il s'agit de documents traités
#par un logiciel bogué (de nombreux navigateurs le sont sur ce point) qui a détruit les
#insécables en question.
#Auteur : Vincent Ramos.
#Licence : GNU

cd ~/Desktop
#On se place par défaut sur le bureau.

echo -n "Nom du fichier à traiter : "
read fichier

#S'il n'existe pas de fichier ou l'utilisateur n'entre rien, le script ne modifie rien. 
#Dans le cas contraire, il écrasera le fichier par la version corrigée.

if [ -f $fichier ] && [ -n "$fichier" ] ; 

        then
                replace " ;" "²;" " :" "²:" " ?" "²?" " !" "²!" "« " "«²" " »" "²»"< $fichier > temp.txt
#Pour des raisons de sécurité, les espaces insécables, qui pourraient être détruites par le navigateur, 
#sont remplacées ici par le caractère <²> qu'il conviendra de corriger avant d'utiliser le script, par 
#un « replace "²" "<insérer une espace insécable>" -- <nom du script> », par exemple.

                mv temp.txt $fichier
                
                echo "Opération correctement effectuée."
        else
                echo "Aucun fichier à traiter."
fi
Fondation Wikimedia
Ceci est la page personnelle d'un contributeur de Wikipédia, elle ne fait donc pas partie de l'espace encyclopédique.

Si vous accédez à cette page sur un site autre que Wikipédia, c'est que vous êtes sur un site miroir ou un site faisant de la réutilisation de contenus. Prenez note que cette page n'est peut-être pas à jour et que la personne identifiée n'a probablement aucune affiliation avec le site sur lequel vous vous trouvez. L'original de cette page se trouve sur http://fr.wikipedia.org/wiki/Utilisateur:Vincent_Ramos/Scripts .

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu