Clasificación alfabética
Na Galipedia, a wikipedia en galego.
Este artigo está sendo traducido ao Galego por un usuario desta Wikipedia, por favor non o edite. Se o usuario non publica a tradución no prazo de trinta días, pasará á lista de páxinas para borrar.
Le terme classement alphabétique désigne deux notions distinctes d'ancienneté différente :
- la première est le classement des caractères d'un système d'écriture dans un ordre défini pour une langue donnée. Elle était déjà connue dans l'Antiquité ;
- la seconde consiste à généraliser ce classement à des mots de plusieurs lettres. Cette découverte-là ne s'est faite qu'à Venise au début de la Renaissance. Son auteur l'expose dans la préface d'un dictionnaire qui a été le premier présenté de cette façon. Il est significatif de constater que le dictionnaire lui-même comprend plusieurs erreurs de placements de mots, mais moins à la fin qu'au début, ce qui suggère que l'auteur a lui-même mis un certain temps à maîtriser son propre système (source : Donald Knuth, The Art of Computer Programming, tome III : « Sorting and searching »).
Índice |
[editar] Principes
Le principe fondamental consiste à comparer deux mots, caractère par caractère.
Si les n premiers caractères sont identiques, on prend le suivant. Si le n-ième caractère diffère, l'ordre est établi. Si le mot est fini, le mot est considéré comme venant en premier.
Il convient donc pour classer correctement de connaître :
- l'ordre dans lequel sont classées les lettres d'un alphabet donné, ordre qui dépend de règles historiques différant d'une langue à l'autre même si elles utilisent un alphabet très proche ;
- l'existence de graphèmes complexes (ligatures, digrammes) à prendre en compte (dans une langue, tel digramme comptera pour une lettre et aura son rang, dans telle autre, non).
[editar] Origines
Les écritures alphabétiques, syllabiques ou alphasyllabiques du monde dotées d'une histoire ancienne ont toutes établi un classement de leurs graphèmes, tâche facilitée par le nombre réduit de signes. Les écritures logographiques, quant à elles, devant le nombre important de caractères, n'ont pu suivre de règles simples. On trouve ainsi de nombreuses manières de classer les sinogrammes (cf. Dictionnaires de sinogrammes).
[editar] Ordre levantin
Le premier ordre alphabétique est né avec le premier alphabet sémitique, celui d'Ougarit, un abjad cunéiforme. L'ordre est attesté sur plusieurs tablettes. Il s'est poursuivi dans un autre abjad sans lien pour la forme mais lié linguistiquement, celui du phénicien, d'où sont issus les principaux alphabets actuels : alphabet grec et ses avatars (alphabet gotique, cyrillique, latin en passant par l'étrusque), mais aussi alphabet araméen, syriaque, hébreu, arabe, etc.
C'est celui qui, maintenant l'un des plus célèbres, est désigné par le terme d'« ordre levantin », dans lequel on retrouve, souvent dissimulé par les évolutions propres à l'histoire de chaque alphabet et aux modifications qu'on a dû leur apporter pour les rendre aptes à noter la langue voulue (modifications « aggravées » par le fait que les alphabets ont pu se transmettre via des langues très éloignées phonétiquement), le classement traditionnel (notation API) /ʔ/ (coup de glotte, remplacé par /a/ à partir du grec), /b/, /g/ (devenu /k/ noté par c dès le latin), /d/, /h/ (devenu /e/ à partir du grec), /w/ (devenu /f/ à partir du latin, issu du digamma grec), /z/ (remplacé par /g/ puis rejeté en fin d'alphabet à partir du latin), etc.
Certains alphabets ont même été entièrement réordonnés pour des raison graphiques afin d'en faciliter l'apprentissage, comme l'alphabet arabe (cf. aussi Histoire de l'alphabet arabe et Numération arabe, l'ordre originel réapparaissant dans la numération). Pour ces écritures, cependant, le choix d'un ordre alphabétique cohérent est toujours resté une priorité. Ainsi, l'insertion de la nouvelle lettre G /g/ latine ─ issue d'un C /k/ modifié (lettre provenant elle-même du Γ /g/ gamma grec prononcé /k/ par les Étrusques) ─ s'est faite sans altérer l'ordre alphabétique : la nouvelle lettre a en effet remplacé un Z inutile en latin, lequel, cependant, a été réintroduit plus tard à la fin de l'alphabet quand il s'est avéré nécessaire de noter des mots grecs, à la suite du Y, autre lettre reprise aux Grecs.
[editar] Ordre sudarabique
Outre l'ordre levantin, il en existe un autre, pour les écritures dérivées de l'alphabet linéaire, dit ordre sudarabique, lui aussi ancien mais plus limité dans ses représentations. Attesté en sudarabique (et dans quelques tablettes en ougaritique trouvées hors d'Ougarit, comme celle de Beth Šemeš), il s'est transmis au syllabaire éthiopien, qui en découle.
Ses premiers rangs sont les suivants (en transcription des langues sémitiques) : h, l, ḥ, m, q, w, š, r, etc.
[editar] Ordre indien
En Inde, et à la suite dans tous les alphasyllabaires dérivés de la brāhmī (devanāgarī, et autres écritures de l'Inde, alphabet tibétain, thaï, etc.) ou qui en sont inspirés (comme, plus lointainement et après de nombreuses réfections, les kanas japonais), le classement est entièrement revu : il se fait de manière rationnelle, les graphèmes étant classés en rangées selon leur point d'articulation, d'abord les occlusives notant des phonèmes prononcés au fond de la gorge en premier puis en remontant petit à petit vers les articulations labiales puis, enfin, en dernier rang des les sonantes, les sifflantes et les dernières fricatives. Dans chaque rangée, on trouve d'abord la consonne sourde puis la sourde aspirée, la sonore, la sonore aspirée puis la nasale. Les voyelles sont classées à part, souvent en tête de liste. Il est évident que, de la même manière que pour l'ordre levantin, de nombreuses réorganisations ont pris place, selon les langues.
Voici par exemple les premiers rangs consonantiques de la devanāgarī (en transcription des langues indiennes) : k, kh, g, gh, ṅ, c, ch, j, jh, ñ, ṭ, ṭh, ḍ, ḍh, ṇ, etc.
[editar] Exemples en français
- ami, balance, butin, calin
La ligature œ (ou e dans l'o) est à considérer en français comme un o suivi d'un e (deux caractères) pour le classement alphabétique, alors que oe et œ ont deux rôles entièrement distincts en français :
- moelle, mœurs
- coefficient, cœur, coexistence
En première analyse les caractères accentués, de même que les majuscules, ont le même rang alphabétique que le caractère fondamental :
- Marx, marxisme
- règlement, réglementaire
- rebelle, rébellion
Si plusieurs mots ont le même rang alphabétique, on tâche de les distinguer entre eux grâce aux majuscules et aux accents (pour le e, on a l'ordre e, é, è, ê) :
- calvados, Calvados
- légitime, légitimé
- pécher, pêcher
Ce double classement (sans puis avec les accents) donne au final :
- légitime, légitimé, légitimes, légitimés
À noter que la comparaison des caractères accentués se fait alors à l'envers en commençant par la dernière lettre :
- élève, élevé
Source : Gouvernement du Québec
[editar] Classement alphabétique en castillan (ou espagnol)
Le cas du classement alphabétique dans cette langue, modifié en 1994, fait l'objet d'un article séparé.
[editar] Avantages et inconvénients
[editar] Avantages
Ceci permet de trouver facilement un mot dans une liste à toute personne sachant lire la langue dans laquelle elle effectue sa recherche.
[editar] Défaut du classement alphabétique, ou le désordre alphabétique
Le principal reproche fait au classement alphabétique, est que, sous une apparence de classement rigoureux et pensé, il mélange ce qu'il range. Car en fait, suivant l'ordre alphabétique (les documentalistes disent le désordre alphabétique) des notions ou des éléments n'ayant aucun point commun se retrouvent voisins, et au contraire, les articles concernant un même sujet se retrouvent éparpillés. Par exemple, en ouvrant au hasard un dictionnaire, on trouve ronin, ronron et Ronsard. Il eût mieux valu, par proximité de sens, placer le premier avec samouraï ou au moins Japon, le second à proximité de chat et le dernier avec poésie ou bien la Pléiade. C'est ainsi que le classement de nombreuses encyclopédies se fait d'abord par thème, puis le classement de ces thèmes est fait par ordre alphabétique (qui est donc secondaire).
[editar] Programmation
Les programmeurs d'application devront donc faire attention aux spécificités locales. Cf. Classement alphabétique informatisé.
[editar] Ordre ASCII
Notons que Wikipédia considère l'ordre ASCII comme un ordre alphabétique. Cf. cette page sur Meta.
Wikipédia sur ce point est touché par le bug 164. Pour les développeurs, on pourrait ajouter le commentaire suivant.
It looks like mySQL 4.1 support nationals collate of utf-8
http://dev.mysql.com/doc/mysql/en/Charset.html
http://bugzilla.wikipedia.org/show_bug.cgi?id=164
[editar] Classement alphabétique d'ensemble de mots
Une fois le classement alphabétique de mots défini, vient le classement alphabétique d'ensemble de mots : tous les mots n'ont pas la même importance. Par exemple, pour classer des personnes (carnet d'adresses, bibliographie, discographie, etc.), il est plus intéressant de classer 1° par nom puis 2° par prénom. Pour les personnes, le plus important c'est le nom : cela permet grouper celles et ceux qui ont peut-être un lien de parenté. Ce classement se révèle donc bien plus complexe, car il faut détermniner le nom, le prénom, etc. quelle que soit la langue.
[editar] Présentation du classement
La présentation de ce type de classement est délicate : comment indiquer au lecteur la logique du classement ? Il est préférable que le premier mot soit celui utilisé pour le classement.
Quelques exemples, une possibilité (utilisation de la virgule) :
- Bach, Jean-Sébastien
- Björk
- Davis, Miles
- Hancock, Herbie
- Hooker, John Lee
- Piaf, Edith
- Skatalites, The
Une autre possibilité (utilisation des parenthèses) :
- Bach (Jean-Sébastien)
- Björk
- Davis (Miles)
- Hancock (Herbie)
- Hooker (John Lee)
- Piaf (Edith)
- Skatalites (The)
Le plus délicat, c'est quand on ne connaît pas la langue : ses articles, ses prénoms, etc.
[editar] Méthode de classement de l'ensemble
On utilise nom et prénom dans beaucoup de langues, pour désigner une personne. Et en général, le nom est plus important que le prénom. Il faudra alors bien identifier le prénom et le nom (voir les différentes listes spécialisées), car il arrive parfois qu'un nom soit aussi un prénom… La présentation francophone veut que le prénom soit cité avant le nom, ce qui donne déjà un repère. Par exemple Pierre Henry, pourra être présenté comme Henry (Pierre) ou Henry, Pierre
L'article aussi n'a pas beaucoup d'importance pour le classement.
En français, les articles définis le, la, l', les… ne seront pas utilisés pour le classement, tout comme les articles indéfinies un, une, des…
En anglais, l'article the, a, an… ne sera pas utilisé pour le classement.
- Exception :
- en musique : The The
La gestion des chiffres (comme les signes de ponctuation) est délicate, il y a deux possibilités :
- soit ils sont placés avant (ou après) les lettres de l'alphabet ;
- soit ils sont écrits en toutes lettres.
Le cas des chiffres en lettres peut poser problème : le lecteur est amené à considérer la langue. Et pour les traductions qui ont gardé leur titre original, quelle langue utiliser ?
Exemple :
- 2001 : l'odyssée de l'espace / Deux mille un : l'odyssée de l'espace
- 2046 (réalisé par Wong Kar-Wai) / Deux mille quarante six ou Two thousand forty six ?
- !!! / Chickchickchick ?
Parfois, le passage introductif n'est pas utilisé pour le classement, quand le nom / le titre est trop long.
Exemple :
- …And You Will Know Us By The Trail Of Dead / Trail Of Dead (…And You Will Know Us By The)
[editar] Articles connexes
- alphabet ;
- digramme, ligature ;
- Unicode.
- chaînes de caractères
- classement alphabétique informatisé
catégorie:algorithmique