Liste Swadesh

Un article de Wikipédia, l'encyclopédie libre.

La liste Swadesh est une série de mots établie par le linguiste américain Morris Swadesh, dans les années 1940-1950, utilisée dans la linguistique historique et comparée. Pour créer sa liste, Swadesh choisit un vocabulaire de base qui se trouvait dans le plus de langues possible, étant le plus indépendant possible de l’environnement naturel et de la culture. Il y a des listes Swadesh de 215, 207, 200 et 100 mots.

Swadesh proposa sa liste comme un instrument servant d’abord à identifier le vocabulaire de base de toute langue non encore étudiée jusqu’alors, deuxièmement à établir le degré de parenté de deux langues données et, enfin, à dater approximativement les langues d’origine dont ont évolué d’autres langues.

Sommaire

1 Création de la liste Swadesh
2 Établissement du degré de parenté de deux langues
3 Utilisation de la liste Swadesh pour dater les langues d’origine (la glottochronologie)
4 Objections contre l’utilisation de la liste Swadesh
5 Utilité de la liste Swadesh
6 Bibliographie
7 Liens externes
8 Liste Swadesh de 207 mots du français
9 Voir aussi
10 Liens externes

[modifier] Création de la liste Swadesh

Swadesh étudia de nombreuses langues, surtout une vingtaine de langues amérindiennes du Canada, des États-Unis et du Mexique. Devant faire des recherches sur des langues presque éteintes, avec des moyens limités, il éprouva le besoin d’une procédure standardisée pour rassembler des données essentielles concernant la parenté entre langues. À cet effet, il créa une liste de mots selon le postulat suivant :

Bien que des mots disparaissent de toute langue, étant remplacés par d’autres au cours du temps, certaines parties du vocabulaire sont moins exposées au changement que d’autres. C’est pourquoi on peut définir un vocabulaire de base, qui est la partie du lexique la plus résistante au changement. Ce vocabulaire dénomme des notions véhiculées dans toutes les langues. Les pronoms, les numéraux, certains adjectifs (« grand », « petit », « long », « court »), certains termes désignant des degrés de parenté (« mère », « père »), des parties du corps (« œil », « oreille », « tête »), des événements ou des objets naturels (« pluie », « pierre », « étoile »), des états et des actions élémentaires (« voir », « entendre », « venir », « donner ») sont peu sujets au remplacement par des emprunts. Par exemple, le vocabulaire général de l’anglais est emprunté à 50% environ, mais ce pourcentage diminue à 6% pour ce qui est du vocabulaire de base. Dans la liste Swadesh de 100 mots de l’anglais il n’y a qu’un seul mot qui ne provienne pas du vocabulaire de base germanique initial (mountain – « montagne », d’origine française, introduit par les Normands). Un autre exemple est celui de l’albanais et du grec moderne. L’albanais a perdu 90% de ses mots d’origine indo-européenne, beaucoup plus que le grec, mais si l’on considère la liste Swadesh de 100 mots, le pourcentage de pertes est à peu près égal pour les deux langues (25 à 26%).

[modifier] Établissement du degré de parenté de deux langues

Swadesh a utilisé sa liste pour mesurer la ressemblance, c’est-à-dire le degré de parenté de deux langues, par la méthode quantitative de la lexicostatistique, en établissant le pourcentage de mots d’origine commune. Plus la ressemblance entre les vocabulaires des deux langues est grande, plus elles sont proches génétiquement, et plus le temps écoulé depuis le moment où elles se sont séparées est court. À son avis, si le vocabulaire de base de deux langues contient des mots apparentés à raison de 70%, on peut considérer qu’elles ont évolué à partir d’une même langue. Si ce pourcentage dépasse 90%, alors ces langues sont des parentes proches.

[modifier] Utilisation de la liste Swadesh pour dater les langues d’origine (la glottochronologie)

Dans ce but, Swadesh a pris pour point de départ le postulat que le taux de perte du vocabulaire de base initial ne change pratiquement pas, les mots disparaissant et étant remplacés à un rythme à peu près constant, alors que dans le cas du reste du lexique, qui est étroitement lié à des facteurs culturels, le taux de perte varie en fonctions des contacts que les locuteurs ont eu avec des cultures qui leur sont étrangères. À cause de ce postulat, la méthode de datation des langues proposée par Swadesh fut comparée à la détermination de l’âge des fossiles à partir de la désintégration radioactive du carbone 14, qui est constante.

À la suite d’une recherche sur treize langues (indo-européennes pour la plupart) qui ont des attestations écrites sur une longue période, à partir de la liste Swadesh de 100 mots on a calculé un taux de conservation de 86% (soit un taux de perte de 14%) sur une période de 1000 ans, qu’on a considéré comme constant et généralisé à toutes les langues.

Étant donné le pourcentage de mots d’origine commune et le taux de conservation du vocabulaire de base sur 1000 ans, le temps écoulé depuis la séparation de deux langues qui résultent d’une même langue d’origine peut être déterminé, avec une marge d’erreur calculable, selon la formule :

t = (log c) / (2 log r),

où c est le pourcentage de mots d’origine commune et r – le taux de conservation.

Par exemple, si le vocabulaire de base de deux langues et apparenté à 70%, alors on peut considérer qu’elles ont évolué à partir d’une même langue qui a existé douze siècles auparavant.

[modifier] Objections contre l’utilisation de la liste Swadesh

L’utilisation de la liste Swadesh fut contestée dès le début. On lui oppose les objections suivantes :

Le vocabulaire de base n’est pas exempt d’emprunts de manière égale dans toutes les cultures. Par exemple, un objet naturel comme le soleil peut tenir du vocabulaire religieux (tel est le cas en Asie du sud) et, de ce fait, sa dénomination est empruntée. Par ailleurs, des mots du vocabulaire de base peuvent devenir tabou et être remplacés par d’autres, d’une langue voisine, pour compenser l’interdiction.
Certains mots ne se retrouvent pas dans toutes les langues, à cause de spécificités de l’environnement naturel, par exemple du climat. Ainsi, les mots « neige » et « glace » sont-ils absents des langues des tropiques. Dans la liste de 207 mots il y a, de plus, des mots qui ne se retrouvent pas dans toutes les langues pour des raisons culturelles. C’est pourquoi Swadesh même a réduit sa liste à cent mots.
Un mot peut avoir pour correspondant dans une autre langue non pas un mot, mais plusieurs mots, voire des affixes, parmi lesquels il faut choisir, ce qui rend plus arbitraire la comparaison des langues.
Il est fort peu probable que le taux de conservation soit constant pour toutes les langues et à toutes les époques. Dans des conditions particulières qui tiennent de l’isolement du groupe de locuteurs, de sa cohésion sociale, de l’éventuelle observation d’une norme littéraire ou religieuse, ce taux peut varier considérablement. Un exemple d’Europe est celui de l’islandais, langue d’une stabilité exceptionnelle, ce qui invalide partiellement la méthode, infirmant son universalité. En effet, le taux de perte de l’islandais n’est que de 4%, alors que celui du norvégien littéraire est de 20%, bien que ces deux langues soient très proches génétiquement l’une de l’autre.
L’identification des mots apparentés est problématique. Lorsqu’on applique la technique de la lexicostatistique, à défaut d’une autre possibilié sur un aire géographique très étendu et sur des centaines de langues pour lesquelles l’information est très lacunaire, les descriptions étant partielles et récentes, il est impossible, faute de matière première, d’établir les lois des changements phonétiques. De ce fait, l’élimination du lexique emprunté, qui devrait se fonder sur la connaissance de ces lois, est très difficile. Par conséquent, l’identification du vocabulaire réellement apparenté et, donc, hérité en parallèle, est problématique.
L’identification des mots apparentés est en général aléatoire. Des mots très différents peuvent avoir la même origine, par exemple le mot français « chef » (au sens premier de « tête ») et le mot anglais head (« tête »). Par contre, des mots qui se ressemblent peuvent ne pas être directement apparentés : le mot latin dies et l’anglais day (les deux signifiant « jour »), ou le latin habere et l’allemand haben (« avoir »).

[modifier] Utilité de la liste Swadesh

Malgré les objections, on reconnaît que la liste Swadesh et la lexicostatistique peuvent servir dans les investigations de base ou dans les situations où ni les techniques comparatives classiques ni la reconstitution interne ne sont applicables, ce qui était d’ailleurs l’idée de départ de Swadesh.

Un exemple d’une telle situation est celui où l’on ne dispose que de listes incomplètes de vocabulaire, comme dans le cas de groupes de langues très grands, récemment attestées, telles les langues austronésiennes (1000 environ) ou celles des aborigènes d’Australie (autour de 250). Pour de telles langues, la liste Swadesh peut être utilisée à faire une première ébauche de leur répartition en groupes et sous-groupes, servant de point de départ pour une investigation historique à part entière, qui continue les classements et les reconstitutions.

[modifier] Bibliographie

(en) Arndt, Walter W., « The performance of glottochronology in Germanic », dans Language, n° 35 (1959), p. 180-192.
(en) Bergsland, K.; Vogt, H., « On the validity of Glottochronology », dans Current Anthropology, n° 3 (1962), p. 115-153.
(en) Bynon, T., Historical Linguistics, Cambridge, 1977, p. 266-272.
(en) Callaghan, Catherine A., « Utian and the Swadesh list », dans Redden, J. E., Papers for the American Indian language conference, held at the University of California, Santa Cruz, July and August, 1991, p. 218-237, Occasional papers on linguistics, n° 16, Carbondale, Department of Linguistics, Southern Illinois University.
(en) Campbell, Lyle, Historical linguistics; An Introduction, Edinburgh University Press, Edinburgh, 1998.
(en) Crowley, T., An Introduction to Historical Linguistics, Auckland / Oxford, 1992, p. 168-190.
(en) Embleton, Sheila, « Review of ‘An Indo-European classification: A lexicostatistical experiment’ by I. Dyen; J.B. Kruskal & P.Black », TAPS Monograph 82-5, Philadelphia, dans Diachronica, n° 12-2/1992:263-68.
(en) Gray, Russell D.; Atkinson, Quentin D., « Language-tree divergence times support the Anatolian theory of Indo-European origin », dans Nature, n° 426.
(en) Gudschinsky, S., « The ABC's of Lexicostatistics (Glottochronology) », dans Hymes, D., Language in Culture and Society. A Reader in Linguistics and Anthropology, New York, 1964, p. 612-623.
(en) Haarmann, Harald, « Basic vocabulary and language contacts; the disillusion of glottochronology », dans Indogermanische Forschungen, n° 95:7ff (1990).
(en) Hockett, Charles F., A course in modern linguistics, Macmillan, New York, 1958, chap. 6.
(en) Hoijer, Harry, « Lexicostatistics: A critique », dans Language, n° 32 (1956), p. 49-60.
(en) Holm, Hans J., « The Proportionality Trap. Or: What is wrong with lexicostatistical Subgrouping », dans Indogermanische Forschungen, n° 108 (2003), p. 38-46.
(de) Holm, Hans J., « Genealogische Verwandtschaft », dans Quantitative Linguistik; ein internationales Handbuch. Herausgegeben von R.Köhler, G. Altmann, R. Piotrowski, Walter de Gruyter, Berlin, 2005, cap. 45.
(en) Hymes, Dell H., « Lexicostatistics so far », dans Current Anthropology, n° 1 (1) (1960), p. 3-44.
(en) Jeffers, R.J.; Lehiste, I., Principles and Methods for Historical Linguistics, Cambridge MA., 1982, p. 133-137.
(en) Lees, Robert, « The basis of glottochronology », dans Language, n° 29 (2) (1953), p. 113-127.
(en) LEHMANN, W.P., Historical Linguistics : an Introduction, Londres, 1992, p. 175-182.
(en) McMahon, April; McMahon, Robert, Language Classification by Numbers, Oxford University Press, Oxford, 2005, p. 95.
(en) McWhorter, John, The power of Babel, Freeman, New York, 2001.
(en) Nettle, Daniel, « Linguistic diversity of the Americas can be reconciled with a recent colonization », dans PNAS, n° 96(6):3325-9 (1999).
Penchoen,T., « La Glottochronologie », dans Martinet, A., Le Langage, Paris, 1968, p. 865-884.
(en) Renfrew, Colin; McMahon, April; Trask, Larry, Time Depth in Historical Linguistics, The McDonald Institute for Archaeological Research, Cambridge (Angleterre), 2000.
(en) Sjoberg, Andree; Sjoberg, Gideon, « Problems in glottochronology », dans American Anthropologist, n° 58 (2), p. 296-308 (1956).
(en) Swadesh, Morris, The origin and diversification of languages, Routledge & Kegan Paul, Londres, 1972.
(en) Swadesh, Morris, « Salish internal relationships », dans International Journal of American Linguistics, n° 16 (1950), p. 157-167.
(en) Swadesh, Morris, « Lexicostatistic dating of prehistoric ethnic contacts », dans Proceedings American Philosophical Society, n° 96 (1952), p. 452-463.
(en) Swadesh, Morris, « Towards greater accuracy in lexicostatistic dating », dans International Journal of American Linguistics, n° 21 (1955), p. 121-137.
(de) Tischler, Johann, « Glottochronologie und Lexikostatistik », dans Innsbrucker Beiträge zur Sprachwissenschaft, n° 11 (1973), Innsbruck.