New Immissions/Updates:
boundless - educate - edutalab - empatico - es-ebooks - es16 - fr16 - fsfiles - hesperian - solidaria - wikipediaforschools
- wikipediaforschoolses - wikipediaforschoolsfr - wikipediaforschoolspt - worldmap -

See also: Liber Liber - Libro Parlato - Liber Musica  - Manuzio -  Liber Liber ISO Files - Alphabetical Order - Multivolume ZIP Complete Archive - PDF Files - OGG Music Files -

PROJECT GUTENBERG HTML: Volume I - Volume II - Volume III - Volume IV - Volume V - Volume VI - Volume VII - Volume VIII - Volume IX

Ascolta ""Volevo solo fare un audiolibro"" su Spreaker.
CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Gesetz der Verteilung von Wortlängen - Wikipedia

Gesetz der Verteilung von Wortlängen

aus Wikipedia, der freien Enzyklopädie

Den Begriff der Wortlänge kann man verschieden definieren: als die Zahl der Buchstaben, Laute, Morphe oder der Silben je Wort. Gleich, welche Wahl man trifft, ist zu erwarten, dass die Wortlängen in einem Text oder im Lexikon gesetzmäßig verteilt sind. Das Gesetz der Verteilung von Wortlängen ist einer von vielen Gesetzesvorschlägen der Quantitativen Linguistik. Das entsprechende Gesetz haben zuletzt Altmann, Wimmer u.a. [1] abgeleitet; die Vorschläge zu diesem Gesetz, die seit den 40er Jahren des vorigen Jahrhunderts gemacht wurden, sind in dieser neuen Theorie als Spezialfälle enthalten. Eine Fülle von Überprüfungen an deutschen und über 50 weiteren Sprachen (über 4000 Texte und einige Wörterbücher) bestätigen die Theorie (Best 1997, 2001, 2003; Schmidt 1997). Wortlängen sind damit die bei weitem am besten erforschte Sprachgröße. Zur Geschichte des Gesetzes von den 1940er Jahren an und zu seiner Kritik vgl. Grzybek (2006). Es hat sich gezeigt, dass die Hyperpoisson-Verteilung ein besonders häufig anwendbares Modell ist. Je nach Sprache, Autor, Zeit, Textsorte müssen aber oft auch andere Modelle eingesetzt werden.

Das Gesetz gilt analog für andere Spracheinheiten wie Morphe, rhythmische Einheiten, Sätze und Silben (siehe Gesetz der Verteilung von Morphlängen, Gesetz der Verteilung rhythmischer Einheiten verschiedener Länge, Gesetz der Verteilung von Satzlängen, Gesetz der Verteilung von Silbenlängen).

Der empirische Befund für das Deutsche ist, dass die einsilbigen Wörter immer, von althochdeutscher Zeit an, bei allen Autoren, in allen Textsorten etc. am häufigsten sind, es folgen als nächsthäufige die zweisilbigen, usw. Bei knapp 2000 Texten gab es immer dasselbe Ergebnis. Alle Texte bis auf 5 entsprechen der Hyperpoisson-Verteilung.

Ein Beispiel für eine Wortlängenverteilung (gemessen als Zahl der Silben pro Wort) in einem Brief von Kurt Tucholsky [2]:

x n(x) NP(x)
1 522 521.4
2 250 247.56
3 87 92.69
4 32 28.64
5 7 7.53
6 2 2.18

(Dabei ist x: Zahl der Silben pro Wort, n(x) die in diesem Text beobachtete Zahl der Silben pro Wort; NP(x) die Zahl der Silben pro Wort, die berechnet wird, wenn man die Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: die Hyperpoisson-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0.85, wobei P als gut erachtet wird, wenn es größer/ gleich 0.05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)

Die Wortlängenverteilung dieses Textes ist für das Deutsche recht typisch: am häufigsten sind die Wörter, die aus nur einer Silbe bestehen; es folgen die zwei-, dann die dreisilbigen usw. Nur bei den seltenen Klassen der langen Wörter treten Unregelmäßigkeiten auf.

In anderen Sprachen sind oft nicht die einsilbigen Wörter die häufigsten, sondern die zwei- oder gar erst die dreisilbigen. Dies ist abhängig von der Morphologie der Sprachen. Beispiele dafür, dass nicht die einsilbigen Wörter am häufigsten in Texten vorkommen, sind u.a. Finnisch und Latein.

Die sehr umfangreichen Befunde zu den Wortlängenverteilungen unterstützen in besonderem Maße die allgemeine Hypothese der Quantitativen Linguistik, dass in Sprachsystem und –verwendung ebenso wie im Sprachwandel theoretisch begründbare Gesetze gelten.

Zur Interaktion zwischen der Wortfrequenz und der Wortlänge s. [3]

[Bearbeiten] Literatur

  • Karl-Heinz Best (Hrsg.): Glottometrika 16. The Distribution of Word and Sentence Length. Wissenschaftlicher Verlag Trier, Trier 1997. ISBN 3-88476-276-1
  • Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 2., überarb. u. erw. Aufl. Peust & Gutschmidt, Göttingen 2003. ISBN 3-933043-10-7
  • Karl-Heinz Best: Wortlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ N.Y. 2005, S. 260-273. ISBN 3-11-015578-8
  • Karl-Heinz Best: Wortlängen im Deutschen. In: Göttinger Beiträge zur Sprachwissenschaft 13, 2006, 23-49.
  • Peter Grzybek: History and Methodology of Word Length Studies. The State of the Art. In: Peter Grzybek (Hrsg.): Contributions to the Theory of Text and Language. Word Length Studies and Related Issues. Springer, Dordrecht (NL), 2006, S. 15-90. ISBN-10 1-4020-4067-9 (HB)
  • Peter Schmidt (Hrsg.): Glottometrika 15. Issues in General Linguistic Theory and the Theory of Word Length. Wissenschaftlicher Verlag Trier, Trier 1996, S. 102-111. ISBN 3-88476-228-1
  • Gejza Wimmer, Gabriel Altmann: Thesaurus of univariate discrete probability distributions. Stamm, Essen 1999. ISBN 3-87773-025-6
  • Gejza Wimmer, Gabriel Altmann: Towards a Unified Derivation of Some Linguistic Laws. In: Peter Grzybek (ed.): Contributions to the Science of Text and Language: Word length studies and related issues. Springer, Dordrecht 2006, S. 329-337. ISBN-10 1-4020-4067-9 (HB)
  • Gejza Wimmer, Viktor Witkovský, Gabriel Altmann: Modification of Probability Distributions Applied to Word Length Research. In: Journal of Quantitative Linguistics 6, 1999, 257-268.

[Bearbeiten] Einzelnachweise

  1. Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106; Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133
  2. Stefan Ammermann: Zur Wortlängenverteilung in deutschen Briefen über einen Zeitraum von 500 Jahren. In: Karl-Heinz Best (Hrsg.): Häufigkeitsverteilungen in Texten. Peust & Gutschmidt , Göttingen 2001, S. 59-91. S. 81
  3. http://www.uni-trier.de/uni/fb2/ldv/lql_wiki/index.php/Word_length_and_frequency

[Bearbeiten] Weblinks

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu