Zipfin laki
Wikipedia
Zipfin laki oli Harvardin kielitieteilijä George Kinsley Zipfin löydös, jonka mukaan n:nneksi käytetyimmän sanan (tai jonkin muun mitattavan yksikön, kuten äänteen) käyttötiheys missä tahansa luonnollisessa kielessä on käänteisesti verrannollinen lukuun n.
Zipfin laki on empiirinen tulos, eikä teoreettinen malli. Syyt zipfiläisiin jakaumiin eri ilmiöissä vaihtelevat suuresti ja niiden perusteista on kiistaa. Zipfiläisiä jakaumia kuitenkin esiintyy tosielämässä.
Zipfin laki voidaan kuvata matemaattisesti:
Laki voidaan kirjoittaa myös muodossa
Zipfiläinen jakauma todistetaan usein kuvaamalla data graafisesti, akseleina järjestysnumeron logaritmi ja frekvenssin logaritmi. Jos pisteet asettuvat likimäärin suoralle, kyseessä on Zipfin lain tapaus.
[muokkaa] Triviaa
- Dahui, Li Menghui & Di Zengru löysivät tutkimuksessaan "True reason for Zipf’s law in language" (2005), että vaikka normaalisti analysoidut kielet, kuten englanti, ranska ja muut kielet noudattivat Zipfin jakaumaa, kiina on poikkeus. Kiinan kieli lakkasi noudattamasta Zipfin jakaumaa Qin -dynastian jälkeen. Syyksi he esittivät sitä, että uusien kiinan sanamerkkien luominen ja merkistön satunnainen muuttuminen on hitaampaa.
- R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger, S. Havlin, C. K. Peng, M. Simons & H. E. Stanley, "Linguistic Features of Noncoding DNA Sequences"(1994) osoitettiin, että Tilke-DNA noudattaa Zipfin lakia, ja geenit eivät.