New Immissions/Updates:
boundless - educate - edutalab - empatico - es-ebooks - es16 - fr16 - fsfiles - hesperian - solidaria - wikipediaforschools
- wikipediaforschoolses - wikipediaforschoolsfr - wikipediaforschoolspt - worldmap -

See also: Liber Liber - Libro Parlato - Liber Musica  - Manuzio -  Liber Liber ISO Files - Alphabetical Order - Multivolume ZIP Complete Archive - PDF Files - OGG Music Files -

PROJECT GUTENBERG HTML: Volume I - Volume II - Volume III - Volume IV - Volume V - Volume VI - Volume VII - Volume VIII - Volume IX

Ascolta ""Volevo solo fare un audiolibro"" su Spreaker.
CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Kodowanie Shannona - Wikipedia, wolna encyklopedia

Kodowanie Shannona

Z Wikipedii

Kodowanie Shannona, to metoda kodowania źródłowego, którą Claude E. Shannon przedstawił jako jeden z dowodów swojego twierdzenia o dyskretnym kodowaniu w kanałach bezszumowych, które brzmi:

Dla źródła sygnału S można znaleźć takie kody prefiksowe dla słów złożonych z k symboli źródłowych, żeby zachodziło:
H(S) \le \frac{L_k}{k} < H(S) + \frac{1}{k}
gdzie H(S) to entropia źródła, a Lk - średnia długość kodów.

Kodowanie Shannona nie tworzy optymalnych kodów; nieco lepsze wyniki daje modyfikacja znana jako kodowanie Shannona-Fano. Znacznie lepszą efektywnością charakteryzują się kodowanie Huffmana oraz kodowanie arytmetyczne.

Spis treści

[edytuj] Kodowanie Shannona

Dane jest źródło S = \{x_1, x_2, \ldots\} i stowarzyszone z nimi prawdopodobieństwa p = \{p_1, p_2, \ldots\}.

  1. Prawdopodobieństwa (a wraz z nimi symbole) są sortowane w porządku niemalejącym, tj. p_i \ge p_{i+1}.
  2. Następnie dla tak uporządkowanych danych oblicza się niepełne prawdopodobieństwo komulatywne: P(x_i) = p_1 + p_2 + \ldots + p_{i-1} - jest to suma wszystkich prawdopodobieństw od 1. do i-1 elementu.
  3. Kodowanie Shannona polega na wzięciu \lceil -\log_{2}{P_i}\rceil (długość Shannona) pierwszych bitów binarnego rozwinięcia liczby Pi (brane są bity po przecinku).

[edytuj] Przykład

Niech S = {a,b,c,d}, p = {0.45,0.3,0.2,0.05} (entropia H(S) = 1.72); prawdopodobieństwa są już podane niemalejąco.

Prawdopodobieństwa kumulatywne:

  • P1(a) = 0
  • P2(b) = p1 = 0.45
  • P3(c) = p1 + p2 = 0.45 + 0.3 = 0.75
  • P4(d) = p1 + p2 + p3 = 0.45 + 0.3 + 0.2 = 0.95

I ich rozwinięcia binarne (wzięte 5 pierwszych bitów po przecinku):

  • P1(a) = 0.000002
  • P2(b) = 0.011102
  • P3(c) = 0.110002
  • P4(d) = 0.111102

Długości Shannona (długości kodów w bitach):

  • l_a = \lceil -\log_{2}{0.45}\rceil = 2
  • l_b = \lceil -\log_{2}{0.30}\rceil = 2
  • l_c = \lceil -\log_{2}{0.20}\rceil = 3
  • l_d = \lceil -\log_{2}{0.05}\rceil = 5

Ostatecznie kody mają postać:

  • kod(a) = 002
  • kod(b) = 012
  • kod(c) = 1102
  • kod(d) = 111102


Średnia długość kodu L_k = 2 \cdot 0.45 + 2 \cdot 0.3 + 3 \cdot 0.2 + 5 \cdot 0.05 = 2.35 (k = 1). Po podstawieniu do nierówności podanej w twierdzeniu: 1.72 \le 2.35 < 1.72 + 1 stwierdzamy, że otrzymany kod rzeczywiście ją spełnia.

Jednak, jak wspomniano, efektywność kodowania Shannona nie jest duża - dla danych z tego przykładu wynosi \frac{H(S)}{L_k} \cdot 100\% = 73.2\%.

[edytuj] Kodowanie Shannona-Fano

Robert Fano zaproponował algorytm, który daje trochę lepsze wyniki kodowania - kody mogą być krótsze o 1 bit niż kody tworzony metodą Shannona, także rozkład bitów może się różnić.

Kodowanie Shannona-Fano przedstawia się następująco:

  1. s - ciąg symboli ze zbioru S posortowanych wg prawdopodobieństw pi
  2. Shanon-Fano(s):
    • Jeśli s zawiera dwa symbole do słowa kodu pierwszej litery dodaj 1, do słowa kodu drugiej litery - 0.
    • W przeciwnym razie jeśli s zawiera więcej niż dwa symbole, podziel go na dwa podciągi s1 i s2 tak, żeby różnica między sumą prawdopodobieństw liter z s1 i s2 była najmniejsza. Do słów kodu symboli z s1 dodaj 1, do kodów symboli z s2 - 0. Wywołaj rekurencyjnie funkcje: Shannon-Fano(s1) oraz Shannon-Fano(s2).

[edytuj] Przykład

Niech S = {a,b,c,d}, p = {0.45,0.3,0.2,0.05}.

Początkowo ciąg s = abcd (porządek według malejącego prawdopodobieństwa).

Składa się z więcej niż 2 liter, zatem trzeba go podzielić. Możliwe są następujące sytuacje: 1) s1 = a, s2 = b (różnica prawdopodobieństw 0.1), 2) s1 = ab, s2 = cd (różnica prawdopodobieństw 0.5) oraz 3) s1 = abc, s2 = d (różnica prawdopodobieństw 0.9) - wybierany jest ta para, dla której różnica prawdopodobieństw jest najmniejsza, a więc pierwszą parę. Do słów kodu liter z s1 = a dopisywane są 0, do słów kodu liter z s2 = bcd - 1:

a = 0
b = 1
c = 1
d = 1

Teraz wywoływana jest funkcja Shannon-Fano(s1) - ten ciąg ma długość 1 i nie jest już dalej przetwarzany. Następnie wykonywane jest Shannon-Fano(s2) - s2 jest dłuższy niż 2 i musi zostać podzielony.

Sytuacja jest podobna jak w poprzednim kroku, bo s12 = b i s22 = cd. Do słów kodu liter z s12 = b dopisywane są 0, do słów kodu liter z s22 = cd - 1:

a = 0
b = 10
c = 11
d = 11

Wywoływana jest funkcja Shannon-Fano(s12) - ten ciąg ma długość 1, nie jest już dalej przetwarzany. Następnie wykonywane jest Shannon-Fano(s22) - s22 ma długość 2, więc tutaj kodowanie kończy się - do słowa kodu pierwszego symbolu (c) dopisywane jest 0, a do słowa kodu drugiego kodu (d) - 1:

a = 0
b = 10
c = 110
d = 111

Średnia długość kodu L_k = 1 \cdot 0.45 + 2 \cdot 03 + 3 \cdot 0.1 + 3 \cdot 0.05 = 1.8. W tym przypadku efektywność kodowania wynosi \frac{H(S)}{L_k} \cdot 100\% = \frac{1.72}{1.80} \cdot 100\% = 95\%, jest więc znacznie lepsza niż kodowania Shannona.

[edytuj] Bibliografia

Adam Drozdek, Wprowadzenie do kompresji danych, WNT 1999

[edytuj] Zobacz też

W innych językach

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu