엔트로피 부호화
위키백과 ― 우리 모두의 백과사전.
엔트로피 인코딩 혹은 엔트로피 부호화(entropy encoding)는 심볼이 나올 확률에 따라 심볼을 나타내는 코드의 길이를 달리하는 부호화 방법이다. 보통 엔트로피 인코더는 모든 심볼에 대해 같은 길이를 갖는 코드를 심볼이 나올 확률값의 음의 로그에 비례하는 서로 다른 길이의 코드로 바꾸어 부호화한다. 즉 가장 자주 나오는 심볼에 대한 코드가 가장 짧다.
새넌 정리(Shannon's theorem)에 따르면, 가장 좋은 코드 길이는 b를 부호화할 심볼의 갯수, P를 심볼이 나올 확률이라고 할 때 −logbP 라고 한다.
엔트로피 코딩 중에 가장 자주 쓰이는 세 가지는 허프만 부호화, 범위 부호화와 산술 부호화이다. 데이터 스트림의 대략적인 엔트로피 성질을 미리 알고 있을 때에는 (특히 신호 압축에 있어) 더 간단한 일진 부호, 엘리어스 감마 부호, 피보나치 부호, 골롬 부호, 라이스 부호를 쓰기도 한다.
[편집] 같이 보기
분류: 엔트로피 | 무손실 압축 알고리즘