量化 (信号处理)
维基百科,自由的百科全书
在信号处理领域,量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。量化主要应用于从连续信号到数字信号的转换中。连续信号经过采样成为离散信号,离散信号经过量化即成为数字信号。注意离散信号并不需要经过量化的过程。信号的采样和量化通常都是由ADC实现的。
例如CD音频信号就是按照44110Hz的频率采样,按16比特量化为有着65536(=216)个可能取值的数字信号。
目录 |
[编辑] 数学描述
最简单最易懂的量化是标量(有别于多维矢量)量化, 开始标量量化之前先要给出输入数据. 通常, 一个标量量化操作可以给出下面的描述
其中
- x 是实数,
- 是 取底函数,生成整数
- f(x) 和 g(i) 是任意的实值函数。
整数 i 是表示的数值,它通常被存储或者传输,然后在后来需要解释的时候使用 g(i) 进行最终的解释重建。整数 i 有时也称作 量化指数。
在计算机或者其它应用, 一个已知的量化方法 均匀量化(:en:uniform quantization)。在均匀量化方法里共有两个变量, 叫mid-rise 和mid-tread。
如果x 是一个-1到1之间的数, 一个 mid-rise uniform 量化操作,可以用"M"bit来表示量化的精度。
- .
在这个例子中f(x)和g(i)运算符都是乘以比例因子(其中一个是另外一个的逆),并且在g(i)中带有一个偏移量以使得每个量化表示都位于输入区域的中间位置。2 − (M − 1)经常称为量化步长。按照这个量化定律,假定在整个量化步长上量化噪声大致是均匀分布的,并且假定量化的输入信号x在整个-1到1的区间大致均匀分布,量化的信噪比(SNR)可以用下面的公式计算,
- .
根据这个等式,人们常说 SNR 大约是每位 6 dB。
在 mid-tread 一致量化中,偏移 0.5 将加在取底函数内部而不是外部。
有时候,mid-rise 量化使用时不加偏移 0.5。这将信号与噪声比减小了大约 6.02 dB,但是当步距小的时候为了简化这是可接受的。
在数字电话系统中,两个流行的量化机制是'A-law'(在欧洲占据主导地位)和'μ-law'(在北美和日本占据主导地位)。这些机制将离散的模拟数值映射到8位尺度,在小值的时候近似线性随着幅度增长按照对数增加。由于人耳对于音量的感知近似对数曲线,这就使用一定的位数在可听见的声音强度范围提供了更高的信噪比。
[编辑] 量化与数据压缩
量化在有损数据压缩中起着相当重要的作用。很多情况下,量化可以被当作将有损数据压缩同无损数据压缩相区别的标志之一。量化的目的通常是为了减少数据量。一些压缩算法,例如MP3和Vorbis,以有选择地丢弃部分数据作为压缩的一种方法,这种手段可以被认为是量化的过程也可以被看作是一种有损压缩的形式。
JPEG是一种利用了量化的图像有损压缩。JPEG的编码过程对原始的图像数据作离散余弦变换,然后对变换结果进行量化并作熵编码。通过量化可以降低变换值的精度,从而减少图像的数据量。当然,精度的损失意味着图像质量的下降。然而图像的质量可以通过量化位数的选择加以控制。例如,JPEG在每像素3比特的精度下得到的图像质量还让人可以接受的,相对于PCM抽样得到的每个像素24比特的原始图像来说,数据量大大下降了。
现代压缩技术通常以量化输出的信息熵,而不是输出值集合的大小度量信息量的多少。
[编辑] 自然界中的量子化
从最基本的意义上来说,所有的物理量都是量子化的,这是量子力学的结论。为了数学上的明晰性,在宏观的尺度上可以将量子的性质忽略,因此信号可以表示为连续的形式。
在实际应用中,这种内在的量子或量化的性质并不需要考虑。首先,量子效应会被信号的噪声淹没,因为任何观察对象在实际系统中总会伴随有其他物理现象。其次,测量仪器不可能绝对精确,被测的信号必然会被测量噪声污染。