详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz

这世界变化真快啊,想当年CD横空出世,打得包括黑胶唱片,盒式录音带等模拟音乐载体满地找牙的情景,仿佛就是昨天发生的事儿一样,而如今,CD也行将末路,风光不再。

CD唱片从问世之初就饱受争议,因为CD是数码产品,有所谓的“数码声”,使听惯了模拟系统声音的人们感觉有些不习惯,随着CD编解码技术的发展,早期产品的生硬的听感被逐渐改善,人们也逐渐习惯了数码音乐清晰干净的品质,可随之而来的就是更高规格的所谓数字母盘录音随着互联网传播开来,而之前站在高保真王者之位的CD居然被指控使用的数字规格太低了,不能满足高保真播放的要求,事实上,就CD这个载体格式而言,的确有瑕疵,我之前的文章“你相信同一张CD每次播放都可能不同吗?”里有较详细的论述,有兴趣的读者可以看一下。总而言之,就是由于CD为了将更多的存储空间用于数据存贮从而挤占了纠错冗余数据,从而使得CD唱片对于读片误码矫正能力比较差,导致有可能每次播放实际读出数据小有偏差,从而导致听感有所不同。而之后用于数据存储的CD-DA格式的CD-ROM,通过加大冗余纠错数据,就很好的解决了这个问题。大家可以放心的将数据存储在CD-ROM里不用担心将来读取数据有误。但这仅仅涉及到CD的存储格式,而CD的编码格式(也就是所谓的16bit/44.1kHz)则是另外一回事儿,有人质疑16bit位深不够导致解码出来信号有锯齿,也有人质疑44.1kHz采样频率太低了,不足以重现大自然的声音。我认为在下结论之前有必要了解一下从模拟信号到数字信号编码过程中采样与量化的原理,然后再看这个16bit/44.1kHz的设定到底合不合理。

让我们先从采样开始吧!

大家都知道模拟信号是连续信号,而数字信号是离散的,从数学上也可以理解,整数之间是有间隙的,其间可以插入无数个小数。而我们量化的数字信号恰好是一系列的整数,因此我们必须将连续的模拟信号以一定的间隔采样,不用说大家都能想象得到,采样间隔越密越好。

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(1)

蓝色为信号频率,红色为采样频点

如上图所示,蓝色波形是被采样的原始波形,红线则代表了采样的频点,而红线与蓝线的交点就是被采样下来的点。很显然,红线的密度(采样频率)越高,采样点也就越多,其采样的结果就越接近原始波形。当然,越多越好显然不是个合理的方案,那么到底选多大的密度(采样频率)合适呢?信息论的祖师爷香农与奈奎斯特对此有个洞见,并通过数学推导验证后发表了香浓采样定理(由于是奈奎斯特最先提出来的,因此也叫奈奎斯特采样定理),通俗的讲,就是采样频率(此例中就是红线出现的频率)达到被采样波形(在这儿就是那条蓝色的波形)最高频率的两倍,其采样后的点,就可以完全恢复原波形。由于绝大多数人耳能听到的极限频率在20000Hz以下,我之前发的频响测试的音视频都是为了让大家对此有个直观的印象。那么我们可以将20000Hz定义为被采样信号频率的上限,根据香农定理,采样频率只要达到40000Hz就可以恢复20000Hz的信号波形了。而44.1kHz也就是44100Hz毫无疑问是超过了40000Hz的,至于为什么选44.1kHz这么个有整有零的奇葩数字,在我的另一篇文章“是录像机制式决定了CD标准中44.1kHz采样频率”中有详细论述,感兴趣的读者可以看一看。好了,到此为止,我们知道44.1kHz的采样频率是可以完美恢复频率上限是20KHz的音频信号的。也就是说用44.1kHz采样最高频率为20kHz的音频信号可以完美恢复其原始信号波形,因此44.1kHz完全够用!有人说了,香农定理一定正确吗?至少目前为止,这个定理还没有被推翻,不但没有被推翻,人类通信领域的高度发展都依赖于香农信息论的一系列的理论基础,离开了香农的信息理论,当下的4G通信,5G通信都成了无源之水,无本之木!

上面的阐述有个小问题,就是所谓频率上限是20KHz是什么意思?这就是说,该音频信号中不能包含高于20KHz的频率成分。还回到刚才举例的那条蓝色波形图,这个波形有些地方比较平缓,有些地方比较尖锐,显然这条波形里并非只有一个频率,而是由一系列不同频率组合(或者叫叠加)出来的,而这一系列单频波的基本元素都是正弦波,换句话说,任何形式的波形,都可以看成一系列的不同频率与幅度的正弦波的叠加,而这一系列正弦波中,频率最高的那个正弦波,决定了最低采样频率。就好像我们定义音频最高频率(也就是那个最高的正弦波)是20KHz,其最低采样频率也就产生了,也就是40KHz。我们可以采用高于40KHz的任何采样频率,比如44.1kHz,但是不能低于40kHz,否则,非但不能恢复原始信号波形,反而还会产生混叠失真。什么是混叠失真呢?

不知大家在看电影(电视)时是否会注意到这样一个现象,有时在播放车轮的时候,明明车子在向前行驶,但是影片中的车轮却看起来静止不动甚至倒转,这就是一种混叠效应。拍电影时车轮是连续运转的,但是电影摄影机确是一格一格拍摄的,如果摄影机拍摄每一格的时候恰好车轮转到原始位置,那么拍出来的影片看起来车轮就像静止一样(车子还继续前行),同理,如果摄影机在每一格快门开启时,车轮转到差一点到原位的位置,则拍出来的影片显示车轮在倒转。

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(2)

车轮的视觉混叠效果

看起来就是这个样子的。那么这个混叠失真在模数转换中是什么情形呢?请看下图:

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(3)

红色线下是原始信号频谱分布,绿色线下是采样后频谱分布,绿线是采样频率点

图中横轴是频谱的频率,纵轴是频谱的幅度,左边红色边框下围的是原始信号频谱,上面拐点是信号最高截止频率,由于频率谱是逐渐衰减的,因此,最高信号频率之外并不干净,依然有残存频谱。绿线标定的是采样频率,此处我们选采样频率为原信号最高频率的两倍。其上下边带是其采样时产生的频谱,大家看到下边带与原信号频谱产生的混叠区。需要注意的是,下边带左侧实际上是原信号频谱高端频率的镜像,因此,在此混叠的信号频率是比较接近的,而越是接近的频率越容易产生混叠现象。这个图像实际上与混频很相似,只不过混频是纯模拟信号,这里是原信号与采样后离散信号的混叠,事实上也有混频的作用。但无论如何,这种频谱上的混叠都会产生失真,从而影响将来数字信号的恢复。

由于上述原因,信号最高频率之上必须滤除干净,才能使采样以及后续量化工作得以顺利实施。因此,在信号频率的高端就要加滤波器滤除高于最高频率的一切信号。无线电中使用的滤波器从功能分一般可以分为四种,即:高通滤波器,低通滤波器,带通滤波器,带阻滤波

器。如下图所示:

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(4)

虚线是理想波形,实线是实际波形

(a)图所示就是低通滤波器,从形状上大家可以看到它可以通低频阻高频,但同时也可以看到,其特性并不理想(图中虚线所示),从带通到带阻明显有个过渡区域,因此很难形成一个矩形的理想滤波特性。下图就是用了理想型低通滤波器后的采样频谱示意图:

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(5)

由于使用了理想抗混叠滤波器,因此可以不产生混叠现象,可实际上,理想的模拟滤波电路并不存在!

从图中可以看到如果低通滤波器足够理想的话,可以不产生混叠,因此,这种低通滤波器在此处被称为“抗混叠滤波器”。但是,如我们刚才所说,低通滤波器(尤其是模拟信号的低通滤波器)是无法做到理想化的矩形形状的。事实上,数字滤波器是可以做到这个矩形效果的,但是我们现在的工作是在数字化之前的工作,只能用模拟滤波器。那我们就用CD标准的实际情况举例吧,采样频率是44.1kHz,信号频率上限是20KHz,实际上留给低通滤波器的空间非常窄,如上图红绿交界处如果是22kHz的话,实际上滤波器可用的带宽也就4kHz,而普通一阶低通滤波器的衰减量也就是每倍频程6分贝,什么叫倍频程呢?比如如果从20kHz开始滤波的话,到40kHz也就是增加一倍频那么远的频点处才降低6分贝。这与现实要求差距太大了。因此必须采用非常极端的高阶滤波器才可以,而高阶滤波器的幅频特性并不理想,如下图所示:

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(6)

高阶抗混叠滤波器的特性并不理想!

如果把过渡带做的非常窄,则不但通带的纹波不好控制,整个波形的相位差也很不理想,这也是早期CD音质高频听起来很硬,很“噪”的根本原因,由于44.1kHz太接近理想的两倍取样频率,导致抗混叠滤波器非常难做,而且性能不佳,因此,站在这个角度来说,这个44.1kHz的采样频率,的确是太低了,不足以产生足够高保真的声音。因此,这件事儿到这儿发生了反转!

但是,真的就没办法了吗?前面说了,如果能用数字滤波器的话,就可以有非常理想的矩形滤波特性,可如何能用到数字滤波器呢,毕竟现在仅仅是模拟信号的前期处理,还没数字化呢!

俗话说,山穷水尽疑无路,柳暗花明又一村!就在这走投无路的时候,有人提出了超采样技术的概念。就是我们大幅度提高采样频率,比如到192kHz,这可是比44.1kHz高了整整4倍多啊,由于采样频率远远离开了最高截止频率,因此使得抗混叠滤波器的设计就容易得多,性能也优异得多!如下图所示:

详解CD编码格式16bit44.1kHz 详解CD编码格式16bit44.1kHz(7)

由于超采样技术的使用,使采样变得简单易行。

从图中可以看到,由于采样频率远离信号频谱,即便是低通滤波器“也就是抗混叠滤波器”滤波过滤带很宽,也不会产生混叠,因此在这种超采样的状态下,其采样效果是非常理想的。既不会有混叠失真,也不会有抗混叠滤波器产生的相位失真(因为不需要那么极端的设计了)。而一旦采样(包括量化)完成,变成的数字信号,则又可以将其下采样到44.1kHz,而这个过程就可以使用完美的数字滤波器,则可以使最终的采样结果,既符合44.1kHz的理想采样频率,又绕过了抗混叠滤波器的困扰!至此,这个CD标准之争再次被逆转!实际上,真正用来制作CD时候的超采样频率的选择,都是选44.1kHz的整数倍,这样的话,在下采样回到44.1kHz的时候,可以采用简单的抽样算法,几乎无损的回到44.1kHz,从而近乎完美的完成采样量化工作。

经过两次逆转,最终我们知道,44.1kHz的采样频率是可以完美的对最高频率为20kHz的音频信号进行采样的。CD采用的44.1kHz采样频率没毛病!下一节我再仔细分析一下16bit量化精度到底够不够高保真要求!谢谢阅读,我们下一篇再见!

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页