声卡原理初探 ZT | |
近年来声卡成长快速, 使用者在采购时, 往往不知所从而难以选择。但是就音效 卡的一些基本原理来看,其实都是一样的, 所以我们将从声音的数位化开始介绍, 进而说明声卡的基本原理及对声音的处理流程, 并配合实际的声卡来解说。相信看完本文以後读者对音 效卡定能有更深一层的认识。 从声音数位化谈起 在自然界我们所听到的声音都是经由空气或一些介质所传播的, 就物理学的观点来看, 声音可以用波形图表示出音高(Pitch)、音量(Volume)、音色(Tone或Timbre) 叁种组成要素。这些声音都是连续的讯号,也就是所谓的类 比讯号;然而我们都清楚电脑只能处理0或1的数位讯号, 也就是不连续的讯号。由此可 见一片声卡最基本的功能,就是要有把所录到的类比讯号转换成为电脑可 以接受的数位讯号,以及将处理完成的数位音源讯号转换成类比音源讯号输出,一般将这两种过程称作:Analog-to-Digital Conversion (ADC) 与Digital- to-Analog Conversion (DAC)。 取样频率与解析度 通常要把类比讯号转换成数位讯号时,必须经过一种取样(sampling)的过程。在取样的过程中有几个参数会影响到转换後声音的品质, 其中之一就是取样频率(sampling rate)。一般而言取样频率要高过原音源的最高频率才行,其单位是以赫兹(Hz)来表示, 1Hz就代表每秒 取样一次,人类所能听到的声 音频率最高大约在20KHz左右, 所以取样频率至少要高於20kHz。另一个影响因素是取样解析度(samplingresolution), 取样解析度可以用位元(bits)来解释, 如果声卡是8位元, 就是每次取样的数据可解析成 2的8次方 = 256种表示等级, 所以如果 是16位元的声卡就有65536种, 如果不考虑设计的因素, 解析度高的16位元声卡要比8位元声卡来的好听。 采样频率是指每秒钟对音频信号的采样次数。单位时间内采样次数越多,即采样频率越高,数字信号就越接近原声。根据奈魁斯特的采样定理,采样频率只要达到信号最高频率的两倍,就能精确描述被采样的信号。一般来说,人耳的听力范围在20hz到20Khz之间,因此,只要采样频率达到20Khz×2=40Khz时,就可以满足人们的要求。现时大多数声卡的采样频率都已达到44.1或48Khz即达到所谓的CD音质水平了。一般若要达到雷射唱机(即CD唱机)的水准,取样解析度至少要16bit, 取样频率要在44.1KHz左右,这也就是为什麽目前一般声卡的最高取样频率都是44.1KHz的原因。 这里顺便提一下,我常听一些人说:SoundBlaster AWE32是32位声卡,而SoundBlasterAWE64则是64位声卡,因此音质比16位声卡要好。其实这是认识上的一个误区,以上两款声卡的“32”、“64”指的是32种复音与64位复音,复音越多,音效越逼真,但这与采样位数无关。SoundBlasterAWE32 与SoundBlaster AWE64均为16位声卡。 PCM与FM音源 在这整个取样过程通常被称为PCM(PulseCode Modulation), 以这种方式取得的音源就叫做PCM音源, 这与常听到的FM(Frequency Modulation)合成音源是有所不同的;基本上, PCM音源比较接近原音,但也较容易产生杂讯, 而FM所合成的音源虽然较无杂讯,但是却不够传真。 基本原理介绍 输出入装置 一片声卡通常会有Line In/Line Out、MIC/Speaker Out 两组输出入插孔及一个15-pin的MIDI接头, 而各家声卡在制作上都有其考量, 所以会有些差异。如果要输入CD或卡带的音乐时,可以连接Line In, 至於用麦克风来输入声音, 就要连接在MIC接头;这两种输入之差别在於其讯号的放大率不同。因为一般麦克风的讯号较小,所以MIC端的放大率会设计得较大, 并且会配合麦克风的特性来修正,所以一般音乐的输入和麦克风最好分别输往Line In及MIC不可混用,以免造成失真或放大率不足的情形。 至於Line Out与Speaker Out的区别也大致相同,如果声卡输出的声音会透过具有功率 扩大功能的喇叭来播出的话,使用Line Out就 可以了,如果喇叭没有任何扩大功能而且也没有使用外部的扩大机,建议你最好使用Speaker Out的输出, 因为通常声卡会利用内部的功率扩大功能将声音从Speaker Out 输出, 一般声卡最大输出只有4瓦左右。 特别说明:现在的板载声卡上基本上就没有Speaker Out输出,只有一个Line Out,音箱或耳机都是接在这个口上。 类比-数位/数位-类比(AD/DA)转换(就是我们常说的模数/数模转换) ●类比转数位(ADC): 输入的类比音源经过ADC後会被转换成一系列的不连续讯号, 这也就是我们一开始所说的取样(sampling) 。通常讯号摆动的范围,必须在 A/D 转换器可以适用的范围内, 而且取样的位元数不可太低,如此才能维持好的精准度。 ●数位转类比(digital-to-,DAC):数位转类比是将不连续的数位讯号, 转换成连续性的类比声音。实际上, 声音从原先的类比音源转成数位後, 经过声卡的编辑处理, 再经由数位-类比的转换,才可以从声卡输出, 这一连串的转换处理过程,所输出的声音与原始的音源已经有所差别, 即一般所说的失真。 数位音源处理器(DSP) DSP (Digital Signal Processor)是一种数位讯号处理的晶片, DSP的功能通常包括了取样频率的控制, 对声音的录制与播放控制, 处理MIDI指令等等, 有些声卡的DSP还有音源资料压缩的功能。另外,如果声卡有混音晶片(Mixerchip), 就可以透过软体的操作来对声音做各种控制,例如:音量的高低控制, 音场调整效果等。所以DSP可说是声卡中非常重要的晶片,所有数位音源讯号的处理, 都可以说是DSP的功能范围。至於声卡中,是将所有功能都制作在同一片晶片里, 或是各种功能独自烧录为单独的晶片, 就完全看各声卡厂商的设计了 跳接器Jumpers(即跳线) 跳接器通常是一组跳针所集合成的,主要的功能是用来定义一些主机板或介面卡的硬体设定, 一个2-pin的跳针就只有两种设定方式:enable及disable。一组跳接器就是利用这种0或1的组合, 定义出各种不同的硬体设定,所以购买声卡时一定要检查是否有各种硬体跳接设定的说明。 音效合成装置 在声音讯号未经过DAC转换之前都是数位式的, 我们可以将几个数位讯号音源加以组合出各种声音而产生音效, 这就是一般所称的FM(Frequency Modulation, 调频)。早期的声卡大都使用Yamaha-3812、Yamaha-262这两种晶片,在最早推出的Yamaha-3812晶片中是采用两种音效合成的演算方法,一般也称作OPL2, 至於 Yamaha-262,Yamaha-263一般则称作OPL3及OPL4。 光碟机连接介面 以前的独立声卡都会提供几种光碟机(CD-ROM)的连接介面, 这样一来就可节省电脑中多占一片介面卡的空间, 以 Sonud Blaster 音效卡为例, 就提供了SONY CD-ROM、Mitsumi CD-ROM及Creative CD-ROM的叁种连接介面。在购买声卡时, 最好要考虑与光碟机的搭配, 以免造成困扰。(这个估计只有老玩家才用过的功能,现在的声卡上很少有了,板载声卡上就压根没了) 声音基本处理流程
当一个音源输入後, 会先经过滤波器做预先的取样、类比转数位的变换, 再由数位讯号处理晶片(DSP)负责将此音源做各种处理,其中可能包括由FM晶片产生合成音效, 或是到WaveTable取出音源, 更可以透过汇流排介面晶片(Bus Interface chip)存取光碟机或硬碟中的音效档案, 这些经过处理後的数位音源,再透过数位转类比的变换而输出。有些声卡含有混音处理晶片(Mixerchip), 可以处理多种音源的输入并提供 软体调整音量的功能。 何谓MIDI?MIDI英文全名为Musical Instrument,简单来说是为连接各种电子乐器及相关仪器的通讯标准。最早MIDI的统一规格是从日本开始, 後来美国也成立「国际MIDI协会(International MIDI Association, 简称IMA MIDI,即乐器数字化接口,是一种用于计算机与电子乐器之间进行数据交换的通信标准。MIDI文件(通常以.mid为文件扩展名)记录了用于合成MIDI音乐的各种控制指令,包括发声乐器、所用通道、音量大小等。由于MIDI文件本身不包含任何数字音频信号,因而所占的贮存空间比wav文件要小得多。MIDI文件回放需要通过声卡的MIDI合成器合成为不同的声音,而合成的方式有FM(调频)与Wave table(波表)两种。早期的声卡及目前大多数廉价的声卡都采用的FM合成方式。FM合成是通过振荡器产生正弦波,然后再叠加成各种乐器的波形。由于振荡器成本较高,即使是OPL3这类高档的FM合成器也只提供了4个振荡器,仅能产生20种复音。因此MIDI音乐听起来生硬呆板,带有明显的人工合成色彩,即所谓的电子声。 合成不同,波表合成是采用真实的声音样本进行回放。声音样本记录了各种真实乐器的波形采样,并保存在声卡上的RAM中。因此,要分辨一块声卡是否波表声卡,只需看卡上有没有ROM或RAM存储器即可。 |