如果你熟悉倍頻程,一定程度上,對于理解臨界頻帶是有幫助的。二者既有相同之處,也有明顯的差異之處。相同在于二者都有中心頻率和上、下限頻率;差異之處在于帶寬的劃分原理是完全不同的。倍頻程頻帶的劃分有確定的理論公式,而臨界頻帶的劃分則是由人耳耳蝸上的基底膜的不同部位的頻率選擇性決定的。因此,在講解臨界頻帶之前,我們必須了解基底膜的頻率選擇特性。
01
基底膜是耳蝸的中階與鼓階的分隔層,它是一個長的線狀結構,靠近卵圓窗(Oval Window)的一端寬度最窄、剛度最大,稱為“
底”部(Base),靠近蝸孔(Helicotrema)的一端寬度最寬、剛度最小,稱為“
頂”部(Apex)。從很窄的底部,沿著頂部方向逐漸變寬,變厚,頂部寬度大約是底部的三倍。整個基底膜長度約為32mm,如圖1所示。
圖1 基底膜長約為32mm
中耳鐙骨踏板在卵圓窗產生活塞式振動,活塞式振動將帶動耳蝸內的淋巴液流動,這些液體的運動會在前庭階產生行波,并轉移到基底膜上,引起基底膜的振動。基底膜沿著長度方向具有不同的屬性:寬度、剛度、質量、阻尼和管道尺寸。在長度方向給定位置的這些參數決定了它的
特征頻率(Characteristic Frequency),也就是它對這個頻率的聲音振動最敏感。換句話說,這些不同參數也就決定了基底膜的不同位置響應頻率不同:寬度窄、剛度大的部位(底部)對高頻響應好;寬度寬、剛度小的部位(頂部)對低頻響應好。因此,高頻聲音會使基底膜底部附近產生振動,低頻聲音會使基底膜頂部附近產生振動,這就說明基底膜特定部位對應于特定的聲音頻率。將基底膜沿著底部向頂部方向展開,輸入的不同頻率的聲波將在基底膜的不同部位產生響應,如圖2所示。這種基底膜不同部位對應不同頻率的響應特性,稱為基底膜部位的頻率選擇性。換句話說,不同頻率的聲音沿基底膜傳輸并集中在不同的部位,頻率在基底膜上按部位分離稱為
部位原理(place principle)。
圖2 基底膜的頻率選擇特性
將基底膜從卵圓窗處的底部向蝸孔處的頂部展開,如圖1一致,得到基底膜各個部位與相應頻率的對應關系如圖3所示。圖中頻率以kHz為單位,從圖中可以看出,在距基底膜底部5mm處,其響應頻率約為8kHz,隨著距離的增加到27mm處,響應頻率降低約為300Hz。另外,注意到隨著距離的增加,除了響應頻率在降低之外,相應的幅值也在降低。這說明基底膜不同位置對不同頻率的聲音信號,靈敏度不同,因此,人耳對聲音傳遞特性具有非線性。
圖3 基底膜部位與頻率響應的對應關系
需要注意的是,并不是某個特定的頻率只在基底膜上一特定位置處產生響應,實際上是在一個特定區域產生響應,只不過是響應的最大位移出現在這個特定位置而已,其位移響應曲線像個不對稱的小山丘,小山丘的峰值出現在這個特定位置處,從這個特定位置處向左右兩側延伸,左側(底部端)斜坡更緩,延伸更多,而右側(頂部端)斜坡更陡,延伸更少。這樣一來,基底膜對不同頻率的聲音的響應位移包絡曲線不對稱,圖4是對5個不同頻率的純音的響應,位移響應包絡最大峰值的左側(高頻區域)延展比右側(低頻區域)更多,這是因為基底膜對高頻信號的恢復比低頻信號慢。
圖4 基底膜對5個不同純音的響應位移包絡
傳遞到內耳基底膜的聲音信號的每個頻率成分都會使基底膜特定部位產生響應(振動產生位移),由于頻率分量產生的位移響應在峰值兩側有一定程度的延展,也就是說,某個頻率成分的聲音會使基底膜沿長度方向一定的區域(約1.3mm)產生響應,而不同頻率對應基膜不同部位。這樣一來,基底膜特定區域部位的頻率響應特性將聲音的頻率成分劃分成了一系列的頻率范圍,每個部位區域對應一定范圍內的頻率成分,我們將基底膜劃分的這一系列的聲音頻率范圍稱為臨界頻帶(critical band),每個臨界頻帶所對應的頻率寬度稱為臨界帶寬(critical bandwidth)。在聽力學和心理聲學中,臨界頻帶的概念,由哈維·弗萊徹(Harvey Fletcher)于1933年提出并于1940年進行了改進。
雖然人耳的可聽頻率范圍為20~20kHz,但是,隨著年齡的增大,可聽頻率范圍在逐漸變化,年齡越大,對高頻聲的聽覺感知能力越差,主要體現在可聽頻率上限的降低。健康兒童的可聽頻率上限可達20kHz,但是,到20歲以后上限頻率可能下降到16kHz,20歲以后隨著年齡的增加,上限頻率會繼續降低。對于成年人而言,其可聽頻率上限只有16kHz,基于這一點,臨界頻帶對應的頻率范圍為0~16kHz,下限為0,而非可聽頻率的下限20Hz。
02
每個臨界頻帶都有上下限,對應一定的臨界帶寬,與倍頻程一樣,那么怎么確定每個臨界頻帶的上下限頻率呢?
確定方法之一是基于雙耳聽覺,兩個幅值相近,頻率有差值的兩個純音信號是否能被聽覺系統分辨出來,取決于每個分量在基底膜上產生的位移包絡是否可清晰地分離。當同時播放兩個幅值相近的純音時,如果二者頻差低于15Hz,會出現明顯的拍現象。出現拍的聲音信號幅值忽高忽低(幅值波動),此時人耳是分辨不出來這種頻差的。當頻差進一步提高,大于15Hz時,聽感逐漸從拍音變成一個音高不明確的不穩定的聲音,此時實際上表現出粗糙特性。當頻差繼續增大到某一值時,兩個頻率從混合在一起變成可被人耳分離,但仍然有不平穩的聽感。當頻差繼續增大,聽感轉變為平穩。頻差增至某一值時,基底膜上的最大位移開始變為兩個峰值位移時,聽覺系統就可以分辨出兩個頻率的純音信號,而不是兩個信號的混合,如圖5所示。聽覺系統覺察兩個純音從不平穩可分離轉變為平穩可分離的頻率差,對應的帶寬為臨界帶寬,對應的頻帶稱為臨界頻帶。臨界帶寬是人的主觀聽感突然發生明顯變化的頻率寬度。
圖5 不同的頻差表現出不同的特性
臨界頻帶也與聽覺的掩蔽效應密切相關:當在同一臨界頻帶內存在第二個強度更高的信號時,聲音信號的可聽性明顯降低。大致來說,臨界頻帶是音頻頻率的頻帶,在這個頻帶內,第二個純音會通過聽覺掩蔽干擾第一個純音的感知。臨界頻帶的提出者弗萊徹就是利用掩蔽效應來確定臨界帶寬的。他假設噪聲中有效掩蔽測試音的部分是其頻譜中靠近這個測試音的那部分。為了獲得相對值和絕對值,還做了以下假設:當這個測試音的功率和位于這個測試音附近產生掩蔽效應的那部分噪聲頻譜的功率相同時,掩蔽就實現了;這個測試音附近頻譜之外的噪聲對掩蔽沒有貢獻。以這種方式定義的特征頻帶具有一定帶寬(臨界帶寬),當該測試音剛好被掩蔽時,在這個帶寬內的測試音功率與噪聲頻譜的聲功率相同。
也可以利用閾值測量法來確定臨界頻帶和臨界帶寬。當帶寬小于臨界帶寬時,總聲壓級在靜音閾值(或掩蔽閾值)處保持恒定。帶寬高于臨界帶寬時,總聲壓增加,表明臨界帶寬以外的成分既對靜音閾值無貢獻,也對掩蔽閾值無貢獻。落在一個臨界帶寬內的聲音強度既對靜音閾值有貢獻,也對掩蔽閾值有貢獻。
03
根據以上方法,將可聽頻率范圍0~16kHz劃分為24個臨界頻帶,對應于32mm長的基底膜24等分,每份長約1.3mm。頻率在500Hz以下,臨界帶寬約為固定值100Hz,在500Hz以上,臨界帶寬的增加速度比頻率增加速度慢一些,而在3kHz以上,臨界帶寬的增加速度比頻率增加速度快一些。在中心頻率500Hz以下,假設臨界帶寬恒定為100Hz,在中心頻率500Hz以上時,假設臨界帶寬約為臨界頻帶中心頻率的20%,如圖6所近似,這個假設是有用的。表1給出了各個臨界頻帶更準確的數值,給出了中心頻率fc、臨界頻帶的下限值fl和上限值fu和臨界帶寬ΔfG。由于一個臨界頻帶的上限頻率與下一個臨界頻帶的下限頻率相同,因此,它們是連續的,可以累加的。由于有24個臨界頻帶,每個對應相應的臨界帶寬,因此,也用數字0~24表示相應的臨界頻帶,稱為臨界頻率率z。
表1 臨界頻帶率z,臨界帶寬
ΔfG的下限(
fl)和上限(
fu),
fc為中心頻率


圖6 臨界帶寬是頻率的函數
在許多情況下,一個解析表達式用于描述整個聽覺頻率范圍內的臨界頻帶率(和臨界帶寬)對頻率的依賴關系。下面兩個表達式已經被證明是有用的:
04
臨界頻帶的概念對于描述聽覺感知很重要。許多模型都使用它,假設定義單位臨界帶寬為所謂的臨界頻帶率z。這個度量是基于這樣的事實,即我們的聽力系統將寬帶頻譜分析成與多個臨界頻帶相關的部分。將一個臨界頻帶與下一個臨界頻帶相加,采用這種方式:一個臨界頻帶的上限與下一個更高臨界頻帶的下限相等,形成
臨界頻帶率標尺(critical band ratio scale)。如果以這種方式將臨界頻帶相加,則每個交點都對應一個確定的頻率(見表1,為每個臨界頻帶的下限頻率)。這個過程如圖7所示。第一個臨界頻帶的范圍是0~100Hz,第二個是100~200Hz,第三個是200~300Hz,以此類推直到第24個是12000~15500H,當然,每個臨界頻帶的頻率范圍都在增加。繪制每個臨界頻帶對應的臨界頻帶率z序數為縱坐標,與圖7中作為頻率的函數產生一系列的點相對應。可以看出,在16kHz的可聽頻率范圍內,可以細分為24個相鄰的臨界頻帶。這一系列的點并不意味著臨界頻帶只存在于相鄰的兩個點之間;相反,它們應該被認為是能夠沿著通過這些點的曲線產生的標尺連續移動。按這種方法產生的標尺稱為
臨界頻帶率。它從0增加到24,單位為Bark,是為了紀念科學家巴克豪森,他引入了描述響度量級的單位“方”,這對臨界頻帶起著非常重要的作用。臨界頻帶率z和頻率f之間的關系對于理解人耳的許多特征是很重要的。
圖7 臨界頻帶率被繪制成頻率的函數
一個重要的事實變得清晰起來:頻率尺度是一個物理標尺度,在描述內耳產生的效應時不是很有用;在整個基底膜的長度上,線性和對數尺度都不適用。與頻率相比,臨界頻帶率可以沿著基底膜長度用線性尺度繪制出來,臨界頻帶率與頻率的對應關系見表1。因此,在討論聽力系統的特征或制作描述這些特征的詳細模型時,盡可能早地使用頻率到臨界頻帶率尺度的變換似乎是合理的。因此,以橫軸為0~24Bark(臨界頻帶率)表示的域,稱為
Bark域,對應可聽的頻率范圍劃分的24個臨界頻帶。由于臨界帶寬是主觀聽覺感受發生明顯變化的頻帶寬度。因此,Bark域與人的主觀感受更相關,在心理聲學領域被廣泛使用,如圖8所示用Bark域表示的某個聲音信號的特征響度。
[1]譚祥軍 從這里學NVH——噪聲、振動、模態分析的入門與進階(第2版),機械工業出版社,2021
[2]Hugo Fastl,Eberhard Zwicker,Psychoacoustics:Facts and Models,Springer,2006
[3]David M. Howard,Jamie A. S. Angus. Acoustics and Psychoacoustics (Fifth Edition), Routledge Press, 2017
文章來源:模態空間