王博聊聲學 | 聲場重構技術之二:高階Ambisonics

王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖1


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖2

 王 博 說

上期我們介紹了波場合成技術(Wave Field Synthesis, WFS)及其應用場景,大家是否還有印象?


它成功應用于娛樂場所的空間聲重放,例如電影院、歌劇院和體育場館等。為了追求高質量的聲場重構,拓展上限頻率范圍,往往需要幾百通道的揚聲器陣列,可謂是“土豪”級的系統。


那么有沒有更加實用的聲場重構系統呢?


今天我將介紹另一種聲場重構技術:高階Ambisonics(Higher Order Ambisonics,HOA)。


什么是Ambisonics?


Ambisonics是由牛津大學Michael Gerzon在1970年代發展起來的三維空間聲場重構技術。想象一下,我們位于一個360°球面的中心,雙耳接收到來自球面各個方向上的聲音。如果我們記錄的空間聲場能夠以這種方式傳輸到雙耳內,而不僅僅只是前方的兩個喇叭,那么會給我們帶來更加可信、浸入式的體驗,這樣的系統就是Ambisonics。


最初,Gerzon等利用無指向性和8字形傳聲器采集聲場的零階和3個正交方向的一階信息,得到4路信號(即W, X, Y, Z,稱為B-format),然后用揚聲器重放出來,這樣的系統稱為一階Ambisonics(First Order Ambisonics),現廣泛應用于VR游戲、360°視頻等。


但是,從準確重構物理聲場的角度,一階Ambisonics只能重構很小區域內的空間聲場,空間分辨率也比較低。Jér?me Daniel等發展了高階Ambisonics,基于空間聲場的球諧函數分解,利用一組聲場展開系數向量表示空間聲場信息。這類似于一個函數的泰勒展開,或者周期函數的傅里葉級數。展開系數的階數越高,其空間分辨率越高。聲場的頻率越高,也需要更高階的展開系數來表示。由于該展開系數是僅與頻率有關,而與空間位置無關的一組向量,因此由它表示空間聲場具有簡潔、計算方便等優點。


舉一個例子,自由空間傳播著頻率為1kHz的平面波,將其在球坐標系下進行球諧函數分解,可以得到不同階數N的展開系數。如果利用這些展開系數合成平面波的實部,會得到怎樣的結果呢?我們看圖1,如果用1階展開系數(即N=1),只能在球坐標系的中心處重構平面波;隨著階數的增大,準確重構平面波的范圍越來越大,見圖中黃色圓圈部分。


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖3

圖1

 

如何采集高階聲場信息?


球形陣列是最理想的采集方式,在球坐標系下對球面聲壓進行傅里葉變換,即可得到聲場展開系數。

球形陣列具有諸多優勢,例如:

  • 能夠有效采集來自于360°方向的三維空間聲場信息,非常適合于封閉空間

  • 球形陣列的信號處理更加簡單和高效,不同類型的球形陣列可以由統一的表達式描述;

  • 由于球面是閉合的,因此球面傅里葉變換不存在傳統陣列的有限孔徑誤差和窗效應,并且球諧函數域本身就是離散的,因此也不存在傳統傅里葉變換的卷繞誤差;

  • 從實際應用的角度,球形陣列的尺寸較小,因此測量更加方便。


常見的商業化的球形陣列有兩種:

  • 空心球形陣列,即傳聲器分布在一個鏤空的球面上。由于其傳聲器、線纜和支架等都裸露在聲場中,會對原始聲場產生散射等干擾。另外,在某些頻率點處,空心球形陣列會產生不穩定輸出,這被稱為球Bessel零點問題,這是空心球形陣列無法避免的。

  • 剛性球形陣列,將傳聲器齊平安裝在硬質球殼表面,傳聲器及其線纜都包裹在球殼內,避免對聲場的干擾。球面上傳聲器測量的聲壓為入射波與反射波的和,利用球面剛性邊界條件可以提取入射波,避免了球Bessel零點問題,在整個頻率范圍都有穩定的輸出


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖4      


什么是球Bessel零點問題?


這是針對空心球形陣列,其徑向函數的幅值在某些頻率處接近于零(即上圖中的谷值,上圖是半徑為0.2m的空心球形陣列的徑向函數),求逆后會出現極大值,從而導致陣列輸出不穩定。

在HBK,我們提供兩款剛性球形陣列,直徑都為19.5cm,接近于人頭的大小,球面傳聲器分別為36個和50個,如圖2,球面上黃金色的小圓點就代表傳聲器,它們近似均勻分布在球面上。華南理工大學聲學實驗室曾向我們定制過一個64通道球形陣列,用于空間聲重放方面的研究。


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖5

圖2

 

有時我們感興趣的空間范圍較大,比如高鐵的一節車廂、飛機艙內,或者較大的廳堂,此時球形陣列在一個位置上并不能獲得較大空間的聲場信息。我們可以用球形陣列分布式測量,比如將球形陣列放在不同的位置,或是多個球形陣列同時測量,然后將不同位置獲得的局部展開系數變換到全局坐標系下,如圖3。


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖6

圖3

 

具體計算聲場展開系數時,除了球傅里葉變換方法外,還可以建立線性方程組,利用最小二乘法求解。這種方法的好處是對球面傳聲器的布置沒有嚴格要求,數量也減少了,對測量本底噪聲更加魯棒,因此實際中更加常用


如果聲場在某個基函數(如平面波或球諧函數)下是稀疏的,還可以利用壓縮感知(CompressiveSensing, CS)方法求解。例如三維空間的低頻聲場,體現為聲模態的疊加,或者自由空間少數幾個聲源輻射的聲場,都可以探索其稀疏性。利用CS,不僅能夠獲得更高階的聲場展開系數,還可以顯著降低對球面傳聲器個數的要求

 

如何重構真實聲場?

高階Ambisonics的一個顯著特點是聲場采集和聲場重構是完全獨立的,在獲得高階聲場展開系數后,接下來要做的就是:1)選擇合適的揚聲器布置;2)把高階聲場展開系數轉變為揚聲器信號重放出去。


想象一下,如果把揚聲器布滿整個球面,而我們位于球面的中心處,那么我們就可以聽到來自四面八方的聲音,不僅可以準確感知聲源的方位、距離和大小,還可以體驗到更加真實的沉浸感和空間感。實際中,為了達到最高效的布置,可以將揚聲器均勻或近似均勻布置在球面上。例如,空間絕對均勻分布的正多面體:正四面體、正六面體、正八面體、正十二面體和正二十面體,將揚聲器布置在頂點或面心上,這樣可以準確求解出揚聲器信號。


如果條件不允許這么布置怎么辦?沒關系,我們可以綜合考慮重構聲場的穩定性、準確性和房間實際情況,靈活布置揚聲器。比如,在球面不同緯度分層布置,如圖4,根據模態匹配方法(Mode matching method)建立線性方程組,計算矩陣的偽逆從而得到揚聲器信號,但要注意矩陣的條件數,判斷系統是否穩定。


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖7

圖4


丹麥DTU的Audio-Visual Immersion Lab (AVIL)就依照分層布置建立了一套聲場重構系統,由球面上的64個揚聲器、4個低音炮和一個頭顯(Head-mounted Display)組成。它的主要作用是在聽音者的周圍重構真實聲場,研究在復雜多變的環境下人耳的空間聽覺特性。丹麥著名的助聽器廠商GN也照此建立了一套小型聲場重構系統,開展更加真實、可控制和可重復的試驗,從而幫助開發更好、更智能的助聽器。


更一般地,高階聲場展開系數還可以通過任意的揚聲器布置進行重構,例如環繞5.1/7.1聲道、不規則布置等。當然,這也面臨著很大的挑戰,是一個研究熱點。

 

有哪些應用場景?

在商業領域,最常見的應用場景有娛樂場所的空間聲重放、虛擬現實VR、360°視頻和全景聲等。隨著消費電子產品的快速發展,家用音響、電腦、手機、TWS耳機等娛樂通訊設備都有可能是潛在的應用場景。值得一提的是,高階Ambisonics在雙耳聲重放(耳機、VR頭顯等)方面有重要的應用,有機會我們再探討。


在工業領域,憑借高階Ambisonics的諸多優勢,準確重構空間聲場(無論是局部空間或者是全空間)可用于

  • 助聽器、人工耳蝸等的聲學研發與性能評估

  • 訓練模擬器、駕駛模擬器等的真實聲場景模擬

  • 飛機、高鐵等艙內的降噪評估與聲品質評價

  • 室內聲場的可聽化

 

# 參 考 文 獻

1. 謝菠蓀,空間聲原理[M],北京:科學出版社,2019

2. F. Zotter, M. Frank, Ambisonics[M], Springer, 2019


S&V DAY

/ /

2021-07-14

7月14日,我們將在上海舉辦

HBK 2021聲學與振動技術交流日

屆時,王巖博士也將有精彩的主題演講

想和王博面對面聊聲學?

記得點擊下圖報名哦!


王博聊聲學 | 聲場重構技術之二:高階Ambisonics的圖8


登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

3
1