
發(fā)布
注冊
/
登錄聲場重構(gòu)的案例
聲場重構(gòu)技術(shù)詳解:如何用波場合成“再造”真實聽覺空間?
大家好,今天想和大家聊一下一個在聲學(xué)界受到越來越多關(guān)注的話題:聲場重構(gòu)。
大家都知道,在聲學(xué)領(lǐng)域,如何還原真實的聲場景日益引起學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。從物理實現(xiàn)的角度,利用揚聲器陣列在特定環(huán)境中呈現(xiàn)真實的聲場分布,使人們仿佛身臨其境,感受真實的聲效和聲音品質(zhì),這稱為聲場重構(gòu)。它在現(xiàn)實生活中具有重要的應(yīng)用價值。
為讓大家對這個主題有更多了解,我們計劃推出一系列微信文章(此處應(yīng)有掌聲),為大家介紹聲場重構(gòu)相關(guān)技術(shù)及其應(yīng)用場景。
今天先為大家介紹系列中的第一個主題——聲場重構(gòu)技術(shù)之一:波場合成。
聲場重構(gòu)技術(shù)之一:波場合成
波場合成(Wave Field Synthesis, WFS)是一種利用揚聲器陣列進(jìn)行空間聲場重構(gòu)的技術(shù),它可以在聽音室內(nèi)一個廣泛的區(qū)域準(zhǔn)確重構(gòu)聲場的物理特性,例如,利用一個揚聲器線陣列重構(gòu)多個聲源產(chǎn)生的聲場(圖1)。不同于傳統(tǒng)5.1或7.1聲道僅在聲場中心“皇帝位”再現(xiàn)真實聲場,WFS能夠在較大的區(qū)域再現(xiàn)真實聲場,當(dāng)人們移動到不同位置時,可以感受到現(xiàn)場不同位置的真實感覺。
圖1
理論基礎(chǔ)
1988年荷蘭Delft University of Technology的A. J. Berkhout教授提出了WFS的理論框架。其基本原理是,如圖2,根據(jù)Kirchhoff-Helmholtz積分方程,曲面S包圍的內(nèi)部聲場可以由表面聲壓和法向質(zhì)點振速共同作用得到,如果在表面S上連續(xù)分布一系列單極子和偶極子聲源,其聲源強度正比于對應(yīng)的表面聲壓及法向質(zhì)點振速,即可重構(gòu)曲面S的內(nèi)部聲場,見式(1)。
展開 王博聊聲學(xué) | 聲場重構(gòu)技術(shù)之一:波場合成
今天先為大家介紹系列中的第一個主題——
聲場重構(gòu)技術(shù)之一:波場合成。
聲場重構(gòu)技術(shù)之一:波場合成
波場合成
(Wave Field Synthesis, WFS)是一種利用揚聲器陣列進(jìn)行空間聲場重構(gòu)的技術(shù),它可以在聽音室內(nèi)一個廣泛的區(qū)域
準(zhǔn)確重構(gòu)聲場的物理特性
,例如,利用一個揚聲器線陣列重構(gòu)多個聲源產(chǎn)生的聲場(圖1)。不同于傳統(tǒng)5.1或7.1聲道僅在聲場中心“皇帝位”再現(xiàn)真實聲場,WFS能夠
在較大的區(qū)域再現(xiàn)真實聲場
,當(dāng)人們移動到不同位置時,可以感受到現(xiàn)場不同位置的真實感覺。
圖1
1
理 論 基 礎(chǔ)
1988年荷蘭Delft University of Technology的A. J. Berkhout教授提出了WFS的理論框架。
展開 高階 Ambisonics (HOA) 全解析:比 WFS 更實用的三維聲場重構(gòu)技術(shù)
相信大家還記得,WFS 雖然能實現(xiàn)高質(zhì)量聲場重構(gòu),但需要幾百通道的揚聲器陣列,堪稱聲學(xué)領(lǐng)域的 "土豪級" 系統(tǒng)。
那么,有沒有更加經(jīng)濟實用、部署更靈活的三維聲場重構(gòu)方案呢?
今天,我們就來系統(tǒng)介紹另一種主流的聲場重構(gòu)技術(shù) ——高階 Ambisonics (HOA)。從基本原理、采集方法、重構(gòu)技術(shù)到工業(yè)與商業(yè)應(yīng)用,一文講透這項正在改變聲學(xué)體驗的核心技術(shù)。
一、什么是 Ambisonics?從一階到高階的進(jìn)化
Ambisonics 是由牛津大學(xué) Michael Gerzon 在 1970 年代開創(chuàng)的三維空間聲場重構(gòu)技術(shù)。它的核心思想是:將聽音者置于一個虛擬 360° 球面的中心,完整記錄并重現(xiàn)來自球面各個方向的聲音,而非傳統(tǒng)立體聲僅有的前方兩個聲道,從而帶來更加可信、沉浸式的空間聽覺體驗。
一階 Ambisonics (FOA):基礎(chǔ)版 3D 聲
最初,Gerzon 等人利用無指向性和 8 字形傳聲器,采集聲場的零階和 3 個正交方向的一階信息,得到 4 路信號 (W, X, Y, Z),也就是我們常說的B-format 格式。這種系統(tǒng)被稱為一階 Ambisonics (FOA),目前已廣泛應(yīng)用于 VR 游戲、360° 視頻等消費級場景。
然而,從準(zhǔn)確重構(gòu)物理聲場的角度看,一階 Ambisonics 存在明顯局限:
只能在聽音區(qū)中心極小范圍內(nèi)準(zhǔn)確重構(gòu)聲場
空間分辨率低,聲源定位精度差
高頻重構(gòu)能力不足
高階 Ambisonics (HOA):基于球諧函數(shù)的突破
為了解決這些問題,Jér?me Daniel 等人發(fā)展了高階 Ambisonics (HOA) 技術(shù)。
展開 王博聊聲學(xué) | 聲場重構(gòu)技術(shù)之二:高階Ambisonics
為了追求高質(zhì)量的聲場重構(gòu),拓展上限頻率范圍,往往需要幾百通道的揚聲器陣列,可謂是“土豪”級的系統(tǒng)。
那么有沒有更加實用的聲場重構(gòu)系統(tǒng)呢?
今天我將介紹另一種聲場重構(gòu)技術(shù):高階Ambisonics(Higher Order Ambisonics,HOA)。
什么是Ambisonics?
Ambisonics是由牛津大學(xué)Michael Gerzon在1970年代發(fā)展起來的三維空間聲場重構(gòu)技術(shù)。想象一下,我們位于一個360°球面的中心,雙耳接收到來自球面各個方向上的聲音。如果我們記錄的空間聲場能夠以這種方式傳輸?shù)诫p耳內(nèi),而不僅僅只是前方的兩個喇叭,那么會給我們帶來更加可信、浸入式的體驗,這樣的系統(tǒng)就是Ambisonics。
最初,Gerzon等利用無指向性和8字形傳聲器采集聲場的零階和3個正交方向的一階信息,得到4路信號(即W, X, Y, Z,稱為B-format),然后用揚聲器重放出來,這樣的系統(tǒng)稱為一階Ambisonics(First Order Ambisonics),現(xiàn)廣泛應(yīng)用于VR游戲、360°視頻等。
但是,從準(zhǔn)確重構(gòu)物理聲場的角度,一階Ambisonics只能重構(gòu)很小區(qū)域內(nèi)的空間聲場,空間分辨率也比較低。Jér?me Daniel等發(fā)展了高階Ambisonics,基于空間聲場的球諧函數(shù)分解,利用一組聲場展開系數(shù)向量表示空間聲場信息。這類似于一個函數(shù)的泰勒展開,或者周期函數(shù)的傅里葉級數(shù)。展開系數(shù)的階數(shù)越高,其空間分辨率越高。聲場的頻率越高,也需要更高階的展開系數(shù)來表示。由于該展開系數(shù)是僅與頻率有關(guān),而與空間位置無關(guān)的一組向量,因此由它表示空間聲場具有簡潔、計算方便等優(yōu)點。
展開 
王博聊聲學(xué) | 聲場重構(gòu)技術(shù)之三:多通道均衡
有時,重構(gòu)系統(tǒng)和環(huán)境的聲學(xué)傳遞特性會發(fā)生變化,如溫度和濕度的改變、系統(tǒng)電聲特性的變化、受到外界干擾等,導(dǎo)致矩陣G發(fā)生變化,這時需要自適應(yīng)閉環(huán)控制,保證系統(tǒng)的
實時性和穩(wěn)定性。
圖2
如何求解揚聲器的輸入信號?
通常,傳聲器的數(shù)目大于揚聲器的數(shù)目,此時線性方程組是超定的,這樣在最小二乘意義下令重構(gòu)均方誤差最小,求解方程組。由于測量過程不可避免地存在測量噪聲,矩陣求逆時對噪聲非常敏感,微小的噪聲就會被嚴(yán)重放大。對于這種不適定問題,通常用截斷奇異值或者Tikhonov正則化方法處理,為了確保數(shù)值穩(wěn)定會過濾掉很多小的奇異值,這樣會丟失很多細(xì)節(jié)信息,這于聲場重構(gòu)是不利的。另外,這種求解方法在重構(gòu)點位置處取得很好的重構(gòu)效果,但在重構(gòu)點之間的區(qū)域,效果難以保證。
近年來,隨著
壓縮感知(Compressive Sensing)技術(shù)在聲源識別和聲場重構(gòu)中的成功應(yīng)用,利用聲場的稀疏性,通過較少的空間采樣就有可能
高精度地重構(gòu)聲場。這對實際工程應(yīng)用非常有幫助。這時傳聲器數(shù)目小于揚聲器數(shù)目,方程組是欠定的。可以利用凸優(yōu)化方法,對方程組解向量施加L1范數(shù)最小化約束求解。也可以利用迭代方法,計算速度更快。
怎樣保證聲場重構(gòu)的精度?
由以上可知,聲場采集的精度非常關(guān)鍵,垃圾輸入必然導(dǎo)致系統(tǒng)不穩(wěn)定,降低聲場重構(gòu)精度。在HBK,我們提供多種高精度的傳聲器、聲陣列和數(shù)據(jù)采集系統(tǒng),確保數(shù)據(jù)采集的精度。
展開 新年快樂 | 回顧2021年的精彩內(nèi)容
剛過去的一年
也許是豐收的、愉快的
也許是奔波的、難忘的
忙碌的您可能錯過了一些精彩內(nèi)容
點擊下方鏈接,
歡迎
查缺補漏
和我們一起
回顧2021,
喜迎2022
專欄文章
◆ 王博聊聲學(xué) | 聲場重構(gòu)技術(shù):波場合成
◆ 王博聊聲學(xué) | 聲場重構(gòu)技術(shù):高階Ambisonics
◆ 王博聊聲學(xué) | 聲場重構(gòu)技術(shù):多通道均衡
◆ 王博聊聲學(xué) | HBK噪聲源識別系統(tǒng)發(fā)展史
◆ 褚教授課程筆記 | 結(jié)構(gòu)動力學(xué)簡介
◆ 褚教授課程筆記 | 工作變形分析
◆ 技術(shù)工程師筆記 | Front-end Setup前端設(shè)置
◆ 技術(shù)工程師筆記 | Front-end Setup前端設(shè)置(續(xù))
◆ 技術(shù)工程師筆記 | Notar獨立記錄功能
干貨知識
展開 汽車輪胎力學(xué)研究分析
汽車高速運動產(chǎn)生的噪聲輻射的研究是一項國家自然科學(xué)基金項目,在國內(nèi)率先利用聲全息方法分析汽車的運動噪聲,建立了運動汽車聲源模型和虛擬匯聚聲源的聲場重構(gòu)理論,解決了分析這類聲場的理論問題,又設(shè)計制造了國內(nèi)第一臺運動聲全息現(xiàn)場分析設(shè)備用于實測分析,有關(guān)的"運動聲源分析方法"已申請國家發(fā)明專利。此外,還解決了中華牌轎車、北京吉普車、揚州亞星客車等整車的降噪問題。
結(jié)構(gòu)動力學(xué)測試分析軟件-漢航NTS.LAB
NTS.LAB軟件提供豐富的測量、分析模塊可供選擇,為目前的結(jié)構(gòu)動力學(xué)測試和分析提供最廣泛的支持:
軟件基于多種可選數(shù)據(jù)庫架構(gòu):SQL Lite、SQL,Oracle,亦可支持國產(chǎn)數(shù)據(jù)庫,實時FFT分析,STFT短時傅里葉分析,小波分析和長時間歷程時域數(shù)據(jù)記錄
實時應(yīng)力應(yīng)變測量和分析
旋轉(zhuǎn)機械特性數(shù)據(jù)采集和分析(轉(zhuǎn)速測量和階次跟蹤、動平衡分析、故障診斷、角度域分析及扭振分析)
聲學(xué)測試:倍頻程、聲強、聲功率測量,聲品質(zhì)分析
聲學(xué)相機:基于波束成形法和聲全息方法,具有平面陣列、球陣列等測量方式
模態(tài)試驗分析:幾何建模、ODS分析、錘擊法模態(tài)試驗、MIMO激振器模態(tài)試驗、GVT純模態(tài)試驗、OMA工作模態(tài)、階次模態(tài)、應(yīng)變模態(tài)、非線性模態(tài)分析
剛體特性測試(質(zhì)量、質(zhì)心位置、轉(zhuǎn)動慣量分析提取)
振動控制及數(shù)據(jù)同步跟蹤記錄
試驗和仿真的相關(guān)性分析,靈敏度分析,模型修正
高聲強混響室閉環(huán)控制和行波管窄帶譜閉環(huán)控制
自由場聲場重構(gòu)及聲激勵試驗
新能源汽車通過提示音設(shè)計試驗系統(tǒng)E-Sound
車輛換擋性能測試分析系統(tǒng)TSA
傳遞路徑分析(空氣傳遞路徑分析和結(jié)構(gòu)傳遞路徑分析)TPA
車輛通過噪聲測試PBN
開放的平臺,NTS.LAB不僅支持漢航自身硬件,亦可支持NI、VTI等硬件進(jìn)行實時數(shù)據(jù)采集和模態(tài)測試分析等應(yīng)用
NTS.LAB可運行在臺式機或筆記本計算機上,專為現(xiàn)場、實驗室的結(jié)構(gòu)動力學(xué)測試分析應(yīng)用而設(shè)計。
展開 王博聊聲學(xué) | 音頻主觀評價方法 – MUSHRA
例如車載音響系統(tǒng),由于座艙空間較小,低頻聲波在車內(nèi)的反射與疊加會形成駐波聲場,乘客位置的頻響并不平坦,出現(xiàn)顯著的峰值和谷值,導(dǎo)致主觀感受的降低。對于揚聲器陣列或者耳機重放的空間音頻,不同的聲場重構(gòu)算法和信號處理也會造成明顯的主觀感知差異。MUSHRA能夠準(zhǔn)確反映出人的主觀聽覺并給出可靠的結(jié)果,是項目中常用的評價方法。
什么是參考?
MUSHRA使用原始的全頻帶且未經(jīng)處理的信號作為參考。例如在AR/VR場景的主觀音質(zhì)評價,可使用人頭軀干模擬器HATS的雙耳錄音作為參考。主觀評價時,如果你給它的分值較低,那么你的結(jié)果就會被剔除出去。
什么是錨點?
MUSHRA使用至少2個隱藏錨點信號:一個是標(biāo)準(zhǔn)錨點信號,即對原始信號進(jìn)行低通濾波,截至頻率為3.5kHz;另一個是中等品質(zhì)的錨點信號,同樣是低通濾波,截至頻率為7kHz。錨點的作用是標(biāo)定打分尺度,使得比較小的音質(zhì)瑕疵不會給很低的分值。
評價者應(yīng)
具有主觀評價的經(jīng)驗
,能夠區(qū)分不同樣本的差別,并且對同一個樣本的評分應(yīng)非常接近。對評價者進(jìn)行非正式或正式評價訓(xùn)練非常重要,只有有經(jīng)驗的評價者的數(shù)據(jù)才能被使用。一般情況下,不超過20人即可給出較好的結(jié)果。在正式評價之前,需要對評價者進(jìn)行培訓(xùn)。
每一次評價的音樂樣本一般不超過12個,例如,9個音樂樣本、1個隱藏的低品質(zhì)錨點、一個隱藏的中等品質(zhì)錨點和一個隱藏參考樣本。樣本的最大長度一般為10s,最好不超過12s,以避免評價者疲勞并縮短時間。音樂樣本需要做等響處理,以保證聽音者在相同的情況下進(jìn)行評價。
每次評價時,
只對一個主觀屬性進(jìn)行評分
,不能一次評價多個主觀屬性。如果需要獨立評價多個音樂屬性時,推薦首先評價基本音頻品質(zhì)(Basic Audio Quality, BAQ)。
展開