不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

聲音定位的案例

我們?nèi)绾?em>定位聲音?如何重現(xiàn)真實的聲學體驗?
聲音的空間屬性 對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。 我們?nèi)绾?em>定位聲音? 我們的聽力使用的第一個線索是 雙耳時間差 (圖1a)。來自我們正前方或正后方的聲音會同時到達雙耳。如果信號源向左或向右移動,我們的聽覺系統(tǒng)會識別出來自同一信號源的聲音分別到達雙耳,但是會有一定的延遲,或者從另一個角度看,兩只耳朵接收到同一個信號的不同相位。 兩耳時差 圖1a:當聲音來自前方,雙耳時間差為零(左)。當聲音來自側(cè)面,頭的尺寸約為20厘米,聲速為340米/秒,最大時差為0.58毫秒(右) 在低頻下可以最佳地 破譯 相位差。在較高的頻率下,與頭部的尺寸相比,波長可能太短,以至于信號模式自身重復,兩只耳朵可能碰巧接收到相同的相位(圖1b)。 兩耳相位差 圖1b:通常耳朵會感測到相位差(左),根據(jù)頻率和入射角度,它們可以檢測到虛假相位匹配(右)。 幸運的是,聽覺系統(tǒng)可以借助另一個線索:當聲音從側(cè)面到達時,我們的 頭部會產(chǎn)生聲影區(qū) ,并隨頻率上升而擴大。 在非常低的頻率下,我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此,無論聲音從哪個方向到達,左耳和右耳的聲壓基本相同。 然而,隨著頻率的增加,波長減小,此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物,使得與面向聲源的耳朵相比,當其到達頭部另一側(cè)的耳朵時,較高頻率的成分將被衰減。 我們的耳廓的形狀還可提供豐富的 頻譜 (依賴于頻率) 線索 。像頭部的聲影區(qū)一樣,耳廓起到一個屏蔽層的作用,使不是從前面直接進入的較高頻率的聲音衰減。你可以通過轉(zhuǎn)離再轉(zhuǎn)向一個聲源來體驗這一點。
展開
我們?nèi)绾?em>定位聲音?如何重現(xiàn)真實的聲學體驗?
聲音的空間屬性 對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。 我們?nèi)绾?em>定位聲音? 我們的聽力使用的第一個線索是 雙耳時差 (圖1a)。來自我們正前方或正后方的聲音會同時到達雙耳。如果信號源向左或向右移動,我們的聽覺系統(tǒng)會識別出來自同一信號源的聲音分別到達雙耳,但是會有一定的延遲,或者從另一個角度看,兩只耳朵接收到同一個信號的不同相位。 兩耳時差 圖1a:當聲音來自前方,雙耳時差為零(左)。當聲音來自側(cè)面,頭的尺寸約為20厘米,聲速為340米/秒,最大時差為0.58毫秒(右) 在低頻下可以最佳地 破譯 相位差。在較高的頻率下,與頭部的尺寸相比,波長可能太短,以至于信號模式自身重復,兩只耳朵可能碰巧接收到相同的相位(圖1b)。 兩耳相位差 圖1b:通常耳朵會感測到相位差(左),根據(jù)頻率和入射角度,它們可以檢測到虛假相位匹配(右)。 幸運的是,聽覺系統(tǒng)可以借助另一個線索:當聲音從側(cè)面到達時,我們的 頭部會產(chǎn)生聲影區(qū) ,并隨頻率上升而擴大。 在非常低的頻率下,我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此,無論聲音從哪個方向到達,左耳和右耳的聲壓基本相同。 然而,隨著頻率的增加,波長減小,此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物,使得與面向聲源的耳朵相比,當其到達頭部另一側(cè)的耳朵時,較高頻率的成分將被衰減。
展開
CAE仿真與大數(shù)據(jù)、虛擬現(xiàn)實以及人工智能
在感知方面,仿真以視覺和聽覺為主,而虛擬現(xiàn)實不僅有視覺、聽覺,還有觸覺等方面的感知,可以說仿真基本上將用戶視為“旁觀者”,而虛擬現(xiàn)實則將用戶視為“當局者”;在逼真度方面,仿真技術(shù),仿真技術(shù)是對真實物理系統(tǒng)某一層次上的抽象,而虛擬技術(shù)采用實時三維圖像與顯示、三維聲音定位與合成技術(shù)、傳感器等技術(shù),做到了人與環(huán)境的交互性,有非常高的逼真度。 縱觀當下工業(yè)仿真軟件,可視化、智能化的仿真已成趨勢,在仿真中運用虛擬現(xiàn)實技術(shù),不僅能更加形象直觀地顯示仿真全過程,而且會讓計算機與人之間的溝通更人性化,增強仿真系統(tǒng)的尋優(yōu)能力。 圖2 仿真與虛擬現(xiàn)實 仿真與人工智能的碰撞 仿真優(yōu)化的應(yīng)用目標是為用戶提供一個輔助決策支持工具,而實際工程設(shè)計問題一般比較復雜,涉及因素較多,完全依靠計算機來進行決策很難考慮周全,隨著人工智能技術(shù)的發(fā)展,將領(lǐng)域知識引入到仿真優(yōu)化系統(tǒng)中,建立決策支持系統(tǒng),充分發(fā)揮人的創(chuàng)造性和計算機的計算能力,實現(xiàn)人機協(xié)同決策功能。 目前的仿真優(yōu)化系統(tǒng)要求用戶對仿真優(yōu)化算法和仿真建模工具有較深入的了解,才能夠開展工程應(yīng)用,如各種仿真優(yōu)化算法存在大量運行參數(shù)需要選擇,仿真實驗也需要設(shè)置各種參數(shù),如仿真開始時間、仿真結(jié)束時間、仿真迭代次數(shù)和“預熱”時間等等,任何一項參數(shù)的變動對仿真優(yōu)化結(jié)果都會產(chǎn)生影響,要求非仿真專業(yè)人員來完成這些設(shè)置幾乎是一件不可能的事。因此,利用專家知識系統(tǒng)作為輔助,協(xié)助普通人完成這些專業(yè)工作是一個可行的實現(xiàn)方法。 圖3 人工智能與天氣模擬 總之,隨著中國2025、智能制造、工業(yè)4.0、“互聯(lián)網(wǎng)+”等新一輪工業(yè)革命的興起,新技術(shù)與傳統(tǒng)制造的結(jié)合催生了大量新型應(yīng)用,仿真軟件也開始結(jié)合大數(shù)據(jù)、虛擬現(xiàn)實、人工智能等先進技術(shù),在研發(fā)設(shè)計、生產(chǎn)制造、服務(wù)管理和維護反饋等工業(yè)各個環(huán)節(jié)中凸顯更為重要的作用。
展開
智能座艙設(shè)計發(fā)展趨勢
2.多渠道、融合的交互將成為人車交互的中流砥柱 除了按鍵、觸控、語音,在推出的車型中,還發(fā)現(xiàn)了語音助手、手勢識別、指紋、聲音定位、人臉識別、全息圖像等人車交互方式。例如,寶馬Natural Interaction這一全新的交互系統(tǒng),計劃于2021年提供給新款iNext,與語音和手勢控制以及視線識別無縫集成,讓駕駛員可以在交互系統(tǒng)中選擇自己想要的;2020年9月發(fā)布的全新奔馳S級,升級了手勢識別能力,可以通過中控臺進行手勢控制,通過車載攝像頭識別面部方向和肢體語言,按需開啟功能。 在設(shè)計更簡單、易于使用的車輛駕駛艙時,應(yīng)首先考慮安全性,作為人車交互界面。希望能在智能汽車上看到面料交互、車窗交互、智能大燈交互、虹膜識別、唇讀識別等多渠道融合的交互模式,帶來更好的用戶體驗。 3. 3D、多屏、大尺寸顯示、多樣化布局將成為智能座艙顯示的趨勢 在基于場景的交互時代,駕駛艙布局不再遵循相同的模式。中控臺一體化顯示設(shè)計,從雙屏、三屏到五屏顯示,除了常規(guī)的中控臺和集群設(shè)計外,2020年已經(jīng)被不少主機廠采用。此外,控制屏、副駕駛娛樂屏、后排顯示屏、透明A柱等新型顯示屏也以全新方式部署在車內(nèi)。2019年哪吒U增加了透明A柱;虛擬后視鏡安裝在2020 款奧迪 e-tron Sportback 的駕駛員側(cè)車門上,這些新設(shè)計無疑是新車的新亮點。 4.以“用戶體驗”為中心的座艙場景交互模式將變得無孔不入 對于車載場景交互模式,市場上的新車型通過從語音和環(huán)境光到智能座椅和車載攝像頭的智能配置提供簡單的場景交互。以2020年9月推出的奔馳S級為例。
展開
聲音定位圖1
語音識別系列之脈沖神經(jīng)網(wǎng)絡(luò)特征工程
對于1kHz聲波及其對應(yīng)毛細胞激發(fā)的脈沖,鎖相現(xiàn)象表明動作點位啟動時間的精確度,必然高于1ms,正是這種精確度滿足了聲音定位的需求。 注3:對某一時間段內(nèi)(對應(yīng)時頻圖分析方法中的某一幀),不同頻率聲波映射到耳蝸的不同位置,稱為位置編碼,而時頻塊的值的大小,或說當前幀內(nèi)該頻點的聲強,則對應(yīng)發(fā)放神經(jīng)脈沖的數(shù)目。 耳蝸將機械波轉(zhuǎn)化為電脈沖的生物學過程,可詳見[4-7],四書原理插圖,內(nèi)/外毛細胞電鏡照片均十分精美,由于潛在的版權(quán)問題,此處不截圖。 基于物理模型的Audio2Spike轉(zhuǎn)換方法的問題在于: (a)模型參數(shù)較多且均是提前設(shè)定好的固定值,每一個參數(shù)的變動對最終效果的影響位置,合理變化范圍也未知。 (b)模型轉(zhuǎn)換得到的神經(jīng)脈沖序列,與真實生物過程不一定一致,從編碼角度來說也不一定是最優(yōu)的(攜帶足夠的信息,同時脈沖個數(shù)又少)。而且也無法組織真人實驗來驗證,畢竟幾乎唯一的驗證方法是主觀的,需要借助人工耳蝸的電極播放脈沖,讓人主觀評價聽感的好壞。但人工耳蝸總不可能對健聽者植入,只可能對聽障者做實驗,即便實驗證明不真實,也缺少模型參數(shù)調(diào)整的指導方向,幾乎就是盲調(diào)。 (2)人工耳蝸物理轉(zhuǎn)錄 人工耳蝸可作為動態(tài)音頻傳感器(Dynamic Audio Sensor, DAS),記錄人工耳蝸對音頻數(shù)據(jù)的響應(yīng),將TIDIGITS音頻數(shù)據(jù)集轉(zhuǎn)錄為N-TIDIGITS脈沖數(shù)據(jù)集[8]。 注:與聽覺對應(yīng)地,也存在動態(tài)視覺傳感器(Dynamic Vision Sensor, DVS),也被稱為事件相機(Event-based Camera),詳見iniVation官網(wǎng)[9]。
展開
3D收聽 | 聽覺系統(tǒng)的特殊能力——確定聲源的位置
聲音的空間屬性對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。那么它是如何工作的,要重新創(chuàng)造一個真實的體驗需要做什么? 我們?nèi)绾?em>定位聲音? 我們的聽力定位聲音使用的第一個線索是雙耳時差(圖1a)。來自我們正前方或正后方的聲音會同時到達雙耳。但如果信號源向左或向右移動,我們的聽覺系統(tǒng)會識別出分別到達雙耳的是來自同一信號源的聲音,但是左右耳會有一定的延遲,或者從另一個角度看,兩只耳朵接收到了同一個信號的不同相位。 兩耳時差 圖1a:聲音來自前方,雙耳時差為零(左)。聲音來自側(cè)面,頭的尺寸約為20厘米,聲速為340米/秒,最大時差為0.58毫秒(右) 人耳在低頻情況下可以很好地解密相位差,但在較高的頻率下,與頭部的尺寸相比,波長可能太短,以至于信號制式自身重復,兩只耳朵可能碰巧接收到相同的相位(圖1b)。 兩耳相位差 圖1b:通常耳朵會感測到相位差(左),根據(jù)頻率和入射角度,它們可以檢測到虛假相位匹配(右)。 幸運的是,聽覺系統(tǒng)可以借助另一個線索:當聲音從側(cè)面到達時,我們的頭部會產(chǎn)生聲影區(qū),并隨頻率上升而擴大。在非常低的頻率下,我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此,無論聲音從哪個方向到達,左耳和右耳的聲壓基本相同。然而,隨著頻率的增加,波長減小,此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物,使得與面向聲源的耳朵相比,當其到達頭部另一側(cè)的耳朵時,較高頻率的成分將被衰減。 我們的耳廓的形狀還可提供豐富的頻譜(頻率依賴)線索。像頭部的聲影區(qū)一樣,耳廓起到一個屏蔽層的作用,使不是從前面直接進入的較高頻率的聲音衰減。你可以通過轉(zhuǎn)離再轉(zhuǎn)向一個聲源來體驗這一點。這樣做的時候,你應(yīng)該能感受到高頻率的微小變化,而這種變化你通常是不會注意到的。
展開
從“雙耳時間差”到“元宇宙”:聽覺如何塑造空間感?
作者:Matthias Scholz 用戶界面設(shè)計師、應(yīng)用聲學博士 我們聽覺系統(tǒng)有一個非常強大的能力——定位聲源的位置。 無論是在交通安全導航,還是在游戲、家庭影院中營造逼真聲場,聲音的空間屬性都至關(guān)重要。 我們?nèi)绾?em>定位聲音? 首先,聽覺系統(tǒng)會利用雙耳時間差(圖1a)。 正前方或正后方傳來的聲音會同時到達雙耳。但如果聲源偏左或偏右,聲音就會先后到達兩只耳朵,產(chǎn)生微小的時間差。從另一個角度看,雙耳接收到的其實是同一聲音的不同相位。 兩耳時差 圖1a:當聲音來自前方,雙耳時間差為零(左)。當聲音來自側(cè)面,頭的尺寸約為20厘米,聲速為340米/秒,最大時差為0.58毫秒(右) 在低頻情況下,我們的大腦能很好地解析相位差。但頻率升高后,波長可能短于頭部尺寸,導致雙耳接收到的相位出現(xiàn)混淆,甚至出現(xiàn)“虛假匹配”(圖1b)。 兩耳相位差 圖1b:通常耳朵會感測到相位差(左),根據(jù)頻率和入射角度,它們可以檢測到虛假相位匹配(右)。 幸運的是,我們還有第二條線索:頭部遮擋效應(yīng)。 當聲音從側(cè)面?zhèn)鱽恚^部會在另一側(cè)形成“聲影區(qū)”。頻率越高,遮擋效果越明顯。低頻聲音波長較長,能繞過頭部,雙耳聽到的聲音強度相近;而高頻聲音波長較短,會被頭部阻擋,導致遠離聲源的那只耳朵聽到的聲音變?nèi)酢?此外,耳廓的形狀也會提供重要的頻譜線索。 耳廓不僅會阻擋非正前方的高頻聲,其復雜結(jié)構(gòu)還會對聲音進行反射和濾波,增強或減弱某些頻率。你可以試著轉(zhuǎn)動頭部感受一下:當偏離聲源時,高頻會略微減弱——這種細微變化平時不易察覺,卻是定位聲源的重要依據(jù)。
展開
新年快樂 | 回顧2021年的精彩內(nèi)容
◆ 我們?nèi)绾?em>定位聲音? ◆ 如何正確選擇合適的傳聲器? ◆ 為何選擇傳聲器時忽略聲場會產(chǎn)生誤差? ◆ 如何用更少的投入進行高級噪聲源識別? ◆ BK小課堂 | 電聲測量的定義、方式及參數(shù) ◆ 什么是靜平衡/動平衡?
聽到呼救聲就能定位求助者
近日,德國弗勞恩霍夫協(xié)會通訊、信息處理和人機工程學研究所(Germany’s Fraunhofer FKIE institute)的研究人員研制了一種無人機,可以通過麥克風收集聲音,然后分析判斷出人類求救的尖叫聲以及聲音方向,來定位需要幫助的人。 這款無人機配有兩個核心裝置,分別是利用聲音特征訓練出的人工智能軟件和微型數(shù)字麥克風構(gòu)成的陣列,來保證搜尋有效性和快速性。 一、無人機搜救新方向:空中聲學定位 該項目首席科學家之一瑪卡麗娜·瓦雷拉(Macarena Varela)告訴《華盛頓郵報》:“與地面救援人員或訓練有素的狗相比,無人機可以在更短的時間覆蓋更大的區(qū)域。如果有倒塌的建筑物,無人機可以提醒和協(xié)助救援人員,可以去到救援人員自己無法到達的地方。” “配置”不同的無人機,常應(yīng)用于不同場景。例如,多數(shù)情況下,無人機被用來拍攝被損壞建筑物的航拍圖像,有些無人機具有熱成像功能來掃描生命體,而較大的無人機可以向偏遠地區(qū)受災(zāi)人員運送醫(yī)療用品和其他物品。美國華盛頓大學研究人員設(shè)計研發(fā)使用氣味來定位災(zāi)難幸存者的無人機,美國航空航天公司(Aerospace Corporation)正在開發(fā)可以在視覺上識別狗,并與救援隊分享它們位置的無人機。 除了給無人機裝上“眼睛”和“鼻子”之外,科學家還想給無人機添加上“耳朵”,來實現(xiàn)更好的搜救效果。 但是無人機使用空中聲學定位面臨挑戰(zhàn)——聽覺裝置需要在人類叫聲和自然界中經(jīng)常發(fā)生的聲音(例如動物叫聲和風聲)之間進行破譯,還可能需要識別求救人員試圖引起救援隊注意的踢腿、鼓掌或其他響動。 FKIE團隊研發(fā)這款無人機,正是直面如何能準確識別出哪些聲音才是人類發(fā)出的求救信號這類挑戰(zhàn)。
展開
自動駕駛車載激光雷達技術(shù)現(xiàn)狀分析
定位傳感器: 可以獲得自身相對于全局的位置信息。其優(yōu)點在于技術(shù)較為成熟,能夠?qū)崿F(xiàn)在全局視角的定位功能;缺點在于無法獲得周圍障礙物的位置信息。往往需要與前幾個探障類傳感器搭配使用。 2.2 傳感器分類 智能車輛的傳感器可以分為視覺傳感器、定位傳感器、雷達傳感器、聽覺傳感器和姿態(tài)傳感器。其中視覺傳感器可以分為單目攝像頭、雙目攝像頭、夜視紅外攝像頭;定位傳感器可以分為慣性導航系統(tǒng)、衛(wèi)星導航系統(tǒng)(GNSS)、高精度地圖、實時動態(tài)(RTK)差分系統(tǒng);雷達傳感器可以分為激光雷達和毫米波雷達;聽覺傳感器可以分為語音識別、聲音定位入口;姿態(tài)傳感器可以分為車載診斷系統(tǒng)(OBD)、CAN 總線、慣性測量單元(IMU)、發(fā)動機等汽車工況傳感器。主要的傳感器為激光雷達、毫米波雷達、攝像頭、超聲波雷達、GNSS 輔助傳感器,其中 GNSS 輔助傳感器包括慣性導航系統(tǒng)和 RTK 差分系統(tǒng)。 傳感器分類圖如下: 圖 2-1 智能車輛傳感器分類圖 需要說明的是,以上提到的智能車傳感器并不一定會同時出現(xiàn)在一輛車上。某種傳感器存在與否,取決于這輛車需要完成什么樣的任務(wù)。
展開
大數(shù)據(jù)與AI時代
例如一輛智能駕駛汽車上需要采集的數(shù)據(jù)可能就包含了視頻數(shù)據(jù)、毫米波雷達射頻原始數(shù)據(jù)、環(huán)境聲音數(shù)據(jù)、GPS定位數(shù)據(jù)和V2X網(wǎng)絡(luò)連接數(shù)據(jù)等。這些數(shù)據(jù)都有不同的數(shù)據(jù)格式和特征。 正因為具有這3V特征,大數(shù)據(jù)的處理難度很高,亦因此衍生出云計算、數(shù)據(jù)挖掘、邊緣計算等技術(shù)手段。 大數(shù)據(jù)與AI 當我們談到大數(shù)據(jù)和數(shù)據(jù)科學,我們腦海里經(jīng)常還會浮現(xiàn)出另外一個概念,AI,也就是人工智能。 AI是數(shù)據(jù)科學和計算機科學的一個重要技術(shù)領(lǐng)域,通俗來說就是讓計算機來做一些以往由人類智能來完成的事情,例如下圍棋和駕駛汽車等。下圖是從2011年以來,關(guān)于“大數(shù)據(jù)”和“AI”的百度搜索指數(shù)。可見“大數(shù)據(jù)”在12年之前甚少被搜索,在17年左右到達了搜索的巔峰,之后有所回落。而“AI”則在11年及更早就被人們所了解并搜索,在17年開始搜索量猛增。 圖3:“大數(shù)據(jù)”和“AI”的百度搜索指數(shù) 總體來看,這近10年來“大數(shù)據(jù)”以及“AI”的搜索熱度具有類似的漲跌態(tài)勢,其原因是二者確有聯(lián)系,而且相輔相成。近年來AI技術(shù)的發(fā)展,最主要是構(gòu)筑在機器學習技術(shù)應(yīng)用的新基礎(chǔ)之上。機器學習實際上是一種數(shù)據(jù)分析技術(shù),讓計算機執(zhí)行人和動物與生俱來的活動:從經(jīng)驗中學習。機器學習算法可以是簡單的線性回歸,也可以是復雜的深度神經(jīng)網(wǎng)絡(luò)(DNN)。 AI,尤其是機器學習,需要海量的數(shù)據(jù)來訓練模型,而且這些海量數(shù)據(jù)都需要恒定快速地輸入輸出,同時AI也越來越多地用于處理各種類型的數(shù)據(jù),例如視頻、圖片和電磁波等。這正是與大數(shù)據(jù)的3V特征相契合,也是大數(shù)據(jù)與AI近年來能夠相互促進的原因。
展開
聲音定位圖2