發(fā)布

聲音定位的案例

我們?nèi)绾?em>定位聲音？如何重現(xiàn)真實的聲學體驗？

但聲音的空間屬性對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。我們?nèi)绾?em>定位聲音？我們的聽力使用的第一個線索是雙耳時間差（圖1a）。來自我們正前方或正后方的聲音會同時到達雙耳。如果信號源向左或向右移動，我們的聽覺系統(tǒng)會識別出來自同一信號源的聲音分別到達雙耳，但是會有一定的延遲，或者從另一個角度看，兩只耳朵接收到同一個信號的不同相位。兩耳時差圖1a：當聲音來自前方，雙耳時間差為零（左）。當聲音來自側(cè)面，頭的尺寸約為20厘米，聲速為340米/秒，最大時差為0.58毫秒（右）在低頻下可以最佳地破譯相位差。在較高的頻率下，與頭部的尺寸相比，波長可能太短，以至于信號模式自身重復，兩只耳朵可能碰巧接收到相同的相位（圖1b）。兩耳相位差圖1b：通常耳朵會感測到相位差（左），根據(jù)頻率和入射角度，它們可以檢測到虛假相位匹配（右）。幸運的是，聽覺系統(tǒng)可以借助另一個線索：當聲音從側(cè)面到達時，我們的頭部會產(chǎn)生聲影區(qū) ，并隨頻率上升而擴大。在非常低的頻率下，我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此，無論聲音從哪個方向到達，左耳和右耳的聲壓基本相同。然而，隨著頻率的增加，波長減小，此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物，使得與面向聲源的耳朵相比，當其到達頭部另一側(cè)的耳朵時，較高頻率的成分將被衰減。我們的耳廓的形狀還可提供豐富的頻譜（依賴于頻率）線索。像頭部的聲影區(qū)一樣，耳廓起到一個屏蔽層的作用，使不是從前面直接進入的較高頻率的聲音衰減。你可以通過轉(zhuǎn)離再轉(zhuǎn)向一個聲源來體驗這一點。

展開

我們?nèi)绾?em>定位聲音？如何重現(xiàn)真實的聲學體驗？

但聲音的空間屬性對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。我們?nèi)绾?em>定位聲音？我們的聽力使用的第一個線索是雙耳時差（圖1a）。來自我們正前方或正后方的聲音會同時到達雙耳。如果信號源向左或向右移動，我們的聽覺系統(tǒng)會識別出來自同一信號源的聲音分別到達雙耳，但是會有一定的延遲，或者從另一個角度看，兩只耳朵接收到同一個信號的不同相位。兩耳時差圖1a：當聲音來自前方，雙耳時差為零（左）。當聲音來自側(cè)面，頭的尺寸約為20厘米，聲速為340米/秒，最大時差為0.58毫秒（右）在低頻下可以最佳地破譯相位差。在較高的頻率下，與頭部的尺寸相比，波長可能太短，以至于信號模式自身重復，兩只耳朵可能碰巧接收到相同的相位（圖1b）。兩耳相位差圖1b：通常耳朵會感測到相位差（左），根據(jù)頻率和入射角度，它們可以檢測到虛假相位匹配（右）。幸運的是，聽覺系統(tǒng)可以借助另一個線索：當聲音從側(cè)面到達時，我們的頭部會產(chǎn)生聲影區(qū) ，并隨頻率上升而擴大。在非常低的頻率下，我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此，無論聲音從哪個方向到達，左耳和右耳的聲壓基本相同。然而，隨著頻率的增加，波長減小，此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物，使得與面向聲源的耳朵相比，當其到達頭部另一側(cè)的耳朵時，較高頻率的成分將被衰減。

展開

CAE仿真與大數(shù)據(jù)、虛擬現(xiàn)實以及人工智能

在感知方面，仿真以視覺和聽覺為主，而虛擬現(xiàn)實不僅有視覺、聽覺，還有觸覺等方面的感知，可以說仿真基本上將用戶視為“旁觀者”，而虛擬現(xiàn)實則將用戶視為“當局者”；在逼真度方面，仿真技術(shù)，仿真技術(shù)是對真實物理系統(tǒng)某一層次上的抽象，而虛擬技術(shù)采用實時三維圖像與顯示、三維聲音定位與合成技術(shù)、傳感器等技術(shù)，做到了人與環(huán)境的交互性，有非常高的逼真度。縱觀當下工業(yè)仿真軟件，可視化、智能化的仿真已成趨勢，在仿真中運用虛擬現(xiàn)實技術(shù)，不僅能更加形象直觀地顯示仿真全過程，而且會讓計算機與人之間的溝通更人性化，增強仿真系統(tǒng)的尋優(yōu)能力。圖2 仿真與虛擬現(xiàn)實仿真與人工智能的碰撞仿真優(yōu)化的應(yīng)用目標是為用戶提供一個輔助決策支持工具，而實際工程設(shè)計問題一般比較復雜，涉及因素較多，完全依靠計算機來進行決策很難考慮周全，隨著人工智能技術(shù)的發(fā)展，將領(lǐng)域知識引入到仿真優(yōu)化系統(tǒng)中，建立決策支持系統(tǒng)，充分發(fā)揮人的創(chuàng)造性和計算機的計算能力，實現(xiàn)人機協(xié)同決策功能。目前的仿真優(yōu)化系統(tǒng)要求用戶對仿真優(yōu)化算法和仿真建模工具有較深入的了解，才能夠開展工程應(yīng)用，如各種仿真優(yōu)化算法存在大量運行參數(shù)需要選擇，仿真實驗也需要設(shè)置各種參數(shù)，如仿真開始時間、仿真結(jié)束時間、仿真迭代次數(shù)和“預熱”時間等等，任何一項參數(shù)的變動對仿真優(yōu)化結(jié)果都會產(chǎn)生影響，要求非仿真專業(yè)人員來完成這些設(shè)置幾乎是一件不可能的事。因此，利用專家知識系統(tǒng)作為輔助，協(xié)助普通人完成這些專業(yè)工作是一個可行的實現(xiàn)方法。圖3 人工智能與天氣模擬總之，隨著中國2025、智能制造、工業(yè)4.0、“互聯(lián)網(wǎng)+”等新一輪工業(yè)革命的興起，新技術(shù)與傳統(tǒng)制造的結(jié)合催生了大量新型應(yīng)用，仿真軟件也開始結(jié)合大數(shù)據(jù)、虛擬現(xiàn)實、人工智能等先進技術(shù)，在研發(fā)設(shè)計、生產(chǎn)制造、服務(wù)管理和維護反饋等工業(yè)各個環(huán)節(jié)中凸顯更為重要的作用。

展開

智能座艙設(shè)計發(fā)展趨勢

2.多渠道、融合的交互將成為人車交互的中流砥柱除了按鍵、觸控、語音，在推出的車型中，還發(fā)現(xiàn)了語音助手、手勢識別、指紋、聲音定位、人臉識別、全息圖像等人車交互方式。例如，寶馬Natural Interaction這一全新的交互系統(tǒng)，計劃于2021年提供給新款iNext，與語音和手勢控制以及視線識別無縫集成，讓駕駛員可以在交互系統(tǒng)中選擇自己想要的；2020年9月發(fā)布的全新奔馳S級，升級了手勢識別能力，可以通過中控臺進行手勢控制，通過車載攝像頭識別面部方向和肢體語言，按需開啟功能。在設(shè)計更簡單、易于使用的車輛駕駛艙時，應(yīng)首先考慮安全性，作為人車交互界面。希望能在智能汽車上看到面料交互、車窗交互、智能大燈交互、虹膜識別、唇讀識別等多渠道融合的交互模式，帶來更好的用戶體驗。 3. 3D、多屏、大尺寸顯示、多樣化布局將成為智能座艙顯示的趨勢在基于場景的交互時代，駕駛艙布局不再遵循相同的模式。中控臺一體化顯示設(shè)計，從雙屏、三屏到五屏顯示，除了常規(guī)的中控臺和集群設(shè)計外，2020年已經(jīng)被不少主機廠采用。此外，控制屏、副駕駛娛樂屏、后排顯示屏、透明A柱等新型顯示屏也以全新方式部署在車內(nèi)。2019年哪吒U增加了透明A柱；虛擬后視鏡安裝在2020 款奧迪 e-tron Sportback 的駕駛員側(cè)車門上，這些新設(shè)計無疑是新車的新亮點。 4.以“用戶體驗”為中心的座艙場景交互模式將變得無孔不入對于車載場景交互模式，市場上的新車型通過從語音和環(huán)境光到智能座椅和車載攝像頭的智能配置提供簡單的場景交互。以2020年9月推出的奔馳S級為例。

展開

語音識別系列之脈沖神經(jīng)網(wǎng)絡(luò)特征工程

對于1kHz聲波及其對應(yīng)毛細胞激發(fā)的脈沖，鎖相現(xiàn)象表明動作點位啟動時間的精確度，必然高于1ms，正是這種精確度滿足了聲音定位的需求。注3：對某一時間段內(nèi)（對應(yīng)時頻圖分析方法中的某一幀），不同頻率聲波映射到耳蝸的不同位置，稱為位置編碼，而時頻塊的值的大小，或說當前幀內(nèi)該頻點的聲強，則對應(yīng)發(fā)放神經(jīng)脈沖的數(shù)目。耳蝸將機械波轉(zhuǎn)化為電脈沖的生物學過程，可詳見[4-7]，四書原理插圖，內(nèi)/外毛細胞電鏡照片均十分精美，由于潛在的版權(quán)問題，此處不截圖。基于物理模型的Audio2Spike轉(zhuǎn)換方法的問題在于： (a)模型參數(shù)較多且均是提前設(shè)定好的固定值，每一個參數(shù)的變動對最終效果的影響位置，合理變化范圍也未知。 (b)模型轉(zhuǎn)換得到的神經(jīng)脈沖序列，與真實生物過程不一定一致，從編碼角度來說也不一定是最優(yōu)的（攜帶足夠的信息，同時脈沖個數(shù)又少）。而且也無法組織真人實驗來驗證，畢竟幾乎唯一的驗證方法是主觀的，需要借助人工耳蝸的電極播放脈沖，讓人主觀評價聽感的好壞。但人工耳蝸總不可能對健聽者植入，只可能對聽障者做實驗，即便實驗證明不真實，也缺少模型參數(shù)調(diào)整的指導方向，幾乎就是盲調(diào)。（2）人工耳蝸物理轉(zhuǎn)錄人工耳蝸可作為動態(tài)音頻傳感器（Dynamic Audio Sensor, DAS），記錄人工耳蝸對音頻數(shù)據(jù)的響應(yīng)，將TIDIGITS音頻數(shù)據(jù)集轉(zhuǎn)錄為N-TIDIGITS脈沖數(shù)據(jù)集[8]。注：與聽覺對應(yīng)地，也存在動態(tài)視覺傳感器（Dynamic Vision Sensor, DVS），也被稱為事件相機（Event-based Camera），詳見iniVation官網(wǎng)[9]。

展開

3D收聽 | 聽覺系統(tǒng)的特殊能力——確定聲源的位置

但聲音的空間屬性對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。那么它是如何工作的，要重新創(chuàng)造一個真實的體驗需要做什么？我們?nèi)绾?em>定位聲音？我們的聽力定位聲音使用的第一個線索是雙耳時差（圖1a）。來自我們正前方或正后方的聲音會同時到達雙耳。但如果信號源向左或向右移動，我們的聽覺系統(tǒng)會識別出分別到達雙耳的是來自同一信號源的聲音，但是左右耳會有一定的延遲，或者從另一個角度看，兩只耳朵接收到了同一個信號的不同相位。兩耳時差圖1a：聲音來自前方，雙耳時差為零（左）。聲音來自側(cè)面，頭的尺寸約為20厘米，聲速為340米/秒，最大時差為0.58毫秒（右）人耳在低頻情況下可以很好地解密相位差，但在較高的頻率下，與頭部的尺寸相比，波長可能太短，以至于信號制式自身重復，兩只耳朵可能碰巧接收到相同的相位（圖1b）。兩耳相位差圖1b：通常耳朵會感測到相位差（左），根據(jù)頻率和入射角度，它們可以檢測到虛假相位匹配（右）。幸運的是，聽覺系統(tǒng)可以借助另一個線索：當聲音從側(cè)面到達時，我們的頭部會產(chǎn)生聲影區(qū)，并隨頻率上升而擴大。在非常低的頻率下，我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此，無論聲音從哪個方向到達，左耳和右耳的聲壓基本相同。然而，隨著頻率的增加，波長減小，此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物，使得與面向聲源的耳朵相比，當其到達頭部另一側(cè)的耳朵時，較高頻率的成分將被衰減。我們的耳廓的形狀還可提供豐富的頻譜（頻率依賴）線索。像頭部的聲影區(qū)一樣，耳廓起到一個屏蔽層的作用，使不是從前面直接進入的較高頻率的聲音衰減。你可以通過轉(zhuǎn)離再轉(zhuǎn)向一個聲源來體驗這一點。這樣做的時候，你應(yīng)該能感受到高頻率的微小變化，而這種變化你通常是不會注意到的。

展開

從“雙耳時間差”到“元宇宙”：聽覺如何塑造空間感？

作者：Matthias Scholz 用戶界面設(shè)計師、應(yīng)用聲學博士我們聽覺系統(tǒng)有一個非常強大的能力——定位聲源的位置。無論是在交通安全導航，還是在游戲、家庭影院中營造逼真聲場，聲音的空間屬性都至關(guān)重要。我們?nèi)绾?em>定位聲音？首先，聽覺系統(tǒng)會利用雙耳時間差（圖1a）。正前方或正后方傳來的聲音會同時到達雙耳。但如果聲源偏左或偏右，聲音就會先后到達兩只耳朵，產(chǎn)生微小的時間差。從另一個角度看，雙耳接收到的其實是同一聲音的不同相位。兩耳時差圖1a：當聲音來自前方，雙耳時間差為零（左）。當聲音來自側(cè)面，頭的尺寸約為20厘米，聲速為340米/秒，最大時差為0.58毫秒（右）在低頻情況下，我們的大腦能很好地解析相位差。但頻率升高后，波長可能短于頭部尺寸，導致雙耳接收到的相位出現(xiàn)混淆，甚至出現(xiàn)“虛假匹配”（圖1b）。兩耳相位差圖1b：通常耳朵會感測到相位差（左），根據(jù)頻率和入射角度，它們可以檢測到虛假相位匹配（右）。幸運的是，我們還有第二條線索：頭部遮擋效應(yīng)。當聲音從側(cè)面?zhèn)鱽恚^部會在另一側(cè)形成“聲影區(qū)”。頻率越高，遮擋效果越明顯。低頻聲音波長較長，能繞過頭部，雙耳聽到的聲音強度相近；而高頻聲音波長較短，會被頭部阻擋，導致遠離聲源的那只耳朵聽到的聲音變?nèi)酢?此外，耳廓的形狀也會提供重要的頻譜線索。耳廓不僅會阻擋非正前方的高頻聲，其復雜結(jié)構(gòu)還會對聲音進行反射和濾波，增強或減弱某些頻率。你可以試著轉(zhuǎn)動頭部感受一下：當偏離聲源時，高頻會略微減弱——這種細微變化平時不易察覺，卻是定位聲源的重要依據(jù)。

展開

新年快樂 | 回顧2021年的精彩內(nèi)容

◆ 我們?nèi)绾?em>定位聲音？ ◆ 如何正確選擇合適的傳聲器？ ◆ 為何選擇傳聲器時忽略聲場會產(chǎn)生誤差？ ◆ 如何用更少的投入進行高級噪聲源識別？ ◆ BK小課堂 | 電聲測量的定義、方式及參數(shù) ◆ 什么是靜平衡/動平衡？

聽到呼救聲就能定位求助者

近日，德國弗勞恩霍夫協(xié)會通訊、信息處理和人機工程學研究所（Germany’s Fraunhofer FKIE institute）的研究人員研制了一種無人機，可以通過麥克風收集聲音，然后分析判斷出人類求救的尖叫聲以及聲音方向，來定位需要幫助的人。這款無人機配有兩個核心裝置，分別是利用聲音特征訓練出的人工智能軟件和微型數(shù)字麥克風構(gòu)成的陣列，來保證搜尋有效性和快速性。一、無人機搜救新方向：空中聲學定位該項目首席科學家之一瑪卡麗娜·瓦雷拉（Macarena Varela）告訴《華盛頓郵報》：“與地面救援人員或訓練有素的狗相比，無人機可以在更短的時間覆蓋更大的區(qū)域。如果有倒塌的建筑物，無人機可以提醒和協(xié)助救援人員，可以去到救援人員自己無法到達的地方。” “配置”不同的無人機，常應(yīng)用于不同場景。例如，多數(shù)情況下，無人機被用來拍攝被損壞建筑物的航拍圖像，有些無人機具有熱成像功能來掃描生命體，而較大的無人機可以向偏遠地區(qū)受災(zāi)人員運送醫(yī)療用品和其他物品。美國華盛頓大學研究人員設(shè)計研發(fā)使用氣味來定位災(zāi)難幸存者的無人機，美國航空航天公司（Aerospace Corporation）正在開發(fā)可以在視覺上識別狗，并與救援隊分享它們位置的無人機。除了給無人機裝上“眼睛”和“鼻子”之外，科學家還想給無人機添加上“耳朵”，來實現(xiàn)更好的搜救效果。但是無人機使用空中聲學定位面臨挑戰(zhàn)——聽覺裝置需要在人類叫聲和自然界中經(jīng)常發(fā)生的聲音（例如動物叫聲和風聲）之間進行破譯，還可能需要識別求救人員試圖引起救援隊注意的踢腿、鼓掌或其他響動。 FKIE團隊研發(fā)這款無人機，正是直面如何能準確識別出哪些聲音才是人類發(fā)出的求救信號這類挑戰(zhàn)。

展開

自動駕駛車載激光雷達技術(shù)現(xiàn)狀分析

定位傳感器：可以獲得自身相對于全局的位置信息。其優(yōu)點在于技術(shù)較為成熟，能夠?qū)崿F(xiàn)在全局視角的定位功能;缺點在于無法獲得周圍障礙物的位置信息。往往需要與前幾個探障類傳感器搭配使用。 2.2 傳感器分類智能車輛的傳感器可以分為視覺傳感器、定位傳感器、雷達傳感器、聽覺傳感器和姿態(tài)傳感器。其中視覺傳感器可以分為單目攝像頭、雙目攝像頭、夜視紅外攝像頭;定位傳感器可以分為慣性導航系統(tǒng)、衛(wèi)星導航系統(tǒng)(GNSS)、高精度地圖、實時動態(tài)(RTK)差分系統(tǒng);雷達傳感器可以分為激光雷達和毫米波雷達;聽覺傳感器可以分為語音識別、聲音定位入口;姿態(tài)傳感器可以分為車載診斷系統(tǒng)(OBD)、CAN 總線、慣性測量單元(IMU)、發(fā)動機等汽車工況傳感器。主要的傳感器為激光雷達、毫米波雷達、攝像頭、超聲波雷達、GNSS 輔助傳感器，其中 GNSS 輔助傳感器包括慣性導航系統(tǒng)和 RTK 差分系統(tǒng)。傳感器分類圖如下：圖 2-1 智能車輛傳感器分類圖需要說明的是，以上提到的智能車傳感器并不一定會同時出現(xiàn)在一輛車上。某種傳感器存在與否，取決于這輛車需要完成什么樣的任務(wù)。

展開

大數(shù)據(jù)與AI時代

例如一輛智能駕駛汽車上需要采集的數(shù)據(jù)可能就包含了視頻數(shù)據(jù)、毫米波雷達射頻原始數(shù)據(jù)、環(huán)境聲音數(shù)據(jù)、GPS定位數(shù)據(jù)和V2X網(wǎng)絡(luò)連接數(shù)據(jù)等。這些數(shù)據(jù)都有不同的數(shù)據(jù)格式和特征。正因為具有這3V特征，大數(shù)據(jù)的處理難度很高，亦因此衍生出云計算、數(shù)據(jù)挖掘、邊緣計算等技術(shù)手段。大數(shù)據(jù)與AI 當我們談到大數(shù)據(jù)和數(shù)據(jù)科學，我們腦海里經(jīng)常還會浮現(xiàn)出另外一個概念，AI，也就是人工智能。 AI是數(shù)據(jù)科學和計算機科學的一個重要技術(shù)領(lǐng)域，通俗來說就是讓計算機來做一些以往由人類智能來完成的事情，例如下圍棋和駕駛汽車等。下圖是從2011年以來，關(guān)于“大數(shù)據(jù)”和“AI”的百度搜索指數(shù)。可見“大數(shù)據(jù)”在12年之前甚少被搜索，在17年左右到達了搜索的巔峰，之后有所回落。而“AI”則在11年及更早就被人們所了解并搜索，在17年開始搜索量猛增。圖3：“大數(shù)據(jù)”和“AI”的百度搜索指數(shù) 總體來看，這近10年來“大數(shù)據(jù)”以及“AI”的搜索熱度具有類似的漲跌態(tài)勢，其原因是二者確有聯(lián)系，而且相輔相成。近年來AI技術(shù)的發(fā)展，最主要是構(gòu)筑在機器學習技術(shù)應(yīng)用的新基礎(chǔ)之上。機器學習實際上是一種數(shù)據(jù)分析技術(shù)，讓計算機執(zhí)行人和動物與生俱來的活動：從經(jīng)驗中學習。機器學習算法可以是簡單的線性回歸，也可以是復雜的深度神經(jīng)網(wǎng)絡(luò)（DNN）。 AI，尤其是機器學習，需要海量的數(shù)據(jù)來訓練模型，而且這些海量數(shù)據(jù)都需要恒定快速地輸入輸出，同時AI也越來越多地用于處理各種類型的數(shù)據(jù)，例如視頻、圖片和電磁波等。這正是與大數(shù)據(jù)的3V特征相契合，也是大數(shù)據(jù)與AI近年來能夠相互促進的原因。

展開

聲音定位的相關(guān)專題、標簽、搜索

聲音定位 ansys聲音學習 ansys模擬聲音聲音仿真 ansys ansys聲音仿真 ansys聲音軟件 nvhnvh聲音的粗糙度聲音的波動度聲音調(diào)制ans 聲音的粗糙度聲音的波動度聲音調(diào)制ansys機械設(shè)計 nvh聲音的粗糙度聲音的波動度聲音調(diào)制ansys機 abaqus模擬聲音abaqus模擬聲音abaqu 聲音 adams聲音

共11條

首頁 1 尾頁 , 到第頁

不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

聲音定位的案例

聲音定位的相關(guān)專題、標簽、搜索