人工智能+語音引爆CES

在今年的國際消費電子展(CES 2018)上,語音(voice)、連接(connectivity)和人工智能(AI)成為最受關注的焦點。如果說今年的CES能為我們帶來什么指標,那么這三項建構模塊將是組成2018年及未來消費電子設備缺一不可的神圣“三位一體”。

語音助理已經準備好進入穿戴式設備、耳機、嬰兒監視器、燈具、電視遙控器和車輛。DSP Concepts創始人兼首席技術官Paul Beckmann在接受《EE Times》時說:“我們似乎正見證著一場圍繞著語音的‘寒武紀大爆發’。”

在CES上,被稱為“中國Google”的百度大力向開發商展示并開放其基于Duer OS的平臺。無論是其聲控臺燈或掛在天花板上的投影機和屏幕,都不需要Alexa或Google Assist。就像百度常掛在嘴邊的“中國速度”,越來越多的廠商開始朝向語音發展。

人工智能+語音引爆CES的圖1

消費設備必須具備連接能力已經是不爭的事實。Silicon Labs首席執行官Tyson Tuttle強調,接下來的必備功能是“混搭”不同的無線網絡。他解釋說,直接將原本為智能型手機設計的連接芯片加進物聯網(IoT)設備,已經無法滿足要求了。系統需要動態的多協議軟件,以及為不同的無線網絡劃分時間的能力。

盡管AI在高度自動化汽車中占據主導地位,但Ceva首席執行官Gideon Wertheizer告訴我們:“我看到AI開始擺脫幻想世界。”供貨商如今正試著“設置參數,在隨機環境中使用AI來解決特定問題。”

換句話說,許多公司開始學習在小規模應用中導入AI,并將其用于特定任務,而非依靠AI來解決世界上的問題。

語音隨車上路 無論是在家庭或開車行駛中,語音都將至關重要。

博世(Robert Bosch)在CES宣布計劃將其語音助理設計在方向盤后方。博世管理董事會成員Dirk Hoheisel表示:“我們正致力于讓駕駛艙內的按鈕亂象劃下句點。”Elektrobit在CES上承諾,該公司將成為亞馬遜(Amazon) Alexa的第一批汽車軟件整合商之一。

人工智能+語音引爆CES的圖2

百度宣布其基于Duer OS的Apollo 2.0平臺被稱為“自動車輛的Android”,并稱語音輔助系統將成為該平臺的一部份。百度總裁兼COO陸奇表示:“家庭與車輛之間已經不存在界限了。無論你在家中做什么,應該也都可以在車子里實現。”

Wertheizer則指出,無論是在家中還是車內,隔離聲音以及直接向云端發送清晰的訊號都非常困難。“我們的周遭充斥著噪音和噪聲著。”很自然地,家庭和汽車的解決方案必須能夠因應一連串完全不同的嘈雜環境。

語音算法缺少標準 讓問題變得更復雜的原因在于業界還沒有任何標準的語音算法。Wertheizer表示:“每一家公司都有自家處理語音的專有算法。”

系統業者開始求助于學術界發表的技術論文,競相找出如何最有效隔離語音的解決之道。而當他們使用不同的麥克風和揚聲器類型時,還必須優化其算法,以因應不同的設置要求。

而在Ceva,Wertheizer說:“我們必須建立一個類似原子庇護所的工作室”,用于研究所有的選擇,并開發波束成形、遠場和近場、回聲消除和環境降噪等算法。

Beckman也呼應了這個觀點。就像人們喜歡語音作為自然的用戶接口一樣,他說:“遺憾的是,對于實際執行的產品設計人員來說,它是最具挑戰的技術之一。”他已經看到了太多的語音項目出錯了,最終得回到草圖階段重新開始。

Beckman曾經在Bose Corp.擔任研究工程師長達9年,在2000年初成立了他的咨詢業務。當他與客戶討論語音項目時,他發現業界需要一套有效執行的“完整軟件解決方案,以及能為其實現差異化的底層技術”。但是,最主要的關鍵在于賦予其能夠自行調整系統的能力。

隨著語音市場爆發,Beckman的業務也隨之成長。DSP Concepts不再只是一家咨詢公司,現在還提供了一套完整的算法作為軟件庫和除錯工具,有助于客戶調整系統。Beckman說:“我們提供調整、整合和驗證工具。”

人工智能+語音引爆CES的圖3

DSP Concepts的語音用戶接口(UI)技術稱為Audio Weaver,它是第一家獲得亞馬遜(Amazon) Alexa產品認證的第三方軟件公司。DSP Concepts聯合創始人兼首席執行官Chin Beckmann展示一款Audio Weaver語音助理產品——相較于亞馬遜Echo使用了7支麥克風,Audio Weaver僅用了2支麥克風,據稱就能夠“聽”得比Echo或Google Home更清楚。

在邊緣實現AI Wertheizer說,隔離語音是第一步,但接下來還有其他步驟:語音助理必須辨識語音的位置,而且必須能夠追蹤語音。而且,它必須能偵測以及辨識誰在房間里說話。

直到最近,云端才剛被認為是處理和學習的地方。如今,這個假設將在2018年發生改變。

Wertheizer解釋說:“我看到人們對于AI的態度越來越務實。他們希望在邊緣設備執行AI而非在云端進行,以避免隱私、延遲和成本等問題。”

聯發科技(MedaTek)財務長顧大為對此表示認同。相較于亞馬遜在其Echo中推動云端到云端的服務,聯發科看到了“邊緣和云端”融合模式的可能性。他在CES時告訴我們,語音助理競賽如今已經著重于在本地增加“智能”、區別人類與非人類的聲音分開、消除背景音樂、辨識聲音模式等。

人工智能+語音引爆CES的圖4

Wertheizer說:“以Petcube設計的交互式Wi-Fi寵物相機為例,它能在主人不在家時,通過雙向音訊和1080p高解析(HD)視訊攝影機進行監控,以及與狗或貓互動。”Wertheizer說:“我不確定Petcube是否意識到這是一家物聯網公司。但是,像這樣的連網產品中,語音識別系統顯然必須能夠辨識狗吠聲,并且確定狗是處于壓力還是處于危機之中。換句話說,系統需要有智能才能進行學習。”

Neupro低功耗AI處理器 雖然Ceva為語音系統的設計者提供了名為ClearVox的語音算法,但它也知道系統廠商需要的更多。系統制造商希望在其物聯網設備中整合學習和推論的能力,使其產品能夠持續變得更加智慧化。

目前的市場上亟需AI處理器。為了滿足這一需求,Ceva在CES上推出了NuePro,這是一款“專用的低功耗AI處理器系列,用于在邊緣進行深度學習”。NuePro是一款獨立的專用AI處理器,可廣泛用于物聯網、智能型手機、安全監控、汽車、機器人、醫療和工業等市場。

人工智能+語音引爆CES的圖5

值得注意的是,Ceva并非深度學習領域的新手。據報導,NeuPro是以Ceva在計算機視覺應用深層神經網絡方面的經驗為基礎。

Wertheizer說,NeuPro AI處理器是Ceva從頭開始研發的第一款“非DSP”技術。他在發布Neupro時說:“我有點緊張。但是你必須知道AI并不是訊號處理方面的問題。”

NeuPro處理器搭載兩個硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出,雖然引擎處理定義良好的人工智能算法,如CNN、啟動和規范層,但是,可程序設計的向量引擎NeuPro VPU是執行專有AI算法的一種延伸。“我們選擇了這種硬聯機的建置方式,而不是使用GPU或CPU,讓我們能夠增加AI處理器的利用率。”

Ceva聲稱,這款新的專用AI處理器系列帶來了“相當高的性能提升,從入門級處理器的2TOPS到為最高階配置的12.5TOPS”。

NeuPro硬件模塊;Ceva首席執行官Gideon Wertheizer強調,“NeuPro VPU和NeuPro引擎之間的無縫切換至關重要”。

Ceva表示,NeuPro AI處理器將于2018年第二季向客戶提供授權,并計劃在第三季全面發布。

同樣地,聯發科準備推出一款由意騰科技(Intelligo Technology)設計的AI處理器和算法。Intelligo是2016年時從聯發科獨立而出的新創公司。

Intelligo設計的這款AI SoC被稱為“智能DNN語音處理器”應用范圍較有限。聯發科表示,該處理器提供“可配置的深度神經網絡和高效率推論引擎(每秒每瓦特1 TOPS運算性能)”。

顧大為表示,聯發科正在尋找一種小型的AI加速器,為辨識20到30個關鍵詞而設計。另一方面,聯發科也正推廣其“分布式處理”的觀念,期望語音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落實于廣泛的小型設備——如電燈開關。

來源:環球自動化網

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP