人工智能+語音引爆CES

lansu4021

2018年8月8日 17:56

在今年的國際消費電子展(CES 2018)上，語音(voice)、連接(connectivity)和人工智能(AI)成為最受關注的焦點。如果說今年的CES能為我們帶來什么指標，那么這三項建構模塊將是組成2018年及未來消費電子設備缺一不可的神圣“三位一體”。

語音助理已經準備好進入穿戴式設備、耳機、嬰兒監視器、燈具、電視遙控器和車輛。DSP Concepts創始人兼首席技術官Paul Beckmann在接受《EE Times》時說：“我們似乎正見證著一場圍繞著語音的‘寒武紀大爆發’。”

在CES上，被稱為“中國Google”的百度大力向開發商展示并開放其基于Duer OS的平臺。無論是其聲控臺燈或掛在天花板上的投影機和屏幕，都不需要Alexa或Google Assist。就像百度常掛在嘴邊的“中國速度”，越來越多的廠商開始朝向語音發展。

人工智能+語音引爆CES的圖1

消費設備必須具備連接能力已經是不爭的事實。Silicon Labs首席執行官Tyson Tuttle強調，接下來的必備功能是“混搭”不同的無線網絡。他解釋說，直接將原本為智能型手機設計的連接芯片加進物聯網(IoT)設備，已經無法滿足要求了。系統需要動態的多協議軟件，以及為不同的無線網絡劃分時間的能力。

盡管AI在高度自動化汽車中占據主導地位，但Ceva首席執行官Gideon Wertheizer告訴我們：“我看到AI開始擺脫幻想世界。”供貨商如今正試著“設置參數，在隨機環境中使用AI來解決特定問題。”

換句話說，許多公司開始學習在小規模應用中導入AI，并將其用于特定任務，而非依靠AI來解決世界上的問題。

語音隨車上路無論是在家庭或開車行駛中，語音都將至關重要。

博世(Robert Bosch)在CES宣布計劃將其語音助理設計在方向盤后方。博世管理董事會成員Dirk Hoheisel表示：“我們正致力于讓駕駛艙內的按鈕亂象劃下句點。”Elektrobit在CES上承諾，該公司將成為亞馬遜(Amazon) Alexa的第一批汽車軟件整合商之一。

人工智能+語音引爆CES的圖2

百度宣布其基于Duer OS的Apollo 2.0平臺被稱為“自動車輛的Android”，并稱語音輔助系統將成為該平臺的一部份。百度總裁兼COO陸奇表示：“家庭與車輛之間已經不存在界限了。無論你在家中做什么，應該也都可以在車子里實現。”

Wertheizer則指出，無論是在家中還是車內，隔離聲音以及直接向云端發送清晰的訊號都非常困難。“我們的周遭充斥著噪音和噪聲著。”很自然地，家庭和汽車的解決方案必須能夠因應一連串完全不同的嘈雜環境。

語音算法缺少標準讓問題變得更復雜的原因在于業界還沒有任何標準的語音算法。Wertheizer表示：“每一家公司都有自家處理語音的專有算法。”

系統業者開始求助于學術界發表的技術論文，競相找出如何最有效隔離語音的解決之道。而當他們使用不同的麥克風和揚聲器類型時，還必須優化其算法，以因應不同的設置要求。

而在Ceva，Wertheizer說：“我們必須建立一個類似原子庇護所的工作室”，用于研究所有的選擇，并開發波束成形、遠場和近場、回聲消除和環境降噪等算法。

Beckman也呼應了這個觀點。就像人們喜歡語音作為自然的用戶接口一樣，他說：“遺憾的是，對于實際執行的產品設計人員來說，它是最具挑戰的技術之一。”他已經看到了太多的語音項目出錯了，最終得回到草圖階段重新開始。

Beckman曾經在Bose Corp.擔任研究工程師長達9年，在2000年初成立了他的咨詢業務。當他與客戶討論語音項目時，他發現業界需要一套有效執行的“完整軟件解決方案，以及能為其實現差異化的底層技術”。但是，最主要的關鍵在于賦予其能夠自行調整系統的能力。

隨著語音市場爆發，Beckman的業務也隨之成長。DSP Concepts不再只是一家咨詢公司，現在還提供了一套完整的算法作為軟件庫和除錯工具，有助于客戶調整系統。Beckman說：“我們提供調整、整合和驗證工具。”

人工智能+語音引爆CES的圖3

DSP Concepts的語音用戶接口(UI)技術稱為Audio Weaver，它是第一家獲得亞馬遜(Amazon) Alexa產品認證的第三方軟件公司。DSP Concepts聯合創始人兼首席執行官Chin Beckmann展示一款Audio Weaver語音助理產品——相較于亞馬遜Echo使用了7支麥克風，Audio Weaver僅用了2支麥克風，據稱就能夠“聽”得比Echo或Google Home更清楚。

在邊緣實現AI Wertheizer說，隔離語音是第一步，但接下來還有其他步驟：語音助理必須辨識語音的位置，而且必須能夠追蹤語音。而且，它必須能偵測以及辨識誰在房間里說話。

直到最近，云端才剛被認為是處理和學習的地方。如今，這個假設將在2018年發生改變。

Wertheizer解釋說：“我看到人們對于AI的態度越來越務實。他們希望在邊緣設備執行AI而非在云端進行，以避免隱私、延遲和成本等問題。”

聯發科技(MedaTek)財務長顧大為對此表示認同。相較于亞馬遜在其Echo中推動云端到云端的服務，聯發科看到了“邊緣和云端”融合模式的可能性。他在CES時告訴我們，語音助理競賽如今已經著重于在本地增加“智能”、區別人類與非人類的聲音分開、消除背景音樂、辨識聲音模式等。

人工智能+語音引爆CES的圖4

Wertheizer說：“以Petcube設計的交互式Wi-Fi寵物相機為例，它能在主人不在家時，通過雙向音訊和1080p高解析(HD)視訊攝影機進行監控，以及與狗或貓互動。”Wertheizer說：“我不確定Petcube是否意識到這是一家物聯網公司。但是，像這樣的連網產品中，語音識別系統顯然必須能夠辨識狗吠聲，并且確定狗是處于壓力還是處于危機之中。換句話說，系統需要有智能才能進行學習。”

Neupro低功耗AI處理器雖然Ceva為語音系統的設計者提供了名為ClearVox的語音算法，但它也知道系統廠商需要的更多。系統制造商希望在其物聯網設備中整合學習和推論的能力，使其產品能夠持續變得更加智慧化。

目前的市場上亟需AI處理器。為了滿足這一需求，Ceva在CES上推出了NuePro，這是一款“專用的低功耗AI處理器系列，用于在邊緣進行深度學習”。NuePro是一款獨立的專用AI處理器，可廣泛用于物聯網、智能型手機、安全監控、汽車、機器人、醫療和工業等市場。

人工智能+語音引爆CES的圖5

值得注意的是，Ceva并非深度學習領域的新手。據報導，NeuPro是以Ceva在計算機視覺應用深層神經網絡方面的經驗為基礎。

Wertheizer說，NeuPro AI處理器是Ceva從頭開始研發的第一款“非DSP”技術。他在發布Neupro時說：“我有點緊張。但是你必須知道AI并不是訊號處理方面的問題。”

NeuPro處理器搭載兩個硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出，雖然引擎處理定義良好的人工智能算法，如CNN、啟動和規范層，但是，可程序設計的向量引擎NeuPro VPU是執行專有AI算法的一種延伸。“我們選擇了這種硬聯機的建置方式，而不是使用GPU或CPU，讓我們能夠增加AI處理器的利用率。”

Ceva聲稱，這款新的專用AI處理器系列帶來了“相當高的性能提升，從入門級處理器的2TOPS到為最高階配置的12.5TOPS”。

NeuPro硬件模塊;Ceva首席執行官Gideon Wertheizer強調，“NeuPro VPU和NeuPro引擎之間的無縫切換至關重要”。

Ceva表示，NeuPro AI處理器將于2018年第二季向客戶提供授權，并計劃在第三季全面發布。

同樣地，聯發科準備推出一款由意騰科技(Intelligo Technology)設計的AI處理器和算法。Intelligo是2016年時從聯發科獨立而出的新創公司。

Intelligo設計的這款AI SoC被稱為“智能DNN語音處理器”應用范圍較有限。聯發科表示，該處理器提供“可配置的深度神經網絡和高效率推論引擎(每秒每瓦特1 TOPS運算性能)”。

顧大為表示，聯發科正在尋找一種小型的AI加速器，為辨識20到30個關鍵詞而設計。另一方面，聯發科也正推廣其“分布式處理”的觀念，期望語音和AI功能不只是整合于像Echo或Google Home的智能音箱，而是更落實于廣泛的小型設備——如電燈開關。

來源：環球自動化網

登錄后免費查看全文

立即登錄