人機(jī)語(yǔ)音交互技術(shù)系列課程主要內(nèi)容包括:車載語(yǔ)音識(shí)別技術(shù)開發(fā)、關(guān)鍵方案設(shè)計(jì)與實(shí)現(xiàn)、人機(jī)交互系統(tǒng)的原型搭建及系統(tǒng)設(shè)計(jì)、語(yǔ)音識(shí)別相關(guān)算法的研究與開發(fā),聲學(xué)模型、語(yǔ)言模型的訓(xùn)練。分為五個(gè)視頻,共計(jì)260分鐘。
本視頻為第五課,人機(jī)語(yǔ)音交互技術(shù)(五)
課程大綱
一、語(yǔ)音基礎(chǔ)
1.語(yǔ)音識(shí)別技術(shù)發(fā)展概述
2.MFCC特征
3.單聲道語(yǔ)音降噪算法
二、傳統(tǒng)技術(shù)
1.模型匹配法(DTW)
2. 概率統(tǒng)計(jì)法(GMM-HMM)
3. 分類器法(SVM、CNN、LSTM)
三、熱點(diǎn)技術(shù)
1. CTC
2. Attention
3. GAN
4. Few-shot
四、車內(nèi)環(huán)境聲識(shí)別
1. 邊緣計(jì)算工具
2. 兒童哭聲監(jiān)聽





















