長期從事隨機(jī)動態(tài)決策系統(tǒng)的學(xué)習(xí)優(yōu)化理論(尤其是馬氏決策過程、強(qiáng)化學(xué)習(xí)、排隊(duì)論、博弈論等)研究及其在能源、通信、金融、人工智能等領(lǐng)域的應(yīng)用。主持國家自然科學(xué)基金項(xiàng)目五項(xiàng)(其中一項(xiàng)為重點(diǎn)專項(xiàng)項(xiàng)目)、國家重點(diǎn)研發(fā)計(jì)劃子課題三項(xiàng),以及華為、騰訊等企業(yè)委托研究項(xiàng)目多項(xiàng)。兩次榮獲教育部高等學(xué)校科學(xué)研究優(yōu)秀成果獎(自然科學(xué))二等獎。