關(guān)于工業(yè)軟件與AI那點事
在電影《模擬游戲》(The Imitation Game,2014)中,主角艾倫·圖靈(Alan Tuim)看著自己發(fā)明的解密機“克里斯托弗”( Christopher)喃喃自語,仿佛在對著人說話。雖然這個場景可能是虛構(gòu)的,但是依舊在計算機和人工智能(AI)歷史上具有劃時代意義。艾倫·圖靈在二戰(zhàn)中創(chuàng)造了能解決組合優(yōu)化問題的機器,它具備可編程解決問題的能力,破譯了德軍的密碼,為聯(lián)軍的勝利做出了決定性貢獻,而在電影中圖靈急切地等待結(jié)果的情景,就仿佛機器真的有自己的意志一樣 。
艾倫·圖靈這個人物和圖靈測試等細(xì)節(jié)在本文中不作詳細(xì)討論,但這可以說就是現(xiàn)代計算機和AI的起點,因此我想通過這篇文章來講述關(guān)于AI的一系列故事。
由于AI這個主題本身就比較廣泛,所以文章中講述的內(nèi)容僅代表個人觀點,如果發(fā)現(xiàn)表述有誤的地方,也請大家見諒。
以下是維基百科對AI的定義摘要:
“這是計算機科學(xué)的一個細(xì)分領(lǐng)域,試圖讓計算機實現(xiàn)人類的學(xué)習(xí)能力、推理能力和感知能力。即具有智能功能的計算機系統(tǒng),將人類的智能體現(xiàn)在機器上。”
AI是一門試圖從理解智能到構(gòu)建實體的學(xué)科。可以說對AI的研究早在第二次世界大戰(zhàn)不久后就已經(jīng)開始了,人工智能一詞最早出現(xiàn)于1956年,因此它并不是最近突然冒出來的新科學(xué),而是經(jīng)歷了大約100多年興衰更迭,在經(jīng)歷了漫長的低迷期后,隨著各種相關(guān)學(xué)科和計算機運算能力的發(fā)展,近期AI再次成為創(chuàng)新的核心。
由于AI的核心是對人類的理解和模仿,因此所有關(guān)于人類的學(xué)科都可以成為與AI相關(guān)的學(xué)科(如神經(jīng)科學(xué)、腦科學(xué)、心理學(xué)、計算機工程、物理學(xué)、哲學(xué)、數(shù)學(xué)、經(jīng)濟學(xué)等)。隨著這些相關(guān)學(xué)科的發(fā)展,最近AI在很多方面都取得了令人矚目的成果:可以區(qū)分視覺信息(基于Vision)、模仿人類對話(基于GPT、Transformer的語言模型)、模仿和創(chuàng)造人類無法區(qū)分的學(xué)習(xí)內(nèi)容或新事物(GAN)、通過相關(guān)信息和知識回答問題(GNN)。現(xiàn)在,AI在特定領(lǐng)域已經(jīng)超越了人類,因此,對于AI的看法,狂熱和擔(dān)憂并存。
現(xiàn)在讓我們更近一步地了解 一下AI
現(xiàn)代AI正在以基于數(shù)據(jù)的方法發(fā)展,因此對基于數(shù)據(jù)的機器學(xué)習(xí)(ML:Machine Learning)的理解至關(guān)重要。從個人的角度來看,如果用一句話來定義基于數(shù)據(jù)的AI推論和ML的關(guān)系就是:根據(jù)數(shù)據(jù)歸納導(dǎo)出數(shù)學(xué)形態(tài)(ML),再進行演繹推理并應(yīng)用(AI)。
可以這么說,在AI的發(fā)展歷史中,解決問題的方法是非常重要的一部分,大致可以概括為兩種方法:基于規(guī)則的方法(演繹嘗試)和基于經(jīng)驗的方法(歸納嘗試)。
在AI近100年的發(fā)展歷史中,這兩種方法順應(yīng)時代需求你追我趕地發(fā)展。(這也類似于在RecurDyn中FFlex和RFlex交替受到關(guān)注的原因。)
演繹方法的一個典型例子是解決用邏輯符號表示問題的GPS(General Problem Solver),歸納方法的一個典型例子是最近的熱門話題深度學(xué)習(xí)。在人工智能的早期,由于當(dāng)時計算機的計算能力有限,演繹法比歸納法更有效。而后來計算能力的增強使得在合理時間范圍內(nèi)解決數(shù)據(jù)驅(qū)動問題成為可能。
數(shù)據(jù)驅(qū)動的方法在現(xiàn)代AI/ML中已經(jīng)占據(jù)了主導(dǎo)地位,因此,可以認(rèn)為本文后面提到的AI/ML皆指的是數(shù)據(jù)驅(qū)動的歸納方法。 數(shù)據(jù)驅(qū)動的方法是最近人工智能在許多領(lǐng)域崛起的動力,在解決無法解決的問題或發(fā)現(xiàn)傳統(tǒng)方法未能探索的問題方面取得了成功。
那么,基于數(shù)據(jù)的AI/ML是如何解決現(xiàn)實世界中的問題的呢?過程如下:
要解決的問題包括在現(xiàn)實世界中積累的大量數(shù)據(jù),或者可以編寫或生成的數(shù)據(jù)。通過數(shù)學(xué)方式查明這些數(shù)據(jù)之間的關(guān)系來解決問題的過程就是機器學(xué)習(xí),并使用由此訓(xùn)練的模型進行推理以解決實際問題。
機器學(xué)習(xí)通過優(yōu)化從數(shù)學(xué)上解決問題。首先準(zhǔn)備數(shù)據(jù),從準(zhǔn)備的數(shù)據(jù)中確定輸入數(shù)據(jù)和輸出數(shù)據(jù)。找到與輸入和輸出數(shù)據(jù)相匹配的數(shù)學(xué)模型。在此過程中,為了獲得優(yōu)化的結(jié)果,基本都需要大量的數(shù)據(jù)支持。(對于大型模型,自由度是以億為單位的,需要在最高水平的數(shù)據(jù)中心長時間計算。因此,在計算機運算能力不足的年代,很難進行正確的嘗試。)由于計算結(jié)果是在準(zhǔn)備的數(shù)據(jù)所涵蓋的空間內(nèi)的優(yōu)化答案,在所覆蓋的數(shù)據(jù)空間內(nèi)替換新的數(shù)據(jù)時,可以推導(dǎo)出該空間內(nèi)的優(yōu)化結(jié)果。
如果將這種解決方法比喻為學(xué)習(xí)英語,就可以說這種解決方法類似于在不懂英語語法的情況下,通過直接大量的對話和閱讀,學(xué)習(xí)如何根據(jù)給定的語境記憶和排列所接觸到的詞匯。
雖然大致了解數(shù)據(jù)驅(qū)動的AI是如何解決問題的,但是在我們試圖解決問題的過程中,必然會遇到一些普遍和現(xiàn)實的疑問,比如:這種方法在數(shù)學(xué)上合理嗎?可以直接應(yīng)用嗎?能向客戶說明嗎?聽說在解決問題時,準(zhǔn)確性不是 100%?總結(jié)一句話就是 “這個結(jié)果是可信的嗎”
AI/ML開始流行的初期,缺少對這部分的說明,但最近,這種可說明性(Explainable AI)越來越重要。這也是為什么發(fā)表AI相關(guān)庫或框架時,論文會緊隨其后。很多方法和理論存在于數(shù)學(xué)基礎(chǔ)之上。支持AI/ML的數(shù)學(xué)定理有很多,例如高斯-馬爾科夫定理(Gauss-Markov Theorem)、奇異值分解(Singular Value Decomposition)、默瑟定理(Mercer’s Theorem)、表示定理(Representer Theorem)、西文科定理(Universal Approximation Theorem)。值得一提的是,其中西文科SIBENKO定理還涵蓋了最近對AI/ML影響最大的人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)意義。雖然無法一一詳細(xì)說明,但毋庸置疑,基于數(shù)據(jù)的機器學(xué)習(xí)和由此產(chǎn)生的AI在數(shù)學(xué)上是可靠的。
在數(shù)學(xué)證明方面,就像演繹法和歸納法之間沒有對錯一樣,采用基于規(guī)則的AI和基于數(shù)據(jù)的機器學(xué)習(xí)的AI也沒有對錯。解支配方程(以規(guī)則為基礎(chǔ)解決問題)的應(yīng)用雖然在數(shù)學(xué)上很美,但由于公式展開會存在無法顯示的誤差,因此經(jīng)常與現(xiàn)實存在差異。同樣,通過歸納數(shù)學(xué)表達式(基于數(shù)據(jù)解決問題)并加以應(yīng)用,對使用的數(shù)據(jù)也無法獲得100%的準(zhǔn)確度。也就是說,理論和現(xiàn)實之間的誤差總是存在的,區(qū)別在于何時何地顯現(xiàn)。雖然基于數(shù)據(jù)的方法乍一看讓人感覺像是在盲人摸象,但設(shè)計好的解決方法和演繹推論方法一樣絕對沒有錯。如果我們因為不能100%解決一個問題而對人工智能/ML領(lǐng)域的研究和應(yīng)用望而卻步,那我們只能看到和聽到習(xí)慣的東西,數(shù)據(jù)驅(qū)動才是解決棘手問題的最佳方法。
解決問題的正確方法是很好地解決了問題,而不管采取什么方法。
對于我們這些非AI研究人員來說,真正重要的是了解我們在AI時代應(yīng)該做什么?怎么做?為什么做?以及什么時候做?當(dāng)看到別人都在談?wù)揂I的情景時,可能會害怕是否只有我們落在后面,但還是需要像往常一樣保持冷靜的態(tài)度去看待現(xiàn)實問題。
事實上,世界不會在短時間內(nèi)發(fā)生翻天覆地的變化,我們的公司也不會馬上倒閉。有很多人一成不變,仍然過得很好,也有很多人開拓創(chuàng)新,只是因為太前衛(wèi)或?qū)Ξ?dāng)下無用而被埋沒。人工智能也有過這樣的時刻,即使現(xiàn)在看起來沒有它我們就注定是失敗的,但你永遠(yuǎn)不知道什么時候我們會有另一個像80年代那樣的人工智能冬天。
但是在某個時刻,技術(shù)會被突破,如果企業(yè)沒有準(zhǔn)備好,就可能被市場淘汰。重要的是,我們要以好奇的眼光和冷靜的頭腦去妥善應(yīng)對這些威脅。其基礎(chǔ)應(yīng)該是我們理解AI的本質(zhì),我們擁有適應(yīng)和應(yīng)對環(huán)境的能力,并為之努力。冷靜地思考一下再決定,是挑戰(zhàn)原始技術(shù)開發(fā),還是快速跟上技術(shù)趨勢,還是將已推出的技術(shù)和理論結(jié)合起來應(yīng)用。我個人認(rèn)為,AI/ML技術(shù)可能不是現(xiàn)實中需要研究和開發(fā)基礎(chǔ)技術(shù)的對象,而是像Visual Studio一樣需要我們好好處理和利用的對象。
全球IT領(lǐng)域的研究公司Gartner于2021年發(fā)布了AI領(lǐng)域的Hype Cycle。與AI相關(guān)的關(guān)鍵詞大多位于創(chuàng)新Trigger(技術(shù)創(chuàng)新)、Peak of Inflated Expectations(期望頂點)階段。
AI是需要正面挑戰(zhàn)的對象嗎?有沒有可能會威脅我們的生存?答案總是在“可能會,也可能不會”之間徘徊。在這種情況下,我們必須要明白一點:如果我們在研究技術(shù)和開發(fā)產(chǎn)品的過程中引入了AI,那么在研究和應(yīng)用方面必須以客戶為基礎(chǔ)。您需要知道客戶是否有潛在的需求,如果有,就必須能夠通過產(chǎn)品傳達明確的價值。借鑒領(lǐng)先企業(yè)的共同點,我們對新技術(shù)的信心和對未來的愿景是基礎(chǔ),我們必須提前具備高水平的專業(yè)知識。如果決定應(yīng)用新技術(shù),就必須朝著能夠在整個產(chǎn)品和組織中全面創(chuàng)造協(xié)同效應(yīng)的方向發(fā)展,而不只是零散的方式,最終的結(jié)果應(yīng)該是極大地改善用戶體驗。
AI很有魅力,它提供了一種解決無法在有限的時間內(nèi)解決的困難問題的方法。因為我們也有很多在有限的時間內(nèi)無法解決的問題,所以我們也可以通過基于數(shù)據(jù)的方法來解決這些問題。
最近,現(xiàn)代AI在解決特定問題上的表現(xiàn)已經(jīng)遠(yuǎn)超預(yù)期,后續(xù)將轉(zhuǎn)向把多個領(lǐng)域捆綁在一起,試圖共同解決問題。出現(xiàn)這種趨勢的典型例子是:實現(xiàn)高水平的自動駕駛。隨著時間的推移,在這種趨勢的盡頭,可能會實現(xiàn)強人工智能(“通用人工智能”)。
人類是能快速地進行并行計算的智能體,我們可以在幾分之一秒內(nèi)綜合來自我們多個感覺器官的所有信息,比如通過發(fā)出“啊!”的聲音的同時讓我們的手迅速從滾燙的物體上縮回。現(xiàn)在的AI還無法完成這種非常復(fù)雜和快速的并行進程的動作。換句話說,在整個AI的發(fā)展歷程中,雖然在某些方面上已經(jīng)遠(yuǎn)遠(yuǎn)超越了人類,但在強人工智能方面仍處于初期,還需要長期的發(fā)展。就個人而言,我希望看到我們所擁有的數(shù)學(xué)和軟件工程技能,與人工智能的問題解決方法相結(jié)合,將我們的產(chǎn)品提升到新的水平。
在遙遠(yuǎn)的未來,希望我們也可以像圖靈一樣,懷著忐忑的心情等待一個好結(jié)果,創(chuàng)造我們自己的克里斯托弗。那么,最后再說一句:“加油!未來的克里斯托弗!”
工程師必備
- 項目客服
- 培訓(xùn)客服
- 平臺客服
TOP




















