關(guān)于工業(yè)軟件與AI那點事

杭州擬創(chuàng)（RecurDyn原廠）

2023年4月4日 15:42

瀏覽：2129 收藏：1

關(guān)于工業(yè)軟件與AI那點事的圖1

在電影《模擬游戲》（The Imitation Game，2014）中，主角艾倫·圖靈（Alan Tuim）看著自己發(fā)明的解密機“克里斯托弗”（ Christopher）喃喃自語，仿佛在對著人說話。雖然這個場景可能是虛構(gòu)的，但是依舊在計算機和人工智能(AI)歷史上具有劃時代意義。艾倫·圖靈在二戰(zhàn)中創(chuàng)造了能解決組合優(yōu)化問題的機器，它具備可編程解決問題的能力，破譯了德軍的密碼，為聯(lián)軍的勝利做出了決定性貢獻，而在電影中圖靈急切地等待結(jié)果的情景，就仿佛機器真的有自己的意志一樣。

艾倫·圖靈這個人物和圖靈測試等細(xì)節(jié)在本文中不作詳細(xì)討論，但這可以說就是現(xiàn)代計算機和AI的起點，因此我想通過這篇文章來講述關(guān)于AI的一系列故事。

由于AI這個主題本身就比較廣泛，所以文章中講述的內(nèi)容僅代表個人觀點，如果發(fā)現(xiàn)表述有誤的地方，也請大家見諒。

概述

關(guān)于工業(yè)軟件與AI那點事的圖2

以下是維基百科對AI的定義摘要：

“這是計算機科學(xué)的一個細(xì)分領(lǐng)域，試圖讓計算機實現(xiàn)人類的學(xué)習(xí)能力、推理能力和感知能力。即具有智能功能的計算機系統(tǒng)，將人類的智能體現(xiàn)在機器上。”

AI是一門試圖從理解智能到構(gòu)建實體的學(xué)科。可以說對AI的研究早在第二次世界大戰(zhàn)不久后就已經(jīng)開始了，人工智能一詞最早出現(xiàn)于1956年，因此它并不是最近突然冒出來的新科學(xué)，而是經(jīng)歷了大約100多年興衰更迭，在經(jīng)歷了漫長的低迷期后，隨著各種相關(guān)學(xué)科和計算機運算能力的發(fā)展，近期AI再次成為創(chuàng)新的核心。

由于AI的核心是對人類的理解和模仿，因此所有關(guān)于人類的學(xué)科都可以成為與AI相關(guān)的學(xué)科（如神經(jīng)科學(xué)、腦科學(xué)、心理學(xué)、計算機工程、物理學(xué)、哲學(xué)、數(shù)學(xué)、經(jīng)濟學(xué)等）。隨著這些相關(guān)學(xué)科的發(fā)展，最近AI在很多方面都取得了令人矚目的成果：可以區(qū)分視覺信息（基于Vision）、模仿人類對話（基于GPT、Transformer的語言模型）、模仿和創(chuàng)造人類無法區(qū)分的學(xué)習(xí)內(nèi)容或新事物（GAN）、通過相關(guān)信息和知識回答問題（GNN）。現(xiàn)在，AI在特定領(lǐng)域已經(jīng)超越了人類，因此，對于AI的看法，狂熱和擔(dān)憂并存。

現(xiàn)在讓我們更近一步地了解一下AI

AI如何解決問題？

現(xiàn)代AI正在以基于數(shù)據(jù)的方法發(fā)展，因此對基于數(shù)據(jù)的機器學(xué)習(xí)（ML：Machine Learning）的理解至關(guān)重要。從個人的角度來看，如果用一句話來定義基于數(shù)據(jù)的AI推論和ML的關(guān)系就是：根據(jù)數(shù)據(jù)歸納導(dǎo)出數(shù)學(xué)形態(tài)（ML），再進行演繹推理并應(yīng)用（AI）。

可以這么說，在AI的發(fā)展歷史中，解決問題的方法是非常重要的一部分，大致可以概括為兩種方法：基于規(guī)則的方法(演繹嘗試)和基于經(jīng)驗的方法(歸納嘗試)。

在AI近100年的發(fā)展歷史中，這兩種方法順應(yīng)時代需求你追我趕地發(fā)展。(這也類似于在RecurDyn中FFlex和RFlex交替受到關(guān)注的原因。）

演繹方法的一個典型例子是解決用邏輯符號表示問題的GPS（General Problem Solver），歸納方法的一個典型例子是最近的熱門話題深度學(xué)習(xí)。在人工智能的早期，由于當(dāng)時計算機的計算能力有限，演繹法比歸納法更有效。而后來計算能力的增強使得在合理時間范圍內(nèi)解決數(shù)據(jù)驅(qū)動問題成為可能。

數(shù)據(jù)驅(qū)動的方法在現(xiàn)代AI/ML中已經(jīng)占據(jù)了主導(dǎo)地位，因此，可以認(rèn)為本文后面提到的AI/ML皆指的是數(shù)據(jù)驅(qū)動的歸納方法。數(shù)據(jù)驅(qū)動的方法是最近人工智能在許多領(lǐng)域崛起的動力，在解決無法解決的問題或發(fā)現(xiàn)傳統(tǒng)方法未能探索的問題方面取得了成功。

那么，基于數(shù)據(jù)的AI/ML是如何解決現(xiàn)實世界中的問題的呢？過程如下:

要解決的問題包括在現(xiàn)實世界中積累的大量數(shù)據(jù)，或者可以編寫或生成的數(shù)據(jù)。通過數(shù)學(xué)方式查明這些數(shù)據(jù)之間的關(guān)系來解決問題的過程就是機器學(xué)習(xí)，并使用由此訓(xùn)練的模型進行推理以解決實際問題。

機器學(xué)習(xí)通過優(yōu)化從數(shù)學(xué)上解決問題。首先準(zhǔn)備數(shù)據(jù)，從準(zhǔn)備的數(shù)據(jù)中確定輸入數(shù)據(jù)和輸出數(shù)據(jù)。找到與輸入和輸出數(shù)據(jù)相匹配的數(shù)學(xué)模型。在此過程中，為了獲得優(yōu)化的結(jié)果，基本都需要大量的數(shù)據(jù)支持。（對于大型模型，自由度是以億為單位的，需要在最高水平的數(shù)據(jù)中心長時間計算。因此，在計算機運算能力不足的年代，很難進行正確的嘗試。）由于計算結(jié)果是在準(zhǔn)備的數(shù)據(jù)所涵蓋的空間內(nèi)的優(yōu)化答案，在所覆蓋的數(shù)據(jù)空間內(nèi)替換新的數(shù)據(jù)時，可以推導(dǎo)出該空間內(nèi)的優(yōu)化結(jié)果。

如果將這種解決方法比喻為學(xué)習(xí)英語，就可以說這種解決方法類似于在不懂英語語法的情況下，通過直接大量的對話和閱讀，學(xué)習(xí)如何根據(jù)給定的語境記憶和排列所接觸到的詞匯。

關(guān)于工業(yè)軟件與AI那點事的圖4

AI可信嗎？

雖然大致了解數(shù)據(jù)驅(qū)動的AI是如何解決問題的，但是在我們試圖解決問題的過程中，必然會遇到一些普遍和現(xiàn)實的疑問，比如：這種方法在數(shù)學(xué)上合理嗎？可以直接應(yīng)用嗎？能向客戶說明嗎？聽說在解決問題時，準(zhǔn)確性不是 100%？總結(jié)一句話就是 “這個結(jié)果是可信的嗎”

AI/ML開始流行的初期，缺少對這部分的說明，但最近，這種可說明性（Explainable AI）越來越重要。這也是為什么發(fā)表AI相關(guān)庫或框架時，論文會緊隨其后。很多方法和理論存在于數(shù)學(xué)基礎(chǔ)之上。支持AI/ML的數(shù)學(xué)定理有很多，例如高斯-馬爾科夫定理（Gauss-Markov Theorem）、奇異值分解（Singular Value Decomposition）、默瑟定理（Mercer’s Theorem）、表示定理（Representer Theorem）、西文科定理（Universal Approximation Theorem）。值得一提的是，其中西文科SIBENKO定理還涵蓋了最近對AI/ML影響最大的人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)意義。雖然無法一一詳細(xì)說明，但毋庸置疑，基于數(shù)據(jù)的機器學(xué)習(xí)和由此產(chǎn)生的AI在數(shù)學(xué)上是可靠的。

在數(shù)學(xué)證明方面，就像演繹法和歸納法之間沒有對錯一樣，采用基于規(guī)則的AI和基于數(shù)據(jù)的機器學(xué)習(xí)的AI也沒有對錯。解支配方程（以規(guī)則為基礎(chǔ)解決問題）的應(yīng)用雖然在數(shù)學(xué)上很美，但由于公式展開會存在無法顯示的誤差，因此經(jīng)常與現(xiàn)實存在差異。同樣，通過歸納數(shù)學(xué)表達式（基于數(shù)據(jù)解決問題）并加以應(yīng)用，對使用的數(shù)據(jù)也無法獲得100%的準(zhǔn)確度。也就是說，理論和現(xiàn)實之間的誤差總是存在的，區(qū)別在于何時何地顯現(xiàn)。雖然基于數(shù)據(jù)的方法乍一看讓人感覺像是在盲人摸象，但設(shè)計好的解決方法和演繹推論方法一樣絕對沒有錯。如果我們因為不能100%解決一個問題而對人工智能/ML領(lǐng)域的研究和應(yīng)用望而卻步，那我們只能看到和聽到習(xí)慣的東西，數(shù)據(jù)驅(qū)動才是解決棘手問題的最佳方法。

解決問題的正確方法是很好地解決了問題，而不管采取什么方法。

我們應(yīng)該如何看待AI？

對于我們這些非AI研究人員來說，真正重要的是了解我們在AI時代應(yīng)該做什么？怎么做？為什么做？以及什么時候做？當(dāng)看到別人都在談?wù)揂I的情景時，可能會害怕是否只有我們落在后面，但還是需要像往常一樣保持冷靜的態(tài)度去看待現(xiàn)實問題。

事實上，世界不會在短時間內(nèi)發(fā)生翻天覆地的變化，我們的公司也不會馬上倒閉。有很多人一成不變，仍然過得很好，也有很多人開拓創(chuàng)新，只是因為太前衛(wèi)或?qū)Ξ?dāng)下無用而被埋沒。人工智能也有過這樣的時刻，即使現(xiàn)在看起來沒有它我們就注定是失敗的，但你永遠(yuǎn)不知道什么時候我們會有另一個像80年代那樣的人工智能冬天。

但是在某個時刻，技術(shù)會被突破，如果企業(yè)沒有準(zhǔn)備好，就可能被市場淘汰。重要的是，我們要以好奇的眼光和冷靜的頭腦去妥善應(yīng)對這些威脅。其基礎(chǔ)應(yīng)該是我們理解AI的本質(zhì)，我們擁有適應(yīng)和應(yīng)對環(huán)境的能力，并為之努力。冷靜地思考一下再決定，是挑戰(zhàn)原始技術(shù)開發(fā)，還是快速跟上技術(shù)趨勢，還是將已推出的技術(shù)和理論結(jié)合起來應(yīng)用。我個人認(rèn)為，AI/ML技術(shù)可能不是現(xiàn)實中需要研究和開發(fā)基礎(chǔ)技術(shù)的對象，而是像Visual Studio一樣需要我們好好處理和利用的對象。

關(guān)于工業(yè)軟件與AI那點事的圖5

全球IT領(lǐng)域的研究公司Gartner于2021年發(fā)布了AI領(lǐng)域的Hype Cycle。與AI相關(guān)的關(guān)鍵詞大多位于創(chuàng)新Trigger（技術(shù)創(chuàng)新）、Peak of Inflated Expectations（期望頂點）階段。

AI是需要正面挑戰(zhàn)的對象嗎？有沒有可能會威脅我們的生存？答案總是在“可能會，也可能不會”之間徘徊。在這種情況下，我們必須要明白一點：如果我們在研究技術(shù)和開發(fā)產(chǎn)品的過程中引入了AI，那么在研究和應(yīng)用方面必須以客戶為基礎(chǔ)。您需要知道客戶是否有潛在的需求，如果有，就必須能夠通過產(chǎn)品傳達明確的價值。借鑒領(lǐng)先企業(yè)的共同點，我們對新技術(shù)的信心和對未來的愿景是基礎(chǔ)，我們必須提前具備高水平的專業(yè)知識。如果決定應(yīng)用新技術(shù)，就必須朝著能夠在整個產(chǎn)品和組織中全面創(chuàng)造協(xié)同效應(yīng)的方向發(fā)展，而不只是零散的方式，最終的結(jié)果應(yīng)該是極大地改善用戶體驗。

AI很有魅力，它提供了一種解決無法在有限的時間內(nèi)解決的困難問題的方法。因為我們也有很多在有限的時間內(nèi)無法解決的問題，所以我們也可以通過基于數(shù)據(jù)的方法來解決這些問題。

總結(jié)

最近，現(xiàn)代AI在解決特定問題上的表現(xiàn)已經(jīng)遠(yuǎn)超預(yù)期，后續(xù)將轉(zhuǎn)向把多個領(lǐng)域捆綁在一起，試圖共同解決問題。出現(xiàn)這種趨勢的典型例子是：實現(xiàn)高水平的自動駕駛。隨著時間的推移，在這種趨勢的盡頭，可能會實現(xiàn)強人工智能（“通用人工智能”）。

人類是能快速地進行并行計算的智能體，我們可以在幾分之一秒內(nèi)綜合來自我們多個感覺器官的所有信息，比如通過發(fā)出“啊！”的聲音的同時讓我們的手迅速從滾燙的物體上縮回。現(xiàn)在的AI還無法完成這種非常復(fù)雜和快速的并行進程的動作。換句話說，在整個AI的發(fā)展歷程中，雖然在某些方面上已經(jīng)遠(yuǎn)遠(yuǎn)超越了人類，但在強人工智能方面仍處于初期，還需要長期的發(fā)展。就個人而言，我希望看到我們所擁有的數(shù)學(xué)和軟件工程技能，與人工智能的問題解決方法相結(jié)合，將我們的產(chǎn)品提升到新的水平。

在遙遠(yuǎn)的未來，希望我們也可以像圖靈一樣，懷著忐忑的心情等待一個好結(jié)果，創(chuàng)造我們自己的克里斯托弗。那么，最后再說一句：“加油！未來的克里斯托弗！”