自己會畫畫的人工智能，正在用藝術征服人類

電子工程世界EEWorld

2022年4月25日 09:57

瀏覽：2024 收藏：1

自己會畫畫的人工智能，正在用藝術征服人類的圖1

AI作畫早就不是什么新鮮事。

從幾年前開始，每隔一段時間就會有一個新的“自動作畫AI”跳出來，憑借精心調試的案例吸足眼球。但到了大多數人手里，卻又只能畫出仿佛脫胎于克蘇魯神話的詭異產物，好奇心的熱乎勁冷卻后就被快速淡忘。

自己會畫畫的人工智能，正在用藝術征服人類的圖2

兩款能將簡單圖案復雜化的AI，仍然存在不少局限

直到最近，一批風格獨特的畫作開始在網上流行。天馬行空的構圖、豐富的細節加上風格統一的筆觸無不彰顯著作者的藝術審美，只不過它們是出自AI之手。

自己會畫畫的人工智能，正在用藝術征服人類的圖3

作者：Aetherial

自己會畫畫的人工智能，正在用藝術征服人類的圖4

作者：Binx.ly

但在精致的畫面背后，最讓人吃驚的還是這些AI的畫圖方式：直接描述想象中畫面，它就能生成對應圖像，就像能聽懂人類的自然語言一樣。一個“用嘴畫圖”的時代，仿佛已經悄然即將來臨。

早在一年前，一個名叫wombo的AI繪圖程序就已經引發過熱議。不需要任何繪畫基礎，也不必懂復雜的參數調試，只要輸入一句簡單的提示詞，就能得到一張可能風格詭異但頗具神韻的作品。

自己會畫畫的人工智能，正在用藝術征服人類的圖5

只是更多時候，想得到一張符合想象的畫作并不容易。

當你嘗試描述“用吉普力工作室的風格畫出一個皮卡丘”時，可能收獲的卻是一幅“移動的皮卡丘城堡”；想看看蒸汽朋克的海拉魯大陸如何，卻只得到一個機械宇航員的側身像。想讓AI讀懂自己的心思，除了需要更精準的描述外，似乎更需要還是運氣。

自己會畫畫的人工智能，正在用藝術征服人類的圖6

最近開始流行的Disco Diffusion（以下簡稱DD），和wombo一樣基于Deepdream視覺程序，但相較之下它明顯更能和人類“互相理解”。不僅畫出的作品詭異氣氛大減，而且能更精準地還原場景描述，更能“聽懂人話”。

當我同樣輸入“一座巨大的哥特式城堡，矗立在波濤洶涌的流光之海中”時，兩個AI的作品對比非常明顯。DD已經完全丟掉了滿是AI烙印的抽象畫風，用以假亂真的筆觸還原了我想要的風格，而這距離我的想象已經非常接近。

自己會畫畫的人工智能，正在用藝術征服人類的圖7

右側兩幅DD畫作是同一描述下生成的不同結果

相比于wombo固定種類的畫風選項，DD通過直接添加不同的關鍵詞調節畫作風格。這些詞匯可以是繪畫形式、流派名稱、藝術家名字或者具體到某個作品的標題。

同樣是上述哥特城堡的描述，加上“中國山水畫”或“梵高的星月夜”的補充后，得到的結果就大相徑庭。

自己會畫畫的人工智能，正在用藝術征服人類的圖8

在一個名為weirdwonderfulai的網站上，眾多使用者總結出了同一句話在不同作者、流派、關鍵詞下得到的上百種結果以供參考，由此可以看出DD強大的風格把控力。

自己會畫畫的人工智能，正在用藝術征服人類的圖9

許多創作者的悉心調教后的DD，已經完全具備“畫出”一系列成熟作品的潛質。社區里有不少人經過初步摸索，畫出的作品已經很難看出AI處理的痕跡。

自己會畫畫的人工智能，正在用藝術征服人類的圖10

作者：annetropy

自己會畫畫的人工智能，正在用藝術征服人類的圖11

作者：kelseyY

再搭配上不同主題和風格，完全能得到以假亂真的概念場景作品，稍加后期的人工修飾，就是一套賣相十足的成熟作品集。

自己會畫畫的人工智能，正在用藝術征服人類的圖12

作者：LIUXIYAUN

但與此同時，我們也都明白AI并不能真的聽懂人話。在無法幫助它快速學習迭代的情況下，不少人選擇和AI角色互換，讓自己接受訓練，試圖去理解AI眼里的人類語言。

“一幅由greg rutkowski和thomas kinkade創作的漂亮畫作：一座燈塔在洶涌的血海邊閃耀著光芒，Artstation的流行風格，黃色配色方案。”

作為官方給出的描述語模版，每個DD的使用者都見過上述這句話。語法規范的描述語不算長，其中卻包含了畫家、畫種、內容、風格和配色方案等要素，讓初學者能一眼明白描述詞的要點。

自己會畫畫的人工智能，正在用藝術征服人類的圖13

但很快使用者們漸漸發現，正確的語法語序并不能很好表達出畫面的邏輯，甚至適當的偏差反而能得到更好的結果。畢竟從原理上來說，AI只是根據關鍵詞對應的圖片信息“算”出了這樣一幅畫。

利用這一特性，也就不必拘泥于人類語言中的對錯，只要某個詞匯能對應一類圖像的特征和風格，它就能成為一種畫風，圖片網站、游戲引擎名稱或者鏡頭型號都可以。

自己會畫畫的人工智能，正在用藝術征服人類的圖14

對于DD來說，參數也是調整圖片的重要方式。但如果嫌麻煩，僅靠描述詞也可以達到類似的效果。

例如在描述詞后加上不同的數字調整權重，如“雷云5：，火焰：5”，畫面中它們呈現的比例就會有所對應；加上“景深：-2”關鍵詞，會減弱畫面的景深效果；輸入“4K”則會在分辨率不變的情況下提升銳化值，模擬出更清晰的畫面。

自己會畫畫的人工智能，正在用藝術征服人類的圖15

“一棵由雷云和火焰組成的樹”

到了這時候，不少人的描述詞里已經沒有了最初還算嚴謹的語法，變成了詞組和數字的神奇組合。為了讓AI更好理解自己，這些賽博煉丹師反而讓自己被訓練出了一套怪異的語言，和AI完成了奇妙的角色互換。

可也正因如此，擅長捕捉詞匯特征的DD才會犯下只有AI會鬧出的笑話。

當我為了模擬次世代游戲畫面，嘗試加入“RTX ON”詞綴渲染上圖中的樹時，圖片角落總會出現類似于作者簽名的神秘符號。但我的描述里并沒提到任何一個作者，這讓我百思不得其解。

自己會畫畫的人工智能，正在用藝術征服人類的圖16

直到我細想之下越發覺得這東西很像幾個字母的變形，到搜索引擎里一看“光追”的圖片結果，立馬明白了怎么回事：光追畫面的演示圖片里確實都有一個常被我們忽視的“簽名”。

自己會畫畫的人工智能，正在用藝術征服人類的圖17

不只圖片的角標會干擾結果，當一個人名不僅對應他的作品，還能搜出作者本人的肖像照時，類似的情況也會出現。

當你想著用宮崎駿電影的風格來一張畫時，宮崎駿老爺子的頭像可能會突然出現的云端。或者為了模擬《異形》風格加上設計師H. R. Giger 的名字時，他也可能不請自來為個人風格濃郁的骨頭宮殿打上水印。

自己會畫畫的人工智能，正在用藝術征服人類的圖18

作者：ZhaoKin

從結果來看，已經能畫出很多驚艷作品的DD，距離理解人類語言還有很大一段距離。但它做不到并不意味著所有AI都做不到，這幾天它風頭更盛的另一個同僚DALLE-E2，就明顯更接近美好暢想中的“用嘴畫圖”

在DALL-E2官網的演示里，靠著不同物體概念、屬性和樣式的組合，我們能輕易得到一個區別于DD寫意風格的具象圖片。例如一個騎著馬的宇航員或一個和貓打籃球的宇航員。

改變風格詞條，還能在寫實、波普藝術、童書和水彩風格中任意切換畫風，同樣保持了描述中邏輯關系的正確，完全沒出現不可名狀的畫面。

自己會畫畫的人工智能，正在用藝術征服人類的圖19

更神奇的是，這個AI還能在保證陰影、反射和紋理正確的情況下，在圖片中毫無破綻地加入想添加的元素。例如想在一張美術館的圖片中加入一只柯基，不管想讓它和左畫中的老人來一張合影，鉆進右畫還是趴在前景的軟凳上，DALL-E2都可以算出它正確的樣子。

自己會畫畫的人工智能，正在用藝術征服人類的圖20

自己會畫畫的人工智能，正在用藝術征服人類的圖21

除此之外，它還能選定畫面里的指定元素刪除或修改，或是讓AI按照原圖風格再繪制一幅類似的作品。

自己會畫畫的人工智能，正在用藝術征服人類的圖22

自己會畫畫的人工智能，正在用藝術征服人類的圖23

由于DALL-E2目前還處于內測階段，很多慕名而來的人都無法實際上手操作，不免懷疑實際應用中是否能還原案例中的效果，這些展示案例中預調試的成分又有多少。

但從推特上部分拿到測試資格的用戶的發出的成果來看，人們對DALL-E2的擔憂并沒有成真。他依然保持著超強的“理解力”，即使是很多現有圖庫中很難找到現成答案的描述，它畫出的作品依然沒有讓人失望。

自己會畫畫的人工智能，正在用藝術征服人類的圖24

并且在一些參考圖片更少、可變動性不大的虛擬形象上，我們也很難一眼看出DALL-E2作品里留下的AI痕跡。

自己會畫畫的人工智能，正在用藝術征服人類的圖25

作者：Trent Kuhn（左），Cybertroniss（右）

作為知名人工智能研究組織OpenAI推出的產品，DALL-E2其實在去年就有了初代版本DALL-E，只不過當時它的清晰度和識別性都還很差，雖然也能實現用文字生產畫面的效果，但并沒引起什么關注。

對比前后兩代產品在相同描述下的作品，我們能直觀感受到它的進化，而這僅僅過去了8個月。

自己會畫畫的人工智能，正在用藝術征服人類的圖26

正是在AI這種快到令人有些心驚的速度里，一片“哇塞”的贊嘆聲中還混雜著另一個詞匯：“失業”。不少相關從業者在感嘆技術進步的同時，也逐漸產生了被AI取代的危機感，一如19世紀攝影術發明之初的畫家前輩們。

“從今天開始，繪畫已經死了。”

這是19世紀40年代法國畫家保羅·德拉羅什首次看到攝影印刷品后說出的話。但就算不看歷史我們也都知道，繪畫還活得好好的。

“用嘴畫圖”聽上去非常美好，只需要形容心中所想就能得到一幅畫面，也難免苦練手頭功夫的美術工作者對此產生焦慮。但在混跡DD社區的這一周里，我還是明顯感受到了我和其他人作品的“嘴上差距”。

社區里很多人都有著豐富的軟件輔助作圖經驗和繪畫功底，對于不同派別、不同網站的畫作特點他們可以信手拈來，不同參數的微調也不在話下，想獲得固定構圖和配色時，他們還能靠導入草圖幫助AI更好理解描述語，通過后期修改補繪調整細節。這才有了那些我難以企及的作品。

自己會畫畫的人工智能，正在用藝術征服人類的圖27

作者：Binx.ly

DD訓練著用戶不停實驗描述詞的效果差異，同時反過來這也是他們對它探究學習的過程，就像學習使用一支新畫筆的過程。看上去效果更好的DALL-E2，也不過是風格更內斂和具象的另一支。

自己會畫畫的人工智能，正在用藝術征服人類的圖28

nin_artificial用同一詞條得到的作品風格對比

文字描述確實給了創作更大的空間，但這過程中的想象、調試、修改和補充等步驟，仍然需要創作者全程的參與和把控，就像買了相機并不等于學會了攝像。

更何況攝像的發明當初不僅沒有殺死繪畫，反而在古典繪畫的基礎上讓人們學會了以更多元的觀察和思考方式，才有了后來印象派、立體主義和超現實主義等新風格的誕生。

自己會畫畫的人工智能，正在用藝術征服人類的圖29

薩爾瓦多·達利的《記憶的永恒》

據OpenAI介紹，他們之所以要把這個AI命名為DALL-E，主要參考了超現實主義畫家薩爾瓦多·達利（Dali）和動畫電影《機器人總動員》主角瓦力（WALL-E）這兩個名字。他們悄悄鑲在這臺機器中的展望也就不言而喻了——

在一片荒蕪的新大陸上，瓦力仍將幫助人類開墾出新的樂土，即使這次它是位畫家。

登錄后免費查看全文

立即登錄

技術鄰APP
工程師必備

項目客服
培訓客服
平臺客服

TOP

不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

自己會畫畫的人工智能，正在用藝術征服人類

推薦閱讀