Google首款小程序「猜畫小歌」用了哪些AI相關技術?

這兩天,谷歌推出的首款AI小程序“猜畫小歌”火了,朋友圈一時成為靈魂畫師們的舞臺。大體來說,就是你和AI玩一個“你畫我猜”的游戲,你在屏幕上畫個涂鴉,AI會猜測你在畫什么。至于游戲規則和玩法,其他答主已經介紹的非常詳細了,這里不再贅述。

Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖1

(圖片來自TechCrunch)

其實這款產品并非谷歌首次推出,它的原型是谷歌在2016年11月發布一款叫做Quick,Draw!的網頁版小游戲,當時集智專欄也分享過:來自Google的小游戲,讓任何人都能參與到機器學習中來

Quick,Draw以及這款“猜畫小歌”比較類似于前幾年很火的手機游戲你畫我猜,但不同的是,Google在這兩款游戲中為用戶安排的對手不是人類,而是人工智能。

在Quick,Draw!畫板上畫出一個涂鴉后,AI會隨時給出它的猜測結果,當完成六次游戲后,系統會給出一個總覽圖,你可以點擊每一幅圖片來觀察AI的識別結果并瀏覽其他人的繪制結果。

Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖2
Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖3

網站傳送門

這兩款游戲的本質其實就是一個圖像識別分類過程,系統通過清洗、分析圖形的特征,來判斷圖形的真正含義。谷歌在發布Quick,Draw!之初時,分享過一個視頻,介紹了這款游戲的成型過程,可以幫助大家更形象的理解它背后的技術原理:

視頻戳這里

圖像識別技術一直是人工智能的一個重要組成內容,也是Google一直努力的研究方向之一,性能良好圖像識別模型具有重要的實用功能,可以廣泛地應用于圖片檢索、媒體內容歸類、視頻監控等多個領域。

當然訓練好這樣的人工智能并不容易,谷歌在介紹“猜畫小歌”時提到,Google AI 的神經網絡驅動。該網絡由全世界最大的、囊括超過 5000 萬個手繪素描的數據集訓練而成。去年8月份時,谷歌專門做過關于這個數據集的介紹,當時集智也做了分享

這個龐大的數據集是由1500余萬用戶在玩耍Quick,Draw!時和機器互動的過程中得來,目前收錄了5千萬幅涂鴉作品。谷歌已經將該數據集開源,將這些涂鴉畫作整理為開放數據集(后面會擴充為8億幅作品),旨在幫助全世界的開發者能用它訓練神經網絡,用來做數據分析、產品設計,幫助研究者們研究全球各地人們的繪畫習慣,甚至幫助藝術家創作新奇的作品···

Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖4

有這方面需求的朋友,不妨去看看,數據集地址

數據集所在的GitHub倉庫中也包含了有些開發者自己實現的Quick,Draw!模型,對于想復現這種技術的朋友來說很有借鑒意義,不要錯過。

話說回來,和玩Quick,Draw!一樣,我們在玩“猜畫小歌”的同時,也在幫助AI成長。在Quick,Draw!發布之初時,它只使用了數百個訓練數據,系統識別率并不理想,但經過后續多達千萬個用戶的參與和玩耍,多達幾億幅涂鴉作品幫助AI學習后,系統的識別率已經相當好,而且能識別出不同形態的同一物體(比如說對于寬檐帽和鴨舌帽的圖形,系統均能準確地識別出是“帽子”)。

其實,這種人工智能的意義也絕非識別人類涂鴉和我們玩玩游戲這么簡單。例如通過全球用戶在Quick,Draw!上和AI的互動,我們就能發現不同國家的用戶在認知角度與偏好上的差異,進而能了解全球各地用戶在描繪事物時的審美觀差異。通過這樣AI就能為我們的產品和應用在不同國家和地區的本地化做出有意義的指導,比如網站和App的UI該如何設計。

AI在學習人們的涂鴉姿勢和習慣后,甚至還能幫我們畫畫,比如谷歌在發布Quick,Draw!后不久,就在它基礎上推出了一款叫做AutoDraw的繪畫機器人,能將你的涂鴉自動升華為美麗的藝術圖像。設計師朋友們想想看,以前需要自己用軟件費時費力設計的圖形,現在按大概模樣隨便涂涂畫畫后,AI就能自動幫你轉化為需要的結果,如此省時省力,豈不美哉?

Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖5

(AutoDraw效果示意圖)

另外,通過識別和學習人類的繪畫書寫習慣,訓練后的AI還能幫助警方破案!比如今年的ICFHR18大會上收錄了一篇叫做《A New COLD Feature based Handwriting Analysis for Ethnicity/Nationality Identification》的研究論文,研究人員在收集五個國家公民的手寫字體后對其進行了分析,然后用這些數據集訓練了一個機器學習模型,能夠通過識別字跡確定書寫人的國籍。

研究人員隨即選擇了 100 名來自馬來西亞、伊朗、中國、印度和孟加拉國的被試者,讓他們手寫同樣的英文,然后使用一種線性分布(COLD)識別工具分析他們所寫字體的形狀分布特征,如直線度、彎曲度等。

Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖6

(AI在分析不同國籍人員的書寫習慣)

結果顯示,即使不是書寫該國文字,被試者的筆跡也呈現出明顯的“國籍”特征。因為這是文字造就的書寫習慣不同,即時換為書寫另一種語言同樣潛意識的保留了它們。例如,習慣漢字筆直筆畫的中國人,即使是手寫羅馬字母,也不會改變直線書寫習慣;而文字比較“圓潤”的印度和孟加拉國,他們寫出的字體則更“圓”。所以,假如案件中出現跨國嫌犯,物證中存在嫌犯留下的筆跡,AI就能分析出嫌犯的國籍。

隨著訓練數據越來越多、越來越廣,人工智能會帶來更多像這樣的創新成果。

當然,Quick,Draw!以及“猜畫小歌”最直接的意義是以游戲的方式讓大眾參與到機器學習過程中,從而讓人工智能技術變得觸手可及,人人都能上手體驗AI的樂趣。

其實谷歌一直以來都有一個很好的傳統,就是將其掌握和正在研究的各類項目轉化為有意思的小實驗來讓普通用戶體驗和測試,比如包含Quick,Draw!小游戲的項目AI Experiments。

Google首款小程序「猜畫小歌」用了哪些AI相關技術?的圖7

(AI Experiments繪畫部分的小實驗)

網站上面匯集了很多有意思的小實驗,題材涵蓋繪畫、音樂和語言多個方面,讓普通人也能輕松探索機器學習的世界。傳送門

通過這些小游戲和小實驗,讓普通大眾也能領略最新的人工智能技術,不失為一種富有創造力的方式。

最后附一個我們此前分享過的AI Experiment小實驗,讓你在瀏覽器上就能玩耍機器學習,理解神經網絡的學習過程,很好玩,不要錯過。


作者:景略集智
來源:掘金

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP