圖文轉成3D模型!OpenAI 發布Shap-E開源模型

南極熊導讀:如果直接使用文字描述,然后生成可以3D打印出來的模型數據,那么會不會迎來全民普及3D打印的時代?

圖文轉成3D模型!OpenAI 發布Shap-E開源模型的圖1

2023年5月,南極熊獲悉,發布著名人工智能產品ChatGPT 的OpenAI公司近日在 GitHub 網站上上發布了一款名為Shap-E 的條件生成模型,專門用于生成3D 圖像。該模型可供用戶免費下載使用,它能夠使用文本從頭開始生成模型,從而將 2D 圖像轉換為 3D 模型,還可以獲取模型并對其進行更改。從長遠來看,這可能會大大增加 3D 打印的普及率。畢竟對于3D打印從業者來講,熟練的建模能力是不可或缺的一環。

Shap-E下載鏈接:https://github.com/openai/shap-e

與這項研究相關的還有一篇由 Alex Nichol 和 Haewoo Jun 撰寫的隨附論文,題為“Shap-E: GeneratingConditional 3D Implicit Functions”。

圖文轉成3D模型!OpenAI 發布Shap-E開源模型的圖2

論文鏈接:https://arxiv.org/abs/2305.02463

根據 OpenAI 的說法,Shap-E是一種新型的3D 圖像條件生成模型。傳統的模型只能生成單一的輸出表達形式,但Shap·E 可以生成隱式函數的參數,這些函數可以作為紋理網格或神經輻射場(NeRF) 進行渲染,從而實現多樣化和逼真的3D 圖像生成。Shap·E 采用了隱式神經表示(INRs) 來編碼3D 圖像,提供了一個靈活且高效的框架,能夠捕捉到3D 圖像的詳細幾何特征。

圖文轉成3D模型!OpenAI 發布Shap-E開源模型的圖3

使用AI 生成3D 模型是想當困難的,因為3D 模型可以是非常復雜,具有大量的細節和紋理。因此,需要處理大量的數據和計算來生成這些模型,這需要強大的計算機和算法支持。同時需要精確測量和處理大量的數據,包括幾何形狀、尺寸、紋理、顏色等等。因此,算法必須具有高度的精度和準確性,以確保生成的3D 模型符合預期。

Shap-E 的訓練包括先將編碼器用來將3D 圖像轉換成隱式函數參數,再用有條件擴散模型進行訓練,從而生成多樣且復雜的3D 圖像。與Point-E 模型相比,Shap-E 在更高維度和多重表示輸出空間的情況下,顯示出更快的修正速度和相當或更好的樣本質量。

與Point-E的對比

OpenAI去年發表的Point-E是據文字提示產生3D點狀云,而新發布的Shap-E可以將文字或圖片轉成3D圖形的Shap-E模型。輸出文件可以在微軟小畫家3D(Paint 3D)中打開,甚至能夠轉成用于3D打印機的STL文件。此外,Shap-E相較去年發表的Point-E,能夠提供更好的3D圖像,產出效率更高。

圖文轉成3D模型!OpenAI 發布Shap-E開源模型的圖4

OpenAI所開發的Shap-E 3D模型,是直接建立出物體的輪廓,并采用神經輻射場(Neural Radiance Fields,NeRF)的功能,克服了初期模型的模糊性。NeRF與VR、AR使用的技術相同,可使3D場景視覺上更有臨場真實。Shap-E 可在GitHub下載,并能在個人電腦上安裝執行,目前Shap-E也不需要OpenAI API密鑰,能夠免費使用。

據外媒《Tom's Hardware》測試,Shap-E無論是要利用圖片還是文字都需要大量的電腦系統資源。Tom'sHardware 指出,例如以搭載RTX 3080顯卡和Ryzen9 5900X處理器的桌機跑Shap-E,完成繪制大約需要5分鐘。

而在ROG電競筆電配備RTX 4090顯卡和Intel Core i9-13980HX處理,只需要兩到三分鐘。但當嘗試在搭載Intel第8 代U 系列處理器結合內建顯卡的舊款筆電跑Shap-E,1 個小時只繪制約3%。此外Shap-E 不支援NVIDIA以外的顯卡品牌,硬體規格需要達到一定程度,才不會耗費許多等待時間。整體而言,目前Shap-E的成果多數仍是低解析度,缺少細節。

圖文轉成3D模型!OpenAI 發布Shap-E開源模型的圖5

開源的Shap-E 模型

用戶可以在 GitHub 上免費下載Shap-E模型,并在 Microsoft Paint 3D 上打開這一程序。該程序可以將用戶創建的渲染3D圖像轉換為 STL 文件,并通過3D 打印機如實呈現出來。

雖然 Shap-E 模型的這些基本知識可能看起來很簡單,但可能需要一些技術知識才能安裝和運行該模型。

Shap-E 開源模型的開發者Avram Piltch對其進行測試,他聲稱他花了 8 個小時才熟悉。他補充說,除了解釋您應該使用 Python pip 命令進行安裝之外,OpenAI 幾乎沒有提供任何說明。

安裝后,Piltch 說他能夠使用彩色動畫 GIF 文件和單色 PLY 文件測試提示,他指出,動畫 GIF 很受歡迎。這其中的一些有趣案例如下所示:包括一只企鵝、一把椅子和一架看起來像香蕉的飛機,所有這些都有不同的質量級別,具體取決于它們的文件類型。Piltch 還使用了該模型的功能,該功能允許用戶上傳 2D 圖像以轉換為 3D 對象。

圖文轉成3D模型!OpenAI 發布Shap-E開源模型的圖6

△彩色動畫GIF 文件

Shap-E開發者還指出,那些試圖安裝Shap-E 和渲染 3D 對象的人需要注意的是該模型需要大量的電腦系統資源。特別是,Shap-E 僅與 Nvidia GPU 兼容,需要高性能 CPU 才能在幾分鐘而不是幾小時內完成渲染。

網友評論

  • AI越來越牛了,將來用戶也許只需描述清楚物體的尺寸、特征和用途,AI就能把模型設計出來,然后連上3D打印機把模型打印出來便可使用…當每個人都能輕易的制造物件時,行業應用必將會成百上千倍的爆發。

  • 這個能做3D模型,太贊了!機械設計師以后可能也會像程序猿一樣開始顫抖

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

2