本帖最后由 冰墩熊 于 2025-5-15 14:45 編輯
導讀:隨著人工智能技術的飛速發(fā)展,越來越多的科技企業(yè)加入到了快捷3D模型創(chuàng)建這個領域。
錄制_2025_05_15_14_26_41_32.gif (1.49 MB, 下載次數(shù): 11)
下載附件
2025-5-15 14:32 上傳
2025年5月15日,南極熊獲悉,美國視頻游戲開發(fā)商Roblox(羅布樂思)近日推出了一款創(chuàng)新性AI模型Cube 3D,它允許創(chuàng)作者基于文本提示詞的形式生成3D數(shù)字內容。該模型的開源版本現(xiàn)已通過GitHub和HuggingFace提供,方便開發(fā)者和創(chuàng)作者進行使用。同時,Cube 3D已經(jīng)集成到Roblox Studio,并支持基于Lua的API,極大簡化了在游戲環(huán)境中生成3D網(wǎng)格的過程。
1111.gif (1.77 MB, 下載次數(shù): 7)
下載附件
2025-5-15 14:34 上傳
△提示詞:A red buggy with knobby tires
3D數(shù)字內容的智能生成
與傳統(tǒng)的圖像重建方法依賴視覺數(shù)據(jù)不同,Cube 3D基于Roblox生態(tài)系統(tǒng)中原生的3D資源進行訓練,這使它能夠生成與游戲引擎兼容的結構完整的數(shù)字對象。通過Cube 3D,創(chuàng)作者只需輸入類似“生成摩托車”之類的簡單文本命令,即可即時生成適合游戲中部署的完整3D網(wǎng)格。生成的對象在初期即具備交互功能,后續(xù)可以通過紋理和顏色進一步增強視覺效果。
微信圖片編輯_20250515143550.jpg (94.25 KB, 下載次數(shù): 9)
下載附件
2025-5-15 14:36 上傳
△Roblox Cube聲稱模型示例
基于Token的生成與預測技術
Cube 3D采用了基于Token的系統(tǒng)來理解和預測3D形狀。借鑒了大型語言模型中的技術,Cube 3D將幾何圖形轉化為形狀Token,并通過自回歸轉換器來預測網(wǎng)格中的后續(xù)Token,從而逐步構建3D模型。
這種方法既支持單個對象的補全,也支持完整的場景布局生成。為了協(xié)調多模態(tài)輸入,Roblox工程師開發(fā)了一個統(tǒng)一的轉換器架構,兼容文本、圖像以及音頻等未來的數(shù)據(jù)類型。當前版本專注于從文本生成對象,但未來的更新預計將支持場景級輸出和混合輸入模態(tài)。
Roblox將這款軟件定位為向實時、用戶增強內容創(chuàng)作轉型的一部分。平臺的長期目標是實現(xiàn)“4D創(chuàng)作”,即AI不僅能夠理解對象的形態(tài),還能理解對象的交互邏輯和與環(huán)境的關系。這將涵蓋多個方面,如布局邊界框的自動放置、多對象環(huán)境的網(wǎng)格融合以及情境感知的自動調整——例如,AI能夠根據(jù)游戲中的敘事觸發(fā)切換季節(jié)性元素或動態(tài)調整物體的幾何形狀。
盡管Cube 3D目前無法直接處理STL等3D打印文件格式,但是它使用的底層技術——標記化3D形狀方法可能會影響虛擬原型設計、AI輔助設計甚至CAD自動化領域產(chǎn)生影響。在處理原生3D管線的專有游戲開發(fā)平臺中,此類開源模型仍然罕見。另外,Roblox與其它合作伙伴一起,建立了一個名為ROOST的非營利組織。ROOST致力于開源人工智能的安全性問題。
|