AI 大 house 真來了。
華為聯合上海交通大學、華中科技大學推出了世界模型WordGrow,可以生成1800㎡超大室內場景(19x39 塊),單卡 30 分鐘就跑了 272㎡。



具備連貫的幾何拓撲和照片級真實感外觀
以前想造個像樣的 3D 大場景,坑不少。
比如有些技術先靠 2D 模型畫張圖,再硬掰成 3D,結果換完視角一看,沙發腿歪了、墻壁紋理斷了……
還有一些方法最多只能造單個房間,擴展成套房就卡殼;
更離譜的是沒有布局邏輯——出現冰箱塞進臥室,床擺在廚房的情況。


同時,構建了粗、細兩個數據集,粗塊來確定宏觀布局,細塊保留紋理細節。
第二步靠3D 塊補全機制實現了無縫拼接,在生成新區塊時,先讓結構生成器確定 3D 結構框架,再讓 latent 生成器重建結構化潛變量(SLAT)特征,保證外觀風格統一。
并且,在輸入模型時,會把帶噪潛變量、補全區域二進制掩碼、已掩碼的已知區域特征打包融合,讓模型依據現有區塊的上下文信息精準生成,消除邊緣斷裂、紋理錯位等拼接縫。
第三步是粗到精生成策略,把場景擴展變成了補全缺失塊的任務。
先通過粗結構模型敲定整體規劃,比如窗戶朝向、走廊連接等布局;隨后對粗結構進行三線性插值上采樣,將分辨率匹配至細塊級別,再調用細結構生成器補全家具、紋理等細節。





本文一作是來自上海交通大學的 Sikuang Li 和 Chen Yang,研究完成于他們在華為實習期間。
Chen Yang 目前仍為華為研究實習生,研究聚焦于計算機視覺和計算機圖形學,導師之一就是這項研究的通訊作者、AI 大牛田奇。
田奇,華為終端 BG 首席科學家,國際歐亞科學院院士,ACM/IEEE Fellow。
論文地址:https://arxiv.org/abs/2510.21682
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
年度科技風向標「2025 人工智能年度榜單」評選報名火熱進行中!我們正在尋找 AI+ 時代領航者 點擊了解詳情
企業、產品、人物 3 大維度,共設立了 5 類獎項,歡迎企業報名參與
一鍵關注 點亮星標
科技前沿進展每日見