Co-Layout: LLM-driven Co-optimization for Interior Layout¶
会议: AAAI 2026
arXiv: 2511.12474
代码: 无
项目主页: https://xccelephant.github.io/paper/co-layout/
领域: 优化 / 室内设计
关键词: 室内布局, 整数规划, 大语言模型, 协同优化, 粗到精策略
一句话总结¶
提出 Co-Layout 框架,利用 LLM 从自然语言需求中提取结构化约束,再通过基于网格的整数规划(IP)联合优化房间布局与家具摆放,辅以粗到精求解策略提升效率,显著优于现有两阶段方案。
研究背景与动机¶
问题场景¶
室内设计是一项需要大量专业经验的任务:设计师要将客户模糊的需求转化为具体的房间规划和家具摆放方案,涉及大量设计变量和约束之间的权衡。开发自动化设计工具不仅能提升设计师工作效率,也能激发创作灵感。
现有方法的局限性¶
现有方法普遍将室内设计拆分为两个独立阶段:先生成房间布局(room layout),再在每个房间内摆放家具(furniture layout)。典型代表如 HouseGAN++、Holodeck 和 AnyHome。但在实际设计中,家具决定了房间功能,房间的大小和形状又反过来影响家具的尺寸和位置,两者天然耦合。分离式处理会导致诸多问题:
- 走廊不连通:家具堵塞通道,导致某些房间不可达
- 房间不可及:需要穿过卧室才能到达客厅等不合理路径
- 空间浪费:房间形状不规则或过于狭长,家具无法合理摆放
核心洞察¶
作者观察到 LLM 在理解高层设计需求方面表现出色,能将用户的自然语言描述翻译为房间和家具的详细列表及约束关系。但 LLM 的短板在于无法生成精确坐标——直接让 LLM 输出坐标会产生大量几何冲突(重叠、越界等)。因此本文的核心思路是:让 LLM 负责语义层面的约束提取,让整数规划负责满足这些约束的精确几何求解,实现"语义理解"与"精确优化"的分工协作。
方法详解¶
整体框架¶
Co-Layout 包含两个阶段:
-
LLM 预处理阶段:通过精心设计的 prompt,LLM 工作流接收用户的文字描述(如"设计一个 100m² 的两居室公寓,需要开放式厨房"),输出结构化的场景图(scene graph),包括房间列表 \(R = \{r_k\}_{k=1}^{N}\)、家具列表 \(S = \{s_{k,l}\}\) 及各类约束(邻接、面积、相对位置等)。
-
整数规划优化阶段:将 LLM 生成的约束编码到一个基于网格的整数规划模型中,联合求解房间分区和家具位置。采用粗到精策略加速求解。
最终布局可导入 Blender 并结合 3D-FUTURE 和 Imaginarium 资产库渲染三维场景。
网格表示(Grid-based Representation)¶
受建筑学经典理论"Modulor"的启发,空间被离散化为二维网格 \(\mathcal{G} = \{(i,j): 0 \leq i < W, 0 \leq j < L\}\)。每个网格单元 \((i,j)\) 被赋予一组二值变量:
- \(x_{i,j}^k \in \{0,1\}\):该单元是否属于第 \(k\) 个房间
- \(p_{i,j} \in \{0,1\}\):该单元是否属于走廊
- \(f_{i,j}^{k,l} \in \{0,1\}\):该单元是否被第 \(k\) 个房间中第 \(l\) 件家具占据
这种表示的优势在于:相比栅格化图像表示和向量化表示,网格方式能自然地建模走廊连通性、房间可达性等高层拓扑约束,同时与 Modulor 的模块化设计理念一致。
关键约束设计¶
(1)空间互斥约束:每个网格单元必须唯一地分配给某个房间或走廊,不允许重叠: $\(p_{i,j} + \sum_{k=1}^{N} x_{i,j}^k = 1, \quad \forall (i,j) \in \mathcal{G}'\)$
(2)走廊连通性约束:这是本文的核心技术贡献之一。作者使用流模型(flow-based formulation)来保证走廊和开放式房间(如部分客厅)形成一个完整的连通网络。具体做法是以入口单元为源节点,向整个走廊网络注入等于全部走廊/开放房间单元数量的流量,每个走廊单元消耗恰好一个单位的流量。如果走廊不连通,流量守恒约束将被违反,模型自动排除此类解。流量只能在走廊或开放房间的相邻单元间传递,通过大M约束控制流的方向。
(3)房间可达性约束:每个房间必须至少存在一个"接入点"——即该房间中与走廊相邻且未被家具占据的单元。这确保了所有房间都可从走廊到达,避免出现不可进入的"死房间"。
(4)房间邻接约束:对于 LLM 指定需要邻接的房间对(如主卧与主卫),约束至少存在一个共享边界。
(5)房间包络框约束:使用 big-M 方法定义每个房间的轴对齐包络框(AABB),为后续的矩形性目标函数提供基础。
(6)家具约束:包括包含约束(家具必须在其所属房间内)、互斥约束(同一单元最多放一件家具)、形状和尺寸约束(家具面积等于其 AABB 尺寸乘积)。家具朝向由两个二值变量 \(\sigma_{k,l}\) 和 \(\mu_{k,l}\) 控制,限制为四个轴对齐方向。
目标函数体系¶
总目标函数为多个加权惩罚项的求和:\(E = \sum_s \omega_s \cdot E_s(\mathbf{x}, \mathbf{p}, \mathbf{f})\),分为三个层级:
几何质量目标: - 房间矩形性 \(E_{\text{rect}}\):惩罚每个房间包络框面积与实际占用单元数的差距,鼓励规则矩形房间 - 房间周长 \(E_{\text{perim}}\):惩罚暴露边界长度,鼓励紧凑房间形状
功能性目标: - 面积目标 \(E_{\text{area}}\):惩罚偏离 LLM 指定目标面积的程度 - 长宽比控制 \(E_{\text{aspect}}\):惩罚房间长宽差异过大
家具摆放目标: - 空间关系 \(E_{\text{rel}}\):家具间的相对位置约束(如床头柜在床旁边) - 分布均衡 \(E_{\text{bal}}\):家具质心与房间几何中心的距离
粗到精优化策略¶
联合优化问题的计算复杂度随网格分辨率呈指数增长。粗到精策略分三步:
- 粗阶段:将网格下采样(如 12×10 → 6×5),变量数减少 75%。仅优化房间布局,不考虑家具,快速探索高层空间组织。
- 粗到精映射:将粗解映射回精细网格,每个精细单元继承其对应粗单元的房间分配。
- 精阶段:在原始分辨率上执行完整优化(房间+家具)。粗解作为热启动初始化,同时增加一致性惩罚项 \(E_{\text{ref}}\) 鼓励精解保持与粗解一致的房间分配。
实验关键数据¶
表1:定量评估(物理合理性 + 视觉质量 + 文图对齐)¶
| 方法 | OOR↓ | OOB↓ | IQA↑ | IAA↑ | CLIP↑ |
|---|---|---|---|---|---|
| Holodeck | 0.82 | 2.33 | 4.03 | 3.32 | 25.15 |
| AnyHome | 0.00 | 0.04 | 4.10 | 3.32 | 25.75 |
| Co-Layout (Ours) | 0.00 | 0.00 | 4.17 | 3.35 | 26.50 |
Co-Layout 在所有指标上领先,尤其完全消除了物体重叠(OOR=0)和越界(OOB=0),体现了整数规划方法在几何正确性上的天然优势。
表2:用户研究(71人参与,64份有效问卷,5分制)¶
| 方法 | 语义对齐↑ | 布局合理性↑ | 路径清晰度↑ | MRR↑ |
|---|---|---|---|---|
| Holodeck | 3.43 | 3.12 | 3.06 | 0.59 |
| AnyHome | 3.07 | 2.59 | 2.80 | 0.45 |
| Co-Layout (Ours) | 3.77 | 3.23 | 3.41 | 0.80 |
用户研究进一步验证了 Co-Layout 在主观评价上的全面领先,MRR 达到 0.80,远高于 Holodeck(0.59)和 AnyHome(0.45),表明用户显著偏好联合优化的结果。
亮点与洞察¶
- LLM + IP 的分工协作范式非常优雅:LLM 擅长理解模糊的自然语言需求并转化为结构化约束,IP 擅长在约束下求解精确的几何方案。两者互补,避免了各自的短板。
- 流模型保证走廊连通性是关键技术贡献。以往工作较少显式建模走廊连通性,导致生成的户型图逻辑混乱。本文的流守恒约束直接从图论角度保证了连通性,比启发式后处理更可靠。
- 联合优化 vs 两阶段分离:实验清晰地展示了协同优化的价值——基线方法中卧室挡住客厅入口、房间完全不可达等问题在 Co-Layout 中完全消除。
- 粗到精策略是工程上的重要贡献。消融实验表明,随着网格分辨率增加,该策略的加速效果愈发显著,使得方法在普通笔记本电脑上即可运行。
局限性¶
- 家具范围有限:当前仅支持地面家具,不支持壁挂式物品(如壁灯、挂画)和台面物品(如台灯、摆件),这限制了生成场景的完整性。
- LLM 约束冲突:LLM 有时会生成相互矛盾的约束(如要求房间既小又塞大量家具),当前缺乏自动检测和修复机制,可能导致求解质量下降或无可行解。
- 仅限单层建筑:框架未考虑多层建筑的楼层间约束(如楼梯对齐、管道竖向贯通),无法直接应用于复杂的多层住宅或办公楼设计。
- 评测规模较小:定量实验仅在 5 个示例上对比,统计显著性不足;用户研究虽有 64 份有效问卷但场景也较有限。
- 门窗位置非优化变量:门窗位置通过后处理确定而非纳入联合优化,可能导致门窗位置不够理想。
相关工作与启发¶
- Holodeck (Yang et al., 2024) 和 AnyHome (Fu et al., 2024) 是重要的两阶段基线。它们虽然能生成丰富的房间和家具,但布局随机性强,缺乏对隐私、连通性和功能逻辑的深层理解。
- LayoutGPT (Feng et al., 2023) 和 I-Design (Çelen et al., 2024) 探索了 LLM 在家具布局中的应用,但仅限家具阶段,未触及房间规划。
- 网格表示可追溯到设施布局优化领域 (Drira et al., 2007),本文将其与建筑学的 Modulor 概念结合并引入 LLM 时代,是一次有价值的跨界融合。
- 该方法的范式"LLM 提取语义约束 + 优化求解器生成方案"具有通用性,可推广到城市规划、工厂布局、芯片版图设计等其他需要同时考虑高层语义和精确几何的组合优化问题。
评分¶
- 新颖性: ⭐⭐⭐⭐ — LLM+IP 联合框架和流模型连通性约束有明显创新
- 技术深度: ⭐⭐⭐⭐ — 约束建模和粗到精策略设计扎实
- 实验充分度: ⭐⭐⭐ — 对比实验仅 5 个样例,规模偏小
- 实用价值: ⭐⭐⭐⭐ — 面向实际室内设计场景,可在笔记本上运行
- 总体评分: ⭐⭐⭐⭐ (4/5)
相关论文¶
- [AAAI 2026] Cost-Minimized Label-Flipping Poisoning Attack to LLM Alignment
- [ACL 2025] ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting
- [ICLR 2026] Scaf-GRPO: Scaffolded Group Relative Policy Optimization for Enhancing LLM Reasoning
- [NeurIPS 2025] MeCeFO: Enhancing LLM Training Robustness via Fault-Tolerant Optimization
- [AAAI 2026] Bridging Synthetic and Real Routing Problems via LLM-Guided Instance Generation and Progressive Adaptation