Co-Layout: LLM-driven Co-optimization for Interior Layout¶

会议: AAAI 2026
arXiv: 2511.12474
代码: 无
项目主页: https://xccelephant.github.io/paper/co-layout/ 领域: 优化 / 室内设计
关键词: 室内布局, 整数规划, 大语言模型, 协同优化, 粗到精策略

一句话总结¶

提出 Co-Layout 框架，利用 LLM 从自然语言需求中提取结构化约束，再通过基于网格的整数规划（IP）联合优化房间布局与家具摆放，辅以粗到精求解策略提升效率，显著优于现有两阶段方案。

研究背景与动机¶

问题场景¶

室内设计是一项需要大量专业经验的任务：设计师要将客户模糊的需求转化为具体的房间规划和家具摆放方案，涉及大量设计变量和约束之间的权衡。开发自动化设计工具不仅能提升设计师工作效率，也能激发创作灵感。

现有方法的局限性¶

现有方法普遍将室内设计拆分为两个独立阶段：先生成房间布局（room layout），再在每个房间内摆放家具（furniture layout）。典型代表如 HouseGAN++、Holodeck 和 AnyHome。但在实际设计中，家具决定了房间功能，房间的大小和形状又反过来影响家具的尺寸和位置，两者天然耦合。分离式处理会导致诸多问题：

走廊不连通：家具堵塞通道，导致某些房间不可达
房间不可及：需要穿过卧室才能到达客厅等不合理路径
空间浪费：房间形状不规则或过于狭长，家具无法合理摆放

核心洞察¶

作者观察到 LLM 在理解高层设计需求方面表现出色，能将用户的自然语言描述翻译为房间和家具的详细列表及约束关系。但 LLM 的短板在于无法生成精确坐标——直接让 LLM 输出坐标会产生大量几何冲突（重叠、越界等）。因此本文的核心思路是：让 LLM 负责语义层面的约束提取，让整数规划负责满足这些约束的精确几何求解，实现"语义理解"与"精确优化"的分工协作。

方法详解¶

整体框架¶

Co-Layout 包含两个阶段：

LLM 预处理阶段：通过精心设计的 prompt，LLM 工作流接收用户的文字描述（如"设计一个 100m² 的两居室公寓，需要开放式厨房"），输出结构化的场景图（scene graph），包括房间列表 $R = \{r_k\}_{k=1}^{N}$、家具列表 $S = \{s_{k,l}\}$ 及各类约束（邻接、面积、相对位置等）。
整数规划优化阶段：将 LLM 生成的约束编码到一个基于网格的整数规划模型中，联合求解房间分区和家具位置。采用粗到精策略加速求解。

最终布局可导入 Blender 并结合 3D-FUTURE 和 Imaginarium 资产库渲染三维场景。

网格表示（Grid-based Representation）¶

受建筑学经典理论"Modulor"的启发，空间被离散化为二维网格 $\mathcal{G} = \{(i,j): 0 \leq i < W, 0 \leq j < L\}$。每个网格单元 $(i,j)$ 被赋予一组二值变量：

$x_{i,j}^k \in \{0,1\}$：该单元是否属于第 $k$ 个房间
$p_{i,j} \in \{0,1\}$：该单元是否属于走廊
$f_{i,j}^{k,l} \in \{0,1\}$：该单元是否被第 $k$ 个房间中第 $l$ 件家具占据

这种表示的优势在于：相比栅格化图像表示和向量化表示，网格方式能自然地建模走廊连通性、房间可达性等高层拓扑约束，同时与 Modulor 的模块化设计理念一致。

关键约束设计¶

（1）空间互斥约束：每个网格单元必须唯一地分配给某个房间或走廊，不允许重叠： $$p_{i,j} + \sum_{k=1}^{N} x_{i,j}^k = 1, \quad \forall (i,j) \in \mathcal{G}'$$

（2）走廊连通性约束：这是本文的核心技术贡献之一。作者使用流模型（flow-based formulation）来保证走廊和开放式房间（如部分客厅）形成一个完整的连通网络。具体做法是以入口单元为源节点，向整个走廊网络注入等于全部走廊/开放房间单元数量的流量，每个走廊单元消耗恰好一个单位的流量。如果走廊不连通，流量守恒约束将被违反，模型自动排除此类解。流量只能在走廊或开放房间的相邻单元间传递，通过大M约束控制流的方向。

（3）房间可达性约束：每个房间必须至少存在一个"接入点"——即该房间中与走廊相邻且未被家具占据的单元。这确保了所有房间都可从走廊到达，避免出现不可进入的"死房间"。

（4）房间邻接约束：对于 LLM 指定需要邻接的房间对（如主卧与主卫），约束至少存在一个共享边界。

（5）房间包络框约束：使用 big-M 方法定义每个房间的轴对齐包络框（AABB），为后续的矩形性目标函数提供基础。

（6）家具约束：包括包含约束（家具必须在其所属房间内）、互斥约束（同一单元最多放一件家具）、形状和尺寸约束（家具面积等于其 AABB 尺寸乘积）。家具朝向由两个二值变量 $\sigma_{k,l}$ 和 $\mu_{k,l}$ 控制，限制为四个轴对齐方向。

目标函数体系¶

总目标函数为多个加权惩罚项的求和：$E = \sum_s \omega_s \cdot E_s(\mathbf{x}, \mathbf{p}, \mathbf{f})$，分为三个层级：

几何质量目标： - 房间矩形性 $E_{\text{rect}}$：惩罚每个房间包络框面积与实际占用单元数的差距，鼓励规则矩形房间 - 房间周长 $E_{\text{perim}}$：惩罚暴露边界长度，鼓励紧凑房间形状

功能性目标： - 面积目标 $E_{\text{area}}$：惩罚偏离 LLM 指定目标面积的程度 - 长宽比控制 $E_{\text{aspect}}$：惩罚房间长宽差异过大

家具摆放目标： - 空间关系 $E_{\text{rel}}$：家具间的相对位置约束（如床头柜在床旁边） - 分布均衡 $E_{\text{bal}}$：家具质心与房间几何中心的距离

粗到精优化策略¶

联合优化问题的计算复杂度随网格分辨率呈指数增长。粗到精策略分三步：

粗阶段：将网格下采样（如 12×10 → 6×5），变量数减少 75%。仅优化房间布局，不考虑家具，快速探索高层空间组织。
粗到精映射：将粗解映射回精细网格，每个精细单元继承其对应粗单元的房间分配。
精阶段：在原始分辨率上执行完整优化（房间+家具）。粗解作为热启动初始化，同时增加一致性惩罚项 $E_{\text{ref}}$ 鼓励精解保持与粗解一致的房间分配。

实验关键数据¶

表1：定量评估（物理合理性 + 视觉质量 + 文图对齐）¶

方法	OOR↓	OOB↓	IQA↑	IAA↑	CLIP↑
Holodeck	0.82	2.33	4.03	3.32	25.15
AnyHome	0.00	0.04	4.10	3.32	25.75
Co-Layout (Ours)	0.00	0.00	4.17	3.35	26.50

Co-Layout 在所有指标上领先，尤其完全消除了物体重叠（OOR=0）和越界（OOB=0），体现了整数规划方法在几何正确性上的天然优势。

表2：用户研究（71人参与，64份有效问卷，5分制）¶

方法	语义对齐↑	布局合理性↑	路径清晰度↑	MRR↑
Holodeck	3.43	3.12	3.06	0.59
AnyHome	3.07	2.59	2.80	0.45
Co-Layout (Ours)	3.77	3.23	3.41	0.80

用户研究进一步验证了 Co-Layout 在主观评价上的全面领先，MRR 达到 0.80，远高于 Holodeck（0.59）和 AnyHome（0.45），表明用户显著偏好联合优化的结果。

亮点与洞察¶

LLM + IP 的分工协作范式非常优雅：LLM 擅长理解模糊的自然语言需求并转化为结构化约束，IP 擅长在约束下求解精确的几何方案。两者互补，避免了各自的短板。
流模型保证走廊连通性是关键技术贡献。以往工作较少显式建模走廊连通性，导致生成的户型图逻辑混乱。本文的流守恒约束直接从图论角度保证了连通性，比启发式后处理更可靠。
联合优化 vs 两阶段分离：实验清晰地展示了协同优化的价值——基线方法中卧室挡住客厅入口、房间完全不可达等问题在 Co-Layout 中完全消除。
粗到精策略是工程上的重要贡献。消融实验表明，随着网格分辨率增加，该策略的加速效果愈发显著，使得方法在普通笔记本电脑上即可运行。

局限性¶

家具范围有限：当前仅支持地面家具，不支持壁挂式物品（如壁灯、挂画）和台面物品（如台灯、摆件），这限制了生成场景的完整性。
LLM 约束冲突：LLM 有时会生成相互矛盾的约束（如要求房间既小又塞大量家具），当前缺乏自动检测和修复机制，可能导致求解质量下降或无可行解。
仅限单层建筑：框架未考虑多层建筑的楼层间约束（如楼梯对齐、管道竖向贯通），无法直接应用于复杂的多层住宅或办公楼设计。
评测规模较小：定量实验仅在 5 个示例上对比，统计显著性不足；用户研究虽有 64 份有效问卷但场景也较有限。
门窗位置非优化变量：门窗位置通过后处理确定而非纳入联合优化，可能导致门窗位置不够理想。

评分¶

新颖性: ⭐⭐⭐⭐ — LLM+IP 联合框架和流模型连通性约束有明显创新
技术深度: ⭐⭐⭐⭐ — 约束建模和粗到精策略设计扎实
实验充分度: ⭐⭐⭐ — 对比实验仅 5 个样例，规模偏小
实用价值: ⭐⭐⭐⭐ — 面向实际室内设计场景，可在笔记本上运行
总体评分: ⭐⭐⭐⭐ (4/5)