📡 信号/通信¶

🧠 NeurIPS2025 · 共 13 篇

Angular Steering: Behavior Control via Rotation in Activation Space: 提出 Angular Steering，将 LLM 激活引导统一建模为固定 2D 子空间中的旋转操作，提供连续、细粒度、范数保持的行为控制，统一了现有的激活加法和方向消融方法，在多个 LLM 家族（3B-14B）上实现鲁棒的行为控制。
Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond): 构建了 Infinity-Chat 数据集（26K 开放式真实用户查询 + 31,250 条人类标注），揭示了 LM 在开放式生成中的"Artificial Hivemind"效应——模型内重复和模型间同质化严重，并发现 Reward Model 和 LM Judge 在个体偏好差异大的样本上校准失败。
Bispectral OT: Dataset Comparison using Symmetry-Aware Optimal Transport: 提出 Bispectral Optimal Transport (BOT)，将离散最优传输中的代价矩阵从原始像素距离替换为 bispectrum（群 Fourier 不变量）距离，使得传输计划在保持信号结构的同时精确消除群作用（如旋转）带来的变异，在旋转变换的 MNIST 等数据集上将类别保持准确率从 33% 提升至 84%。
ConTextTab: A Semantics-Aware Tabular In-Context Learner: 提出 ConTextTab，将语义理解融入 table-native ICL 框架，用数据类型特定嵌入并在大规模真实世界表格数据上训练，在语义丰富的 CARTE benchmark 上设立新 SOTA。
Contrastive Consolidation of Top-Down Modulations Achieves Sparsely Supervised Continual Learning: 提出 Task-Modulated Contrastive Learning (TMCL)，受大脑新皮层自顶向下调制启发，在持续学习中通过 affine modulation 集成稀疏标签信息（仅需 1% 标签），再利用对比学习将调制信息固化到前馈权重中，在 class-incremental 和迁移学习上超越无监督和有监督基线。
Don't Let It Fade: Preserving Edits in Diffusion Language Models via Token Timestep Allocation: 提出 Token Timestep Allocation (TTA-Diffusion)，通过为每个 token 分配独立的去噪时间步来解决扩散语言模型中 classifier guidance 导致的 update-forgetting 问题，实现可控文本生成的稳定性和效率大幅提升。
Estimation of Stochastic Optimal Transport Maps: 提出随机最优传输映射的新评价指标 \(\mathcal{E}_p\)（优化间隙+可行性间隙），发展了高效估计器，达到近优有限样本风险界 \(\tilde{O}(n^{-1/(d+2p)})\)，且仅需最小假设，是首个通用的（可能随机的）OT 映射估计理论。
Feature-aware Modulation for Learning from Temporal Tabular Data: 提出特征感知时间调制机制，通过基于时间上下文的可学习 Yeo-Johnson 变换动态调整特征分布（均值、标准差、偏度），实现跨时间语义对齐。
Masked Symbol Modeling for Demodulation of Oversampled Baseband Communication Signals: 提出 Masked Symbol Modeling，将 BERT 的掩码预测范式应用于通信物理层，将脉冲成形引起的符号间贡献视为上下文信息，训练 Transformer 在干净信号上学习波形结构，推理时通过上下文恢复被冲激噪声破坏的符号。
Memory-Integrated Reconfigurable Adapters (MIRA): 提出 MIRA，将 Hopfield 联想记忆与 LoRA adapter 结合，在共享 backbone 的每个 ViT 层上存储 adapter 权重更新为 value、事后学习的 key 检索，统一处理域泛化、类增量学习和域增量学习，在多个设置下达到 SoTA。
Multi-Modal Masked Autoencoders for Galaxy Evolution and Cosmology: 将多模态掩码自编码器 (MMAE) 应用于星系图像和光谱的联合重建，构建了 134,533 个星系的图像+光谱数据集，实现了光谱和图像的交叉重建以及仅从图像的红移回归，\(\sigma_{\text{NMAD}} = 0.016\) 优于 AstroCLIP。
Perturbation Bounds for Low-Rank Inverse Approximations under Noise: 首次给出在加性噪声下低秩逆近似 \(\|(\tilde{A}^{-1})_p - A_p^{-1}\|\) 的非渐近谱范数扰动界，利用轮廓积分技术得到依赖特征间隙、谱衰减和噪声对齐的锐界，比经典全逆界改进高达 \(\sqrt{n}\) 倍。
The Surprising Effectiveness of Negative Reinforcement in LLM Reasoning: 揭示RLVR中负强化（仅惩罚错误）的効果超出预期，通过梯度分析说明其保持输出多样性和推理能力的机制，并提出改进的加权REINFORCE算法。