🧊 3D 视觉¶

💬 ACL2025 · 共 1 篇

Slamming: Training a Speech Language Model on One GPU in a Day: 提出 Slam 训练配方，通过系统化的模型初始化、架构选择、合成数据、偏好优化等环节优化，在单张 A5000 GPU 上 24 小时内训练出性能媲美大规模 SLM 的语音语言模型。