🧊 3D 视觉¶
💬 ACL2025 · 共 1 篇
- Slamming: Training a Speech Language Model on One GPU in a Day
-
提出 Slam 训练配方,通过系统化的模型初始化、架构选择、合成数据、偏好优化等环节优化,在单张 A5000 GPU 上 24 小时内训练出性能媲美大规模 SLM 的语音语言模型。
💬 ACL2025 · 共 1 篇
提出 Slam 训练配方,通过系统化的模型初始化、架构选择、合成数据、偏好优化等环节优化,在单张 A5000 GPU 上 24 小时内训练出性能媲美大规模 SLM 的语音语言模型。