💡 LLM 推理¶
📹 ICCV2025 · 共 1 篇
- Corvid: Improving Multimodal Large Language Models Towards Chain-of-Thought Reasoning
-
提出Corvid,通过混合视觉编码器+GateMixer连接器增强视觉表示、MCoT-Instruct-287K高质量CoT指令数据集+两阶段CoT训练增强推理能力、以及推理时自验证策略避免过度/不足推理,在数学推理和科学问题解决上超越同规模o1-like MLLM。