💡 LLM 推理¶

📹 ICCV2025 · 共 1 篇

Corvid: Improving Multimodal Large Language Models Towards Chain-of-Thought Reasoning: 提出Corvid，通过混合视觉编码器+GateMixer连接器增强视觉表示、MCoT-Instruct-287K高质量CoT指令数据集+两阶段CoT训练增强推理能力、以及推理时自验证策略避免过度/不足推理，在数学推理和科学问题解决上超越同规模o1-like MLLM。