跳转至

🕸️ 图学习

📹 ICCV2025 · 2 篇论文解读

PASTA: Part-Aware Sketch-to-3D Shape Generation with Text-Aligned Prior

提出PASTA框架,通过VLM文本先验补充草图缺失的语义信息,并用ISG-Net(IndivGCN+PartGCN)建模部件间关系,实现了草图到3D形状生成的SOTA性能,支持部件级编辑。

Taming the Untamed: Graph-Based Knowledge Retrieval and Reasoning for MLLMs to Conquer the Unknown

以《怪物猎人:世界》为测试平台,构建了包含文本、图像、视频和复杂实体关系的多模态知识图谱(MH-MMKG),设计了238个复杂查询和多智能体知识检索方法,揭示了当前MLLM在领域特定任务中的知识检索与推理能力不足。