专注于领域知识推理与多模态大语言模型研究
致力于推动大模型在金融、医疗、科研诚信、AI4Science等垂直领域的应用与发展
我们在金融推理领域的最新研究成果
Benchmarking Financial Numerical Reasoning More Credible, Comprehensive and Challenging
一个新颖的基准测试,用于评估大型推理模型(LRMs)在金融数值推理问题中的推理能力,具有增强的严谨性和开源函数库。
Make Financial Numerical Reasoning More Multimodal, Comprehensive, and Challenging
一个新颖的双语多模态基准测试,涵盖14个子领域和多样化的图表类型,旨在推进MLLMs在真实世界金融推理场景中的能力。
Benchmarking Financial Multimodal Reasoning with Scenario Awareness, Document Understanding, and Multi-Step Computation
一个新颖的双语多模态基准测试,用于评估MLLMs在金融数值推理中的表现,具有场景感知、文档理解和多步计算的特点。
我们在知识推理与图推理领域的最新研究成果
Agentic Knowledge Base Question Answering with Monte Carlo Tree Search
一种新颖的代理式知识库问答方法,利用蒙特卡洛树搜索(MCTS)进行逻辑形式生成和知识库环境探索。在有限标注数据的情况下,将Llama-3.1-8B模型的GrailQA F1性能提升至78.5%。
Hypergraph-based Retrieval-Augmented Generation
基于超图的检索增强生成方法,通过超图结构建模复杂的关系网络,提升RAG系统在知识检索和生成任务中的性能,特别适用于需要处理多层次、多关系知识场景的应用。
Towards Agentic GraphRAG Framework via End-to-end Reinforcement Learning
一个通过端到端强化学习实现的代理型GraphRAG框架。该框架引入了轻量级的知识超图构建,将检索建模为多轮的代理-环境交互,并通过端到端的奖励机制优化代理过程。在推理准确性、检索效率和生成质量方面优于传统的GraphRAG方法。
我们的研究团队
欢迎学术合作与交流