BUPT Reasoning Lab 北京邮电大学推理实验室

专注于领域知识推理与多模态大语言模型研究
致力于推动大模型在金融、医疗、科研诚信、AI4Science等垂直领域的应用与发展

20+
顶级会议论文
3200+
Google Scholar 引用

金融推理研究

我们在金融推理领域的最新研究成果

ACL 2025

FinanceReasoning

Benchmarking Financial Numerical Reasoning More Credible, Comprehensive and Challenging

一个新颖的基准测试,用于评估大型推理模型(LRMs)在金融数值推理问题中的推理能力,具有增强的严谨性和开源函数库。

可信性 全面性 挑战性
ICCV 2025

FinMMR

Make Financial Numerical Reasoning More Multimodal, Comprehensive, and Challenging

一个新颖的双语多模态基准测试,涵盖14个子领域和多样化的图表类型,旨在推进MLLMs在真实世界金融推理场景中的能力。

多模态 双语 14子领域
AAAI 2026

FinMMDocR

Benchmarking Financial Multimodal Reasoning with Scenario Awareness, Document Understanding, and Multi-Step Computation

一个新颖的双语多模态基准测试,用于评估MLLMs在金融数值推理中的表现,具有场景感知、文档理解和多步计算的特点。

场景感知 文档理解 多步计算

知识推理研究

我们在知识推理与图推理领域的最新研究成果

ICML 2025

KBQA-o1

Agentic Knowledge Base Question Answering with Monte Carlo Tree Search

一种新颖的代理式知识库问答方法,利用蒙特卡洛树搜索(MCTS)进行逻辑形式生成和知识库环境探索。在有限标注数据的情况下,将Llama-3.1-8B模型的GrailQA F1性能提升至78.5%。

MCTS 知识库问答 低资源学习
NeurIPS 2025

HyperGraphRAG

Hypergraph-based Retrieval-Augmented Generation

基于超图的检索增强生成方法,通过超图结构建模复杂的关系网络,提升RAG系统在知识检索和生成任务中的性能,特别适用于需要处理多层次、多关系知识场景的应用。

超图 RAG 知识检索
Submitted to ICLR 2026

Graph-R1

Towards Agentic GraphRAG Framework via End-to-end Reinforcement Learning

一个通过端到端强化学习实现的代理型GraphRAG框架。该框架引入了轻量级的知识超图构建,将检索建模为多轮的代理-环境交互,并通过端到端的奖励机制优化代理过程。在推理准确性、检索效率和生成质量方面优于传统的GraphRAG方法。

GraphRAG 强化学习 端到端

团队成员

我们的研究团队

鄂海红

鄂海红

实验室负责人

北京邮电大学计算机学院(国家示范性软件学院)教授,专注于大数据、人工智能与推理技术研究

汤子辰

汤子辰

博士研究生

专注于领域知识推理与多模态大语言模型研究,已发表7篇顶级会议论文,Google Scholar引用220+

联系我们

欢迎学术合作与交流

邮箱

ehaihong@bupt.edu.cn

地址

北京市海淀区西土城路10号
北京邮电大学计算机学院(国家示范性软件学院)