BUPT Reasoning Lab 北京邮电大学推理实验室

专注于领域知识推理与多模态大语言模型研究
致力于推动大模型在金融、医疗、科研诚信、AI4Science等垂直领域的应用与发展

20+

顶级会议论文

3200+

Google Scholar 引用

金融推理研究

我们在金融推理领域的最新研究成果

ACL 2025

FinanceReasoning

Benchmarking Financial Numerical Reasoning More Credible, Comprehensive and Challenging

一个新颖的基准测试，用于评估大型推理模型（LRMs）在金融数值推理问题中的推理能力，具有增强的严谨性和开源函数库。

可信性全面性挑战性

查看详情

ICCV 2025

FinMMR

Make Financial Numerical Reasoning More Multimodal, Comprehensive, and Challenging

一个新颖的双语多模态基准测试，涵盖14个子领域和多样化的图表类型，旨在推进MLLMs在真实世界金融推理场景中的能力。

多模态双语 14子领域

查看详情

AAAI 2026

FinMMDocR

Benchmarking Financial Multimodal Reasoning with Scenario Awareness, Document Understanding, and Multi-Step Computation

一个新颖的双语多模态基准测试，用于评估MLLMs在金融数值推理中的表现，具有场景感知、文档理解和多步计算的特点。

场景感知文档理解多步计算

查看详情

知识推理研究

我们在知识推理与图推理领域的最新研究成果

ICML 2025

KBQA-o1

Agentic Knowledge Base Question Answering with Monte Carlo Tree Search

一种新颖的代理式知识库问答方法，利用蒙特卡洛树搜索（MCTS）进行逻辑形式生成和知识库环境探索。在有限标注数据的情况下，将Llama-3.1-8B模型的GrailQA F1性能提升至78.5%。

MCTS 知识库问答低资源学习

查看代码

NeurIPS 2025

HyperGraphRAG

Hypergraph-based Retrieval-Augmented Generation

基于超图的检索增强生成方法，通过超图结构建模复杂的关系网络，提升RAG系统在知识检索和生成任务中的性能，特别适用于需要处理多层次、多关系知识场景的应用。

超图 RAG 知识检索

查看代码

Submitted to ICLR 2026

Graph-R1

Towards Agentic GraphRAG Framework via End-to-end Reinforcement Learning

一个通过端到端强化学习实现的代理型GraphRAG框架。该框架引入了轻量级的知识超图构建，将检索建模为多轮的代理-环境交互，并通过端到端的奖励机制优化代理过程。在推理准确性、检索效率和生成质量方面优于传统的GraphRAG方法。

GraphRAG 强化学习端到端

查看代码

团队成员

我们的研究团队

鄂海红

实验室负责人

北京邮电大学计算机学院（国家示范性软件学院）教授，专注于大数据、人工智能与推理技术研究

个人主页

汤子辰

博士研究生

专注于领域知识推理与多模态大语言模型研究，已发表7篇顶级会议论文，Google Scholar引用220+

个人主页 Google Scholar

联系我们

欢迎学术合作与交流

邮箱

ehaihong@bupt.edu.cn

地址

北京市海淀区西土城路10号
北京邮电大学计算机学院（国家示范性软件学院）

GitHub

BUPT-Reasoning-Lab