王选所师生参加AAAI 2026会议

王选所师生参加AAAI 2026会议
发布时间：2026-02-05

第40届AAAI 会议（The 40th Annual AAAI Conference on Artificial Intelligence）于2026年1月20日至27日在新加坡博览中心举办。该会议是人工智能领域最具影响力的国际学术会议之一，涵盖机器学习、自然语言处理、知识表示与推理、计算机视觉等多个前沿方向，每年吸引来自全球高校和科研机构的专家学者与产业界研究人员交流最新研究成果。大会包括技术论文报告、特邀报告、专题研讨、海报展示等多种形式的学术活动，吸引全球科研人员、行业专家和学生参与，为最新人工智能理论与应用成果提供了重要展示与交流平台。

王选所网络信息研究室、IGCL实验室、信息安全实验室师生参加了本次会议，与国际同行开展了深入的学术交流。

ca08bd684d2fef191e606cb4aedd9916

/Users/liux/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260204153913/output_1.jpgoutput_1

与会师生在AAAI 2026现场合影

[1] 王选所博士后岳潭以第一作者的身份发表1篇论文：

Tan Yue, Qiong Wu, Dongyan Zhao. MARS: Multimodal Adaptive Reasoning Model for Avoiding Overthinking. AAAI 2026 Main Technical Track.

多模态大语言模型（MLLMs）在视觉—语言任务中已展现出较为突出的性能，但现有多模态推理模型普遍存在推理步骤冗余的问题，导致计算开销大、推理效率低。为此，本文提出了一种多模态自适应推理模型（MARS），能够根据问题难度动态调整推理策略。具体而言，MARS 基于构建的训练数据集 MART，采用三阶段训练框架：首先通过推理链掩码学习（CoT Masking Learning）预测被掩盖的推理步骤，以增强推理的逻辑性；其次通过自适应推理指令学习（Adaptive Reasoning Instruction Learning），引导模型根据任务难度选择性跳过或保留推理步骤；最后结合信息瓶颈原理的 GRPO 算法，引入轻量化推理链强化学习（CoT Lightweight Reinforcement Learning），在保持模型性能与泛化能力的同时有效缩短推理链长度。实验结果表明，MARS 在域内与域外数据集上均取得显著效果，在准确率提升 0.54% 的同时，将推理链长度平均减少 90.2%，整体性能优于现有主流开源及商用多模态大语言模型。

[2] 王选所实习生李佳一以共同第一作者身份发表1篇论文：

Jiayi Li, Xiao Liu, Yansong Feng. From Single to Societal: Analyzing Persona-Induced Bias in Multi-Agent Interactions. AAAI 2026 Main Technical Track.

多智能体系统目前在模拟人类行为、提高推理能力等方面有着诸多应用，在这些应用中每个智能体通常会被分配特定的角色（Persona），过去研究表明在单个智能体中分配的角色可能带来偏见，基于此我们提出了新的问题：角色带来的偏见在多智能体交互过程中是否存在？为回答这一问题，我们设计了一系列的实验，检测多智能体系统（Multi-Agent System，MAS）中，智能体的种族、性别如何影响智能体的受信任程度和固执程度，以及如何进一步影响交互结果。最终我们发现智能体的交互行为会受到所分配角色的影响，这种偏见显著存在于诸多模型和交互场景中，同时传统优势群体在多智能体交互中表现出更不受信任和更不固执。这一发现揭示了多智能体系统中的社会偏见，也为构建更公平、可信赖的多智能体系统设计提供了重要启示。

WechatIMG707

刘旭、刘昱两位同学进行论文Poster展示

[3] 王选所研究生刘旭和本科生刘昱以共同第一作者身份发表1篇论文：

Xu Liu, Yu Liu, Yansong Feng. IndoorUAV: Benchmarking Vision-Language UAV Navigation in Continuous Indoor Environments.

该论文由连宙辉副教授作为论文通讯作者，合作作者包括邱晗硕（国防科技大学）、杨其融（北京大学）。该论文提出了一个新的室内无人机视觉语言导航（VLN）测试基准，旨在推动室内环境中基于语言指令的智能无人机导航研究。该研究不仅涵盖了长时间跨度的导航任务，还针对短时规划进行了细粒度的控制。通过构建丰富的3D室内场景及相应的任务数据集，IndoorUAV为室内无人机导航提供了一个新的统一测试平台。此外该论文提出IndoorUAV-Agent模型，一个专为室内无人机视觉语言导航设计的导航模型。IndoorUAV-Agent采用了任务分解和多模态推理的策略，能够将复杂的长时导航任务分解成多个子任务，并逐步执行每个子任务。这种设计使得模型能够有效处理多步骤的复杂指令，并且在执行过程中保持较高的精度。通过结合大规模语言模型（如GPT-4o）和低级别飞行控制模型（如π0），IndoorUAV-Agent展现了在不同导航任务和环境中的强适应性。

王元达1.jpg

王元达2.jpg

[4] 王选所研究生王元达以第一作者身份发表1篇论文：

Yuanda Wang, Ji Zhou, Xinhui Han, Chao Zhang; BDLF-Qwen3: Enhanced Cross-Architecture Binary Function Similarity Detection Through Binary Dynamic Layer Fusion.

在现代网络安全领域，跨架构二进制代码分析对于恶意软件检测、漏洞发现等任务至关重要。然而，面对x86、ARM、MIPS等不同指令集架构（ISA）之间巨大的指令差异，现有的跨架构二进制函数相似性检测方法面临严峻挑战。传统方法难以捕捉代码不同抽象层次之间的动态语义关系，且往往缺乏高质量的跨架构数据集进行有效评估。针对上述问题，论文提出了一种名为BDLF-Qwen3的新型框架。受到人类在分析代码时动态整合多层次信息的认知过程启发，该研究提出了“二进制动态层融合”（Binary Dynamic Layer Fusion, BDLF）机制。BDLF-Qwen3利用Qwen3大模型的多语言代码理解能力，通过自适应的权重生成机制，动态地融合Transformer所有层级的特征表示，从而优化结合了从浅层语法模式到深层语义抽象的各类信息。本工作还构建了Cross-Bin数据集，这是一个包含六大主流指令集架构、54.7万个函数的高质量跨架构二进制函数数据集，利用Ghidra和DeepSeek-V3实现了高质量的语义标注。实验结果表明，BDLF-Qwen3采用了包含成对相似性学习和InfoNCE对比学习的两阶段训练策略，在跨CPU架构的相似性检测任务中显著优于现有最先进方法（SOTA），在Recall@10指标上提升了36-65% ，并在未见过的RISC-V架构上展现了强大的零样本泛化能力。

通过参加本次AAAI会议，王选所师生与来自世界各地的学者和行业专家进行了深入的学术交流，了解了具身智能及相关领域的最新研究动态与发展趋势，为后续的科研工作积累了宝贵的经验与思路。

王选所师生参加AAAI 2026会议 发布时间：2026-02-05

王选所师生参加AAAI 2026会议
发布时间：2026-02-05