北大王选所王鹏帅团队在智能几何计算方向取得新进展
发布时间:2026-04-28
发布时间:2026-04-28
智能几何计算面向三维世界的表达、理解、生成与处理,是连接计算机图形学、计算机视觉和人工智能的重要前沿方向。随着具身智能、数字孪生、自动驾驶和三维内容创作快速发展,机器需要高效理解真实空间、生成高质量三维资产,并处理复杂曲面与工业几何模型。
三维几何数据天然稀疏、非规则,并具有多尺度结构和复杂拓扑关系,传统深度学习框架难以直接适配。该领域的核心挑战集中在三方面:建立兼顾效率、精度与统一性的三维表征体系;突破高质量三维数据稀缺带来的生成瓶颈;提升基础几何算法在非结构化点云和复杂工业模型上的效率与鲁棒性。

王鹏帅团队
围绕这些问题,王鹏帅研究团队形成了以八叉树稀疏表征为核心、贯通“高效表征、智能生成、几何处理”的研究布局。团队先后提出面向三维数据的卷积神经网络(SIGGRAPH 2017)、图神经网络(SIGGRAPH 2022)和自注意力机制(SIGGRAPH 2023),并进一步发展基于八叉树的扩散模型(SIGGRAPH 2023、SGP 2025)和自回归模型(SIGGRAPH 2025)。同时,团队将图神经网络引入测地线计算(SIGGRAPH Asia 2023)、拉普拉斯算子学习(SIGGRAPH Asia 2024)等基础几何问题,为非结构化点云与复杂曲面处理提供新的数据驱动范式。
基于上述研究,团队在 SIGGRAPH (Asia)、CVPR 等国际顶级会议和期刊发表高质量论文 30 余篇,其中 SIGGRAPH (Asia)/ACM TOG 论文达 14 篇。截至 2026 年 3 月,相关成果谷歌学术引用超过 4500 次,并被多位 ACM/IEEE Fellow 等国际知名学者正面评价和深入引用,在学术界与工业界产生了广泛影响。
凭借系列开创性工作,王鹏帅于 2023 年荣获亚洲图形学学会青年学者奖,2025 年获得 China3DV 优秀青年学者奖和 CCF CAD&CG 青年科技奖,2022 至 2025 年连续四年入选 AMiner AI 2000 全球最具影响力青年学者提名,并于 2025 年获得 CVMJ 最佳论文奖。
在成果转化方面,团队通过开源生态与校企合作,将八叉树三维学习框架、几何处理工具和三维生成方法推向实际应用。团队于 2023 年获“腾讯犀牛鸟研发奖”资助,并在 2024 年和 2025 年与华为、字节跳动、蚂蚁集团等签署合作协议,推动研究成果在三维理解、高保真场景建模和三维内容生成等场景中落地。
王鹏帅还长期参与三维视觉与图形学领域的学术生态建设,受邀担任《IEEE Transactions on Visualization and Computer Graphics》(CCF A 类)及《Computers & Graphics》编委,并连续担任 SIGGRAPH Asia、Eurographics、SGP 等国际会议程序委员会委员。
下文将围绕三条主线展开:面向点云和复杂三维数据的高效表征学习,面向高质量三维内容创作的智能生成模型,以及面向基础几何问题的数据驱动几何处理方法。
1. 基于注意力机制的三维表征学习
三维点云是机器理解真实世界的重要数据形式,广泛用于自动驾驶环境感知、工业机器人操作和数字孪生建模等场景。与图像不同,点云没有规则网格,空间分布稀疏且邻域关系不断变化。如何在保持几何细节的同时高效处理大规模点云,是三维智能感知走向真实应用的关键问题。
王鹏帅研究团队围绕这一瓶颈提出点云序列化思想,将非结构化点云组织为适合深度网络处理的结构化序列,在保留几何邻域信息的同时显著提升计算效率。相关成果以第一/通讯作者身份发表于 ACM TOG (SIGGRAPH)[4]、CVPR (Oral)[8] 及 CVMJ[9] 等领域顶尖期刊与会议,为构建高效点云基础模型提供了新的技术路径。
1.1 八叉树注意力机制

图 1:基于八叉树的注意力机制网络[4](SIGGRAPH 2023)
点云 Transformer 在精度上具有优势,但在迈向大规模场景时面临严峻的效率瓶颈。经典自注意力机制具有平方级复杂度,而点云的空间稀疏性又会降低 GPU 并行效率,形成效率与精度之间的根本矛盾。
针对这一困境,团队提出基于八叉树的注意力机制 OctFormer,将注意力计算复杂度降为线性。该方法利用八叉树对点云进行序列化组织,并让局部窗口内的点数保持稳定,从而改善显存访问连续性,获得超过 20 倍的加速效果。在此基础上,团队构建八叉树层间特征金字塔与可学习的跨尺度注意力机制,使模型既能捕捉局部几何细节,又能建立更大范围的语义联系。
凭借在计算效率与特征表达上的双重突破,OctFormer 在多项三维基准测试中表现优异,性能显著超越现有稀疏体素 CNN 与 Transformer 方案。相关成果以唯一作者论文发表于 SIGGRAPH 2023。该研究为工业级大规模点云处理提供了高性能基础架构,也为自动驾驶高精地图构建、大规模数字孪生建模等真实场景打开了新的应用空间。
1.2 序列化点云注意力机制

图 2 左图:Point Transformer V3[8],该方法能够在 20 余个数据集上取得最佳性能。
右图:Swin3D[9] 证实了在合成三维数据上进行预训练的研究范式。
在 OctFormer 奠定的序列化计算基础上,团队进一步推动点云感知架构的性能边界和预训练范式。团队参与研制的 Point Transformer V3(PTv3)引入多重空间填充曲线扩展序列化编码,并结合稀疏卷积几何特征提取器,缓解了传统架构中位置编码冗余、交互机制复杂等问题。PTv3 在室内外 20 余项主流任务中刷新纪录,相关成果发表于 CVPR 2024 并入选大会口头报告(Oral,录取率仅 0.78%),显示出该方向在通用三维感知中的广泛影响力。
针对三维数据获取难题,团队还提出 Swin3D 预训练架构,通过显存高效的自注意力机制与上下文信号编码,系统论证了“合成数据预训练+真实场景微调”的有效性。该模型在 ScanNet 等核心基准上显著超越现有方法,为三维大模型的表征学习提供了关键路径,也展现出良好的泛化与扩展能力。Swin3D 引起学术界广泛关注,相关论文获得 CVMJ 2025 最佳论文奖。
2. 智能三维生成
三维生成技术让机器能够从噪声、文本、草图等条件中生成具有真实几何结构的三维内容,是数字资产创作、虚拟现实、具身智能和数字孪生的重要底层能力。与二维图像生成相比,三维生成不仅要“看起来真实”,还要保证几何结构完整、表面连续、拓扑合理,并兼顾生成速度与计算成本。
围绕这些难点,王鹏帅研究团队将八叉树稀疏表征引入三维生成模型,探索扩散模型、自回归模型等生成范式在三维几何中的高效实现。相关研究既关注生成质量,也强调工程效率和可控性,为三维内容创作从“手工建模”走向“智能生成”提供了新的算法基础。
2.1 三维扩散模型

图3:基于八叉树的三维扩散模型[6,10](SIGGRAPH 2023,SGP 2025)。
该方法能生成高质量的三维形状,支持手绘草图作为条件的生成,以及三维纹理的生成。
针对三维生成中速度、质量与计算复杂度相互制约的问题,团队提出基于八叉树的三维扩散模型[6,10]。该研究分析了现有扩散模型在高维采样效率、隐式表示拓扑连续性和级联架构误差累积等方面的瓶颈,并利用八叉树稀疏表征显著降低计算开销。
在单张英伟达 4090 GPU 上,该方法可实现 2.5 秒级高保真几何生成,较主流方法提升两个数量级。实验结果表明,该方法在 ShapeNet 与 Objaverse 等国际公认数据集上达到领先性能,并可推广至文本驱动、草图交互、三维纹理生成等多种场景。相关成果显著降低了高质量三维内容生成的计算门槛,为工业建模软件、虚拟现实引擎和三维内容生产工具提供了重要技术支撑。
图4:三维自回归生成模型 OctGPT(SIGGRAPH 2025)[11]的生成结果
自回归模型在语言和图像领域已展现出强大的建模与推理能力,但在三维几何生成中仍面临序列过长、空间结构难以保持、显存开销高等问题。团队提出基于八叉树的多尺度自回归生成架构 OctGPT,将连续三维坐标预测转化为保留空间局部性的离散序列建模任务,并结合针对八叉树优化的 OctFormer,有效缓解长序列计算瓶颈。
这一架构显著提升了训练与生成效率,训练速度和生成速度分别提高 13 倍与 69 倍,并在消费级显存限制下实现 1024 分辨率的高分辨率三维模型生成。相关成果发表于 SIGGRAPH 2025。实验表明,OctGPT 在生成质量、多样性和多模态可控性方面均展现出领先优势,为三维生成提供了区别于扩散模型的新范式,也为未来构建统一的三维多模态大模型奠定了基础。

图5:左图:基于图神经网络的测地线预测(SIGGRAPH Asia 2023);
右图:基于图神经网络的点云拉普拉斯算子预测(SIGGRAPH Asia 2024)。
智能几何处理关注三维数据背后的基础几何运算,例如测地线距离、拉普拉斯算子、曲面重建和形状编辑等。这些问题看似底层,却直接影响 CAD/CAE 工业软件、数字孪生、机器人感知和三维内容生产的质量与效率。传统方法通常依赖规则网格或精确拓扑结构,面对扫描点云、缺陷模型和复杂工业数据时,往往难以兼顾效率、鲁棒性和适用范围。
王鹏帅研究团队将图神经网络引入基础几何算法,探索从“手工设计几何算子”到“数据驱动学习几何算子”的范式转变。团队针对测地线计算这一图形学核心问题,提出恒定时间复杂度的测地线查询范式,使计算效率较传统算法提升 2 至 3 个数量级,为工业软件中的实时几何交互提供关键支撑。团队还提出数据驱动的拉普拉斯算子,突破离散拉普拉斯算子对流形网格拓扑的严格依赖,使谱分析、热扩散等经典网格算法能够迁移到非结构化点云领域。
相关成果相继发表于 SIGGRAPH Asia 2023[5] 与 2024[7]。这些工作不仅推动了几何智能的学习范式变革,也从底层算法层面为构建自主可控的 CAD/CAE 几何引擎提供了理论和技术基础。
面向实际应用,团队进一步围绕三维几何处理中表征与效率的瓶颈,构建拓扑自适应图神经网络方法体系。相关成果已赋能“平行战场”超实时动力学仿真系统(军科委项目),并应用于腾讯、字节等企业的三维生成引擎,为复杂真实场景中的高效几何计算提供了支撑,也为我国自主可控 CAD/CAE 软件生态建设积累了关键算法基础。
王鹏帅研究团队的代表性研究工作
1. Peng-Shuai Wang, Yang Liu, Yu-Xiao Guo, Chun-Yu Sun, and Xin Tong. O-CNN: Octree-based Convolutional Neural Networks for 3D Shape Analysis. ACM Trans. Graph. (SIGGRAPH), 36(4), 2017.
2. Peng-Shuai Wang, Chun-Yu Sun, Yang Liu, and Xin Tong. Adaptive O-CNN: A patch-based deep representation of 3D shapes. ACM Trans. Graph. (SIGGRAPH Asia), 37(6), 2018.
3. Peng-Shuai Wang, Yang Liu, and Xin Tong. Dual Octree Graph Networks for Learning Adaptive Volumetric Shape Representations. ACM Trans. Graph. (SIGGRAPH), 41(4), 2022.
4. Peng-Shuai Wang. OctFormer: Octree-based Transformers for 3D Point Clouds. ACM Transactions on Graphics (SIGGRAPH), 42(4), 2023.
5. Bo Pang, Zhongtian Zheng, Guoping Wang, and Peng-Shuai Wang. Learning the Geodesic Embedding with Graph Neural Networks. ACM Transactions on Graphics (SIGGRAPH Asia), 42(6), 2023.
6. Xin-Yang Zheng, Hao Pan, Peng-Shuai Wang, Xin Tong, Yang Liu, and Heung-Yeung Shum. Locally Attentional SDF Diffusion for Controllable 3D Shape Generation. ACM Transactions on Graphics (SIGGRAPH), 42(4), 2023.
7. Bo Pang, Zhongtian Zheng, Yilong Li, Guoping Wang, and Peng-Shuai Wang. Neural Laplacian Operator for 3D Point Clouds. ACM Transactions on Graphics (SIGGRAPH Asia), 43(6), 2024.
8. Xiaoyang Wu, Li Jiang, Peng-Shuai Wang, Zhijian Liu, Xihui Liu, Yu Qiao, Wanli Ouyang, Tong He, and Hengshuang Zhao. Point Transformer V3: Simpler, Faster, Stronger. In CVPR (Oral), 2024.
9. Yu-Qi Yang, Yu-Xiao Guo, Jian-Yu Xiong, Yang Liu, Hao Pan, Peng-Shuai Wang, Xin Tong, and Baining Guo. Swin 3D: A Pretrained Transformer Backbone for 3D Indoor Scene Understanding. Computational Visual Media (CVMJ), 2024.
10. Bojun Xiong, Si-Tong Wei, Xin-Yang Zheng, Yan-Pei Cao, Zhouhui Lian, and Peng-Shuai Wang. OctFusion: Octree-based Diffusion Models for 3D Shape Generation. Computer Graphics Forum (SGP), 2025.
11. Si-Tong Wei, Rui-Huan Wang, Chuan-Zhi Zhou, Baoquan Chen, and Peng-Shuai Wang. ACM SIGGRAPH (Conference track), 2025.

王鹏帅,现任北京大学助理教授、博士生导师,入选北京大学博雅青年学者、北京市智源学者。研究方向为图形学、几何处理、三维深度学习。在学术会议SIGGRAPH(ASIA)、CVPR等上发表近30篇学术论文。担任著名图形学期刊IEEE TVCG,Computers & Graphics的编委、著名图形学国际会议SIGGRAPH Asia、Eurographics、SGP等的会议程序委员。2023年获得亚洲图形学学会(Asiagraphics) 青年学者奖,2025年获得中国三维视觉大会(China3DV)年度优秀青年学者奖、计算机辅助设计与图形学(CCF-CAD & CG)青年科技奖,2025年获得CVMJ 最佳论文奖。
上一篇:北京大学校友会王选计算机研究所分会 关于举办2026年“家•年华”校友返校接待日活动的通知 下一篇:2025年度王选杰出青年学者奖评选结果公布
