CSIAM GDC “智能 CAD 生成” 研讨会

会议介绍

近年来，3D AIGC 技术发展迅速。然而，要通过生成式 AI 方法来生成具有设计意图和语义信息、且符合工程要求的 CAD 模型仍然较为困难。CAD 模型的智能化生成与创新应用已成为学术界与产业界共同关注的焦点。

为推动该领域的发展，中国工业与应用数学学会（CSIAM）几何设计与计算专委会（GDC）将于2025年4月12日星期六在厦门大学思明校区举办“智能 CAD 生成”研讨会。研讨会将包括学术报告与圆桌论坛等内容，将邀请学术界和产业界的专家共同探讨 CAD 模型的 AI 生成的可行路径。

本次研讨会由厦门大学图形学实验室（https://graphics.xmu.edu.cn）曹娟、陈中贵教授负责组织，邀请了清华大学胡事民院士出席研讨会并致辞，GDC 专委主任、中国科学技术大学刘利刚教授出席研讨会并主持圆桌论坛，及 8 位学术界和产业界的专家进行学术报告。

时间：2025年4月12日星期六
地点：厦门大学思明校区科学艺术中心四号会议室（地图）

研讨会图片直播：https://graphics.xmu.edu.cn/GDC2025SymposiumXM/Gallery

厦门大学科学艺术中心

四号会议室

注册参会

本次会议免收注册费，为了方便会议组织及入校报备，请填写报名表（报名链接）。会议场地容量有限，按报名顺序先到先得。

由于需要提前进行入校报备，会议报名截止时间为4月10日（报名人数已满，感谢支持！）。第一次入校需要刷身份证，之后可以刷脸入校。

推荐住宿酒店：

（1）厦门大学国际学术交流中心（地图），位于校内，距会场300米，房源紧张；订房热线：0592-2182621，大床房400，双床房500，订房Code：GDC研讨会；

（2）鹭江佲家酒店（地图），距会场3千米；订房热线：18020722505 林经理，大床房400，双床房480，订房Code：GDC研讨会。

会议安排

时间	活动内容
9:00-9:15	开幕及致辞
9:15-9:30	合影
9:30-11:30	Session 1，主持人：陈中贵
时间	讲者	单位	题目
9:30-10:00	周向东	复旦大学	基于大语言模型的 CAD 参数模型生成
10:00-10:30	刘洋	微软亚洲研究院	CAD 重建与生成中的难点：结构、特征及硬约束
10:30-11:00	高盛华	香港大学	CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM
11:00-11:30	杜鹏	浙江大学	基于强化学习的 CAD 模型训练场
11:30-14:00	午餐
14:00-16:00	Session 2，主持人：曹娟
时间	讲者	单位	题目
14:00-14:30	潘浩	清华大学	可微分 CSG 与设计概念归纳
14:30-15:00	郭建伟	北京师范大学	序列化和结构化表征驱动的 CAD 智能建模
15:00-15:30	刘中远	腾讯	从慢思考到智能生成：CAD 大模型与设计需求空间的思考
15:30-16:00	陈发来	中国科学技术大学	DTGBrepGen: A Novel B-rep Generative Model through Decoupling Topology and Geometry
16:00-16:15	茶歇
16:15-17:30	圆桌讨论，主持人：刘利刚嘉宾：全体参会嘉宾
17:30-17:40	总结及闭幕

特邀嘉宾

胡事民院士

清华大学

刘利刚 GDC专委主任

中国科学技术大学

讲者报告

题目: 基于大语言模型的 CAD 参数模型生成

讲者: 周向东, 复旦大学

摘要:

个人简介: 周向东、复旦大学计算机科学技术学院教授，博士生导师。数据库与海量信息处理实验室主任，中国图学会专委会委员，上海市计算机学会专委会委员。科技部、教育部、上海市科委专家。长期担任计算机领域多个重要国际学术会议程序委员会委员。主要从事大数据与人工智能等领域的理论与应用研究。在海量数据管理、计算机视觉，工程数据管理（BIM/CAD 与数字孪生）等领域获得良好的研究成果。已发表学术论文 100 余篇、专著 1 部。先后承担多项国家自然科学基金，国家重点研发课题等国家、省部级项目，及国内大型知名企业的各类科技合作项目二十余项。获得教育部自然科学二等奖、上海市科技进步二等奖、华为优秀技术成果奖、国家电网科技奖等。

主页: https://faculty.fudan.edu.cn/ZhouXiangdong/zh_CN/

E-mail: xdzhou@fudan.edu.cn

题目: CAD 重建与生成中的难点：结构、特征及硬约束

讲者: 刘洋, 微软亚洲研究院

摘要:

个人简介: 微软亚洲研究院空间智能组首席研究员。2000 年和 2003 年于中国科学技术大学获得（计算数学）理学学士及硕士学位。2008年于香港大学获得（计算机科学）理学博士学位。2008 年至 2010 年于法国 INRIA/LORIA 研究所从事博士后研究。2010 年至今工作于微软亚洲研究院。现任 IEEE CG&A 编委、AsiaGraphics 执委、SMI 指导委员会委员，曾任ACM TOG 和 IEEE TVCG编委, GMP2019 和 SMI2021 程序委员会主席、 GMP2025 和 SMI2022 大会主席、 CAGD，C&G, IEEE multimedia 客座编委。研究兴趣包括几何计算与处理、网格生成、三维理解与生成等。

主页: https://xueyuhanlang.github.io/

E-mail: yangliu@microsoft.com

题目: CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM

讲者: 高盛华, 香港大学

摘要: We introduce the CAD-MLLM, the first system capable of generating parametric CAD models conditioned on the multimodal input. Specifically, within the CAD-MLLM framework, we leverage the command sequences of CAD models and then employ advanced large language models (LLMs) to align the feature space across these diverse multi-modalities data and CAD models' vectorized representations. To facilitate the model training, we design a comprehensive data construction and annotation pipeline that equips each CAD model with corresponding multimodal data. Our resulting dataset, named Omni-CAD, is the first multimodal CAD dataset that contains textual description, multi-view images, points, and command sequence for each CAD model. It contains approximately 450K instances and their CAD construction sequences. To thoroughly evaluate the quality of our generated CAD models, we go beyond current evaluation metrics that focus on reconstruction quality by introducing additional metrics that assess topology quality and surface enclosure extent. Extensive experimental results demonstrate that CAD-MLLM significantly outperforms existing conditional generative methods and remains highly robust to noises and missing points.

个人简介: Shenghua Gao is an Associate Professor in the Department of Computer Science at the University of Hong Kong. Prior to joining HKU, he was a professor at ShanghaiTech University. His research interests include 3D reconstruction, image and video understanding and generation, 3D generation, AI4Science, etc. He has served as an area chair for over ten top conferences (CVPR, NeurIPS, ICCV, ACM MM, ECCV, etc.), and a publicity Chair for CVPR 2024. He also served as an associate editor for IEEE TPAMI, TMM, TCSVT, etc.

主页: https://www.cs.hku.hk/people/academic-staff/gaosh

E-mail: gaosh@hku.hk

题目: 基于强化学习的 CAD 模型训练场

讲者: 杜鹏, 浙江大学

摘要: 强化学习在足式机器人运动控制仿真学习中得到广泛应用，它在物理仿真和神经网络之间搭建了一个桥梁，解决了生成模型中单纯依赖数据驱动导致的生成结果缺乏合理性判断的问题。受此启发，我们提出基于 CAD 几何引擎构建强化学习训练场。对于输入的目标几何体，策略网络会生成操作指令序列，在训练场中生成对应的 CAD 几何体后反馈至策略网络。系统通过计算生成几何体与目标几何体在训练场中的差异来生成奖励，进而更新网络参数。通过该训练场，我们在从 B-Rep 几何体生成命令序列的任务中实现了当前最优的质量表现。

个人简介: 杜鹏，浙江大学 CAD&CG 全国重点实验室研究员，2013年博士毕业于浙江大学，曾担任华为昇腾 CANN 生态首席专家，在 KAIST、NTU、杭州电子科技大学从事教学科研工作，在 CVPR 等国际学术会议发表论文十余篇，授权发明专利 9 项，出版《昇腾AI处理器 CANN 架构与编程》、《昇腾 AI 处理器 CANN 应用与实战》、《昇腾算子编程指南》等著作，获得 2021 年度浙江省科技进步一等奖和 2022 年度上海市技术发明一等奖，成果被中央电视台《创新进行时》、江苏卫视《新闻眼》等节目专题报道。

E-mail: dp@zju.edu.cn

题目: 可微分 CSG 与设计概念归纳

讲者: 潘浩, 清华大学

摘要: 围绕智能 CAD 建模的基础，本报告讨论两个具体问题：第一个问题是 CSG 的可微分计算，第二个问题是 CAD 草图中的设计概念归纳学习。构造实体几何（CSG）是 CAD 中的基础运算，其可微分化对于 CAD 系统的智能化具有重要意义。我们通过渲染方法实现 CSG 运算，并通过可微分渲染实现 CSG 运算的可微分化。CAD 草图是结构化的几何设计，从中提取结构化的设计模块，对于智能辅助设计有意义。我们通过将 CAD 草图转换为声明式域定义语言（declarative domain specific language），并设计神经网络和自监督方法，从数据中自动提取草图中的模块化子函数，为草图理解、补全、重建等任务提供支撑。

个人简介: 潘浩，清华大学软件学院助理教授，前微软亚洲研究院空间智能组研究员。研究方向为几何建模和处理、三维视觉和几何深度学习。在 ACM TOG、IEEE CVPR、NeurIPS 等计算机图形学、视觉和机器学习领域顶级期刊和会议发表论文 30 余篇。

主页: https://haopan.github.io/

E-mail: haopan@tsinghua.edu.cn

题目: 序列化和结构化表征驱动的 CAD 智能建模

讲者: 郭建伟, 北京师范大学

摘要: 计算机辅助设计（CAD）在现代工业设计和加工制造中扮演着至关重要的角色。报告将介绍本团队近期在CAD模型智能建模方面的研究成果，首先从现代 CAD 软件常用的序列化建模语言中汲取灵感，从整体三维形状中学习 CAD 基元的隐式二维草图和拉伸参数，通过拉伸和布尔运算逼近目标几何形状；进一步对该技术进行扩展，支持扫掠、放样和旋转等操作，无监督地学习一种草图+路径参数化表示方法，实现了形状细节与结构之间的解耦。针对 CAD 生成，探索了基于光栅化草图-拉伸的 CAD 智能生成、基于层次化结构表征的边界表示（B-Rep）CAD 生成方法，不仅增强了模型的可解释性，还提高了输出结果的可编辑性，使用户能够方便地编辑形状的几何和结构特征。

个人简介: 郭建伟，北京师范大学人工智能学院教授。2016 年博士毕业于中国科学院自动化研究所，主要研究方向为计算机图形学与数字几何处理。已在 ACM SIGGRAPH/TOG、IEEE TPAMI、IEEE TVCG、CVPR 等高水平期刊或会议发表论文 80 余篇，授权发明专利 17 项。主持多项国家自然科学基金项目及省部级科研课题，作为核心骨干参与国自然重点项目、科技部重点研发计划，主持企业委托项目 9 项。曾荣获 10 项学术奖励，包括入选中科院青促会会员、中国体视学学会青年科学技术奖、中国仿真学会优秀博士论文奖、CVMJ 期刊年度最佳论文奖、中国图学学会科技进步二等奖等。担任国际权威 SCI 期刊 The Visual Computer、IET Image Processing 编委及 VCIBA 期刊青年编委。

主页: https://jianweiguo.net/

E-mail: jianwei.guo@bnu.edu.cn

题目: 从慢思考到智能生成：CAD 大模型与设计需求空间的思考

讲者: 刘中远, 腾讯

摘要: CAD 图纸与模型不仅是物理实现与制造过程的抽象表达，更是对需求、情境及历史设计经验的凝练总结。本报告通过探讨设计师“慢思考”（深度认知、反复推敲）的创作过程，分析了深层需求与经典设计范例如何成为训练 CAD 智能生成大模型的重要养分。我们结合多模态大模型与多智能体自主协作系统的构建经验，启发式地探讨了需求感知与范例启发在智能设计生成中的价值和实现途径，分享了在技术与人文、智能与设计交汇点所面对的挑战与思考，促进对 CAD 智能生成及相关智能工具开发的进一步理解和探索。

个人简介: 刘中远，室内建筑师、景观设计师、数字装置艺术家、游戏关卡设计师，AI 游戏技术策划，曾任腾讯游戏前沿技术中心 AI 场景摆放项目负责人，现为腾讯光子工作室AI高级研究员。本硕毕业于鲁迅美术学院建筑艺术学院，2022 年博士毕业于中国科学技术大学数学科学学院计算数学系，导师刘利刚。学术研究领域为计算机图形学、计算几何、智能制造、强化学习、多模态大模型、多智能体自主协作系统等。在 SIGGRAPH、SIGGRAPH Asia、IEEE TVCG、Pacific Graphics、SPM 等国际顶级会议和期刊上发表多篇论文，致力于将艺术/设计需求转化为算法、代码、AI 生产管线，实现艺术设计生产的自动化。曾参与/主持了数字雕塑、装置艺术、建筑设计、会展设计、智能制造等项目，作品入选全国美展，数字雕塑获吉尼斯世界纪录认证，建筑立面获 2018 米兰 A' 设计大奖赛金奖及 2018 Architizer A+ 大奖设计与技术类别评审团精选奖。目前主要专注于多模态大模型智能体群的游戏场景自动设计/生成/交互研究，以及相关游戏产品的落地实践。希望通过技术创新，推动数字艺术与智能技术的融合，为具身智能、虚拟世界打造可用高质量艺术场景。

主页: https://digiartomnis.github.io/

E-mail: lockliu@tencent.com

题目: DTGBrepGen: A Novel B-rep Generative Model through Decoupling Topology and Geometry

讲者: 陈发来, 中国科学技术大学

摘要: We introduce DTGBrepGen--a novel framework for automatically generating valid and high-quality Boundary Representation (B-rep) models, addressing the challenges posed by the complex interdependence between topology and geometry in CAD models. Unlike existing methods that prioritize geometric representation while neglecting topological constraints, DTGBrepGen explicitly models both aspects through a two-phase topology generation process followed by a Transformer-based diffusion model for geometry generation. Extensive experiments on diverse CAD datasets show that DTGBrepGen significantly outperforms existing methods in both topological validity and geometric accuracy, achieving higher validity rates and producing more diverse and realistic B-reps.

个人简介: 陈发来现为中国科学技术大学数学院教授、博士生导师，曾担任中国工业应用数学学会常务理事（2004-2016），中国工业应用数学学会几何设计与计算专委会主任（2015-2019），中国计算数学学会常务理事（2004—2012），安徽省数学会秘书长（2003-2019），安徽省工业与应用数学学会理事长（2023-）, 国务院学位委员会数学学科评审组成员（2009-2019），教育部高等学校数学与统计学教学指导委员会委员（2006-2022），第十二、十三届国家自然科学基金委员会数学学科评委，《Computer Aided Geometric Design》，《CSIAM Transactions on Applied Mathematics》，《Journal of Computational Mathematics》，《计算机辅助设计与图形学学报》等期刊编委。曾于 1997年，2001年，2022 年三次获国家级教学成果二等奖。2001 年获教育部高校青年教师奖，2002年获国家自然科学基金杰出青年基金，2003 年获宝钢优秀教师奖特等奖，2008 年获中国计算机图形学杰出奖，2009 年获冯康科学计算奖，2010 年获全国百篇优博论文指导教师奖，2024 年获国际几何设计领域最高奖 John A. Gregory 纪念奖。研究方向为计算机辅助几何设计与计算机图形学。近来感兴趣的研究课题包括：曲面隐式化的动曲面方法，T网格上的样条曲面，基于隐式曲面的三维散乱数据点重构、等几何分析及其在拓扑优化中的应用、基于稀疏优化的几何处理等。

主页: http://staff.ustc.edu.cn/~chenfl/

E-mail: chenfl@ustc.edu.cn

组织机构

主办单位：中国工业与应用数学学会
承办单位：几何设计与计算（GDC）专委会

厦门大学信息学院

厦门大学数学科学学院
协办单位：福建省计算机学会学术工作委员会

厦门市计算机学会
赞助企业：广州中望龙腾软件股份有限公司