第23期CSIG图像图形学科前沿讲习班成功举办

发布日期:2023-06-02    浏览次数:

2023年5月27-28日,由中国图象图形学学会(CSIG)主办、北京工业大学信息学部、 北京人工智能研究院、中国图象图形学学会机器视觉专业委员会承办的第 23 期 CSIG 图像 图形学科前沿讲习班(IGAL23)在北京工业大学圆满闭幕。本期讲习班主题为“2020s 深度学习技术”,由北京工业大学贾熹滨教授和马伟副教授担任学术主任,来自全国各地的专家 和学者齐聚一堂,会场气氛活跃。

图1:讲习班现场

 在5月27日上午举行的开班仪式上,贾熹滨教授主持,中国图象图形学学会理事、副秘书长彭宇新教授代表学会致辞,北京工业大学信息学部副主任杨震教授和北京人工智能研 究院院长尹宝才教授分别进行了欢迎致辞和开班致辞。

图2:开班仪式 

27日贾熹滨教授主持。北京大学王选计算机研究所彭宇新教授带来题为“细粒度多模态协同感知、认知与生成”的报告。本报告从细粒度辨识增强、多模态关联、多模态协同、 跨模态生成四个方面介绍彭宇新教授团队在细粒度图像分类、细粒度跨模态检索等方面的最 新研究进展,并进行了相关系统展示。浙江大学计算机科学与技术学院李玺教授围绕“视觉 结构建模和特征学习”进行分享,主要围绕数据驱动的人工智能学习方法,从目标视觉感知 特性、视觉特征表达等多维度视角进行了深入剖析,并引入了大规模视觉特征学习所涉及的 主要研究问题和技术方法。然后介绍了近年来利用视觉特征学习进行视觉语义分析和理解所 做的一系列代表性的研究工作及其实际应用。 27 日下午毋立芳教授主持,北京大学人工智能研究院查红彬教授进行了主题为“动态 视觉与 SLAM:在线学习方法”的报告。该报告围绕基于在线学习的 SLAM 问题,介绍了 其团队面向自监督视觉里程计的序列对抗学习方法和具有在线自适应能力的自监督 SLAM 学习工作及自监督学习面临的相关问题。接下来,北京航空航天大学王啸副教授介绍了“图 神经网络的‘共性’与‘个性’”。围绕“如何研究神经网络架构的内在统一性并指导图神 经网络的设计”以及“图神经网络的个性特点”这两个问题,对两类典型的图神经网络展开 了初步思考,梳理不同架构或操作之间的联系,为审视与改进现有图神经网络带来新的视角。

图3:彭宇新、李玺教授作报告

图4:查红彬教授、王啸副教授作报告

28日上午,贾熹滨教授主持,北京工业大学胡永利教授进行主题为“从多源/多视数据 表征到跨媒体智能”的报告。在回顾现有多源异构数据融合分析研究工作的基础上,介绍团 队在图像视频等高维数据的非线性表征、多源/多视数据的乘积流形融合表示、跨时空数据 关联建模等多源/多视数据表征方面的研究进展。随后,胡永利教授主持,由中国人民大学 高瓴人工智能学院卢志武教授带来了“ChatGPT 对多模态通用生成模型的重要启发”的报告。 卢志武教授首先讲述了 ChatGPT 带来的研究范式革新和多模态通用生成模型的最新进展, 介绍了其团队在多模态通用模型上的成功实践,最后总结了其团队在多模态通用生成模型上 遇到的挑战与机遇并对其未来发展进行了展望。接下来,华为云研究员常建龙带来主题为“视 觉微调概述和前沿探索”的报告,总结了当前视觉大模型的微调技术,可通过仅仅更新少量 模型参数实现比全量微调更优越的性能。此外,报告对视觉大模型的预训练、微调范式、人 机交互、优化等未来发展方向做出了详细的分析和讨论。 28 日下午,马伟副教授主持,微软亚洲研究院主管研究员王春雨带来了主题为“人体 姿态估计”的报告。在回顾现有人体姿态估计算法的基础上,介绍团队在人体姿态表达、模 型设计等方面的最新进展,以及这些方法在处理严重遮挡时取得的新的突破。最后一场报告 是由中科院自动化所副研究员黄岩带来的“图文匹配研究进展”。图文匹配与传统跨模态检 索的主要区别之一在于其弱监督的数据标注。报告首先梳理该任务的相关代表性方法,然后 总结目前的主要技术难题,并探讨相应的解决思路和未来研究方向。

图5:胡永利、卢志武教授,常建龙研究员作报告

图6:王春雨研究员、黄岩副研究员作报告

最后,马伟副教授主持了结营仪式,再次向各位报告嘉宾及参会学者表示感谢,向学员 颁发了证书,并宣布第 23 期 CSIG 图像图形学科前沿讲习班圆满完成。

图7:马伟副教授主持结营仪式

第 23 期“2020s 深度学习技术”前沿讲习班得到各位报告嘉宾、学者以及学会各级领导的 大力支持。讲习班内容精彩、丰富,学员们踊跃提问、收获颇丰,不仅加深了对专业领域的 认知,更拓宽了视野和思维。此次讲习班促进了广大专家、学者之间的交流与合作,取得了 圆满成功。

图8:学员与嘉宾现场交流互动及结营合影