讲座报告主题:端侧化多源视频分析专家姓名:张史梁
日期:2025-11-09 时间:10:40
地点:计算机学院208报告厅
主办单位:计算机科学与通信工程学院
主讲简介:张史梁,北京大学计算机学院长聘副教授,北大计算机学院-特伦托大学信息工程学院多媒体智能联合研究中心主任,致力于多媒体内容分析、高效视觉感知研究,主持重点研发计划国际合作重点专项、国家自然科学基金联合基金重点、重大研究计划培育、面上等项目 10 余项,获中国电子学会科技进步一等奖、教育部技术发明一等奖、中国图象图形学学会自然科学二等奖、大川研究助成奖、中国计算机学会优博、英伟达先锋研究奖、NEC美国实验室突出技术奖、石青云优秀论文奖等。以第一或通讯作者在 T-PAMI、IJCV、CVPR、NeurIPS、ICML等权威期刊与会议发表论文100余篇,引用13000余次。担任IEEE Trans on Multimedia、IEEE Trans on CSVT、CVIU、IET Computer Vision 编委、智能系统学报编委、ACM TOMM客座编委,ICCV、CVPR、AAAI、ICPR等国际会议领域主席。研究专长:多媒体内容分析、高效视觉感知研究。
主讲内容简介:端侧视频分析是提升无人机、无人车、智能摄像机等终端设备智能化程度、实现视觉数据高通量处理的基础。和传统视频分析计算相比,端侧视频分析面临端侧设备算力受限、端侧场景动态复杂、端侧目标表观多变三个关键问题。针对以上关键问题,我们开展了稀疏计算架构、弱监督增量学习、目标跨时空关联三个层面的研究,实现了视频分析模型在国产低功耗硬件平台上的实时部署、基于多源视频的人/车跨时空轨迹定位,提出的稀疏计算架构和高效学习方法也在视频图像高效生成、多模态大模型高效训练等领域取得了性能提升。
欢迎师生参加!