讲座报告主题:大模型赋能视觉任务:研究选题与未来展望
专家姓名:彭宇新
日期:2025-09-28 时间:10:00
地点:计算机学院208报告厅
主办单位:计算机科学与通信工程学院
主讲简介:彭宇新,北京大学二级教授、博雅特聘教授,CAAI/CIE/CSIG Fellow,863项目首席专家,中国工程院“人工智能2.0”规划专家委员会专家,中国人工智能产业创新联盟专家委员会主任,中国图象图形学学会副秘书长、提名与奖励委员会副主任,北京图象图形学学会副理事长。以第一完成人获2016年北京市科学技术奖一等奖和2020年中国电子学会科技进步奖一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然科学基金重点(2项)、北京自然科学基金联合基金重点、发改委专项等40多个项目。发表TPAMI、IJCV、CVPR、NeurIPS、ICML等ACM/IEEE Trans.和CCF A类论文160多篇,获最佳论文奖2次。参加10届(10年)由美国国家标准与技术研究院(NIST)举办的国际评测TRECVID视频搜索比赛,均获第一名,参赛队伍包括斯坦福大学、卡内基梅隆大学、牛津大学等。成果应用于国家网信办、公安部、国家广播电视总局等重要单位以及华为、腾讯、快手、蔚来、美团、中国电信、中国铁塔等头部企业。担任IEEE TCSVT高级领域编委、IEEE TMM等期刊编委,培养博士生获中国计算机学会、中国电子学会等优博。研究专长:主要研究方向为多媒体分析、计算机视觉、人工智能。
主讲内容简介:随着GPT、Gemini等大模型的广泛应用,以OpenAI、Google为代表的工业界与学术界的研究焦点正日渐分化。面对工业界大模型的高速迭代,学术界研究者应如何选题、找准自己的赛道,是一个亟待思考的问题。本报告围绕大模型赋能视觉任务,通过具体选题示例,探讨如何利用大模型的特有优势突破视觉任务面临的各项关键局限性。此外,报告从全维度细粒度、具身智能与群体智能、世界模型与空间智能等方面展望大模型的未来研究方向。最后,总结了大模型时代下选题的三个标准:理论性、挑战性与实用性。
欢迎师生参加!