新闻中心

当前您的位置: 首页> 新闻中心> 学术讲座> 正文

讲准字【2025】第372号:开放世界的多模态大模型研究与应用

发布时间:2025-12-15 浏览量:

讲座报告主题:开放世界的多模态大模型研究与应用
专家姓名:徐常胜
日期:2025-12-15 时间:16:00
地点:计算机学院208报告厅
主办单位:计算机科学与通信工程学院


主讲简介:徐常胜,中国科学院自动化研究所研究员,IEEE/IAPR Fellow和ACM杰出科学家。担任ACM多媒体专委会中国区(ACM SIGMM China Chapter)主席。发表IEEE/ACM会刊论文200余篇,CCF-A类会议论文150余篇,在多媒体领域国际顶级会议和期刊上获得最佳论文奖10余次,以第一完成人获中国电子学会自然科学一等奖和技术发明一等奖,7次获得中国科学院优秀导师奖。研究专长:多媒体分析与检索、计算机视觉、模式识别。


主讲内容简介:与视觉和语言大模型相比,多模态大模型能够从不同模态数据中学习共性知识,因此具有更强的通用性,也更接近人类的认知能力,是目前人工智能进一步发展的关键所在。尽管目前的多模态大模型已取得了重要进展,在跨模态检索、跨模态生成等任务中取得了优异的性能,但在实际应用中面临的开放世界,已有多模态大模型仍然存在很多尚未解决的挑战。本报告主要探讨解决两个方面的问题:(1)如何在保留不同模态数据本身特性的前提下建模多模态数据关联;(2)如何在保证模型泛化性的前提下实现多模态大模型在下游任务中的跨域迁移和小样本迁移。报告分析了多模态大模型中理想的视觉系统所应具备的要素并提出了基于解耦视觉系统的多模态大模型Libra;同时也介绍了针对多模态大模型的多个泛化性保持的跨域和小样本迁移方法。


欢迎师生参加!

专家姓名 徐常胜 讲座时间 2025-12-15 16:00
讲座地点 计算机学院208报告厅