新闻中心

当前您的位置: 首页> 新闻中心> 学术讲座> 正文

讲准字【2026】第033号:AGI:从大语言模型到多模态语言-视觉-动作模型

发布时间:2026-03-25 浏览量:

讲座报告主题:AGI:从大语言模型到多模态语言-视觉-动作模型
专家姓名:Sergey Ablameyko
日期:2026-04-09 时间:14:00
地点:计算机学院208报告厅
主办单位:计算机科学与通信工程学院


主讲简介:Sergey Ablameyko 是白俄罗斯国立大学终身教授、白俄罗斯国家科学院院士、欧洲科学院院士、国际模式识别协会(IAPR)会士、英国电气工程师学会(IEE)会士。Ablameyko 院士是计算机视觉与图像分析领域的国际权威。他是亚太人工智能协会(AAAIA)副主席,曾担任白俄罗斯国立大学校长(2008-2017)、联合信息问题研究所所长,领导俄白联合太空计划(预算超千万美元)。Ablameyko 院士获白俄罗斯国家科学奖(2002)、俄罗斯友谊勋章(2009)等50余项国际奖项,出版专著25部、论文750余篇,指导17位博士生。现任《Pattern Recognition and Image Analysis》主编,担任《Nonlinear Phenomena in Complex Systems》等10余种国际期刊编委,主导创立PRIP国际会议并任15届主席。研究专长:研究方向涵盖深度学习、医学影像分析、遥感图像处理、地理信息系统、超算技术及空间信息学。


主讲内容简介:随着对大语言模型(LLMs)研究的深入,近年来在大型多模态模型(LMMs)的开发方面取得了显著进展,这些模型正逐渐向通用人工智能迈进。我们将尝试全面且统一地总结从LLMs到LMMs的最新进展。首先,我们从LLMs开始,概述各种概念框架和关键技术。随着我们继续开发人工智能,机器感知(计算机视觉)的重要性日益凸显。感知是人工智能的关键组成部分。未来,智能机器需要能够像人类一样感知世界,这既带来了机遇,也带来了挑战。智能机器的感知所带来的机遇之一是,它能够自动化执行以前机器无法执行的任务。人工智能感知的未来既蕴含机遇,也面临挑战。尽管具备高级感知能力的机器将能够执行以往不可能完成的任务,但打造能像人类一样感知世界的机器也面临着诸多挑战。不过,研究人员在开发机器感知的新方法上正在取得进展,未来几年我们很可能会继续看到这一领域的进步。我们从大语言模型转向多模态语言-视觉-动作模型,这些模型使人工智能能够处理不同的模态。接下来,我们将探讨物理人工智能的主要特征,即机器人基础知识。我们将从统一的角度对大语言模型(LLMs)和大型多模态模型(LMMs)进行总结,从全球化的视角分析大模型的发展现状,并为大模型提供潜在的研究方向。


欢迎师生参加!

专家姓名 Sergey Ablameyko 讲座时间 2026-04-09 14:00
讲座地点 计算机学院208报告厅