新闻中心

当前您的位置: 首页> 新闻中心> 学术讲座> 正文

讲准字【2025】第113号:大模型偏好对齐与知识编辑前沿进展

发布时间:2025-05-23 浏览量:

讲座报告主题:大模型偏好对齐与知识编辑前沿进展
专家姓名:王翔
日期:2025-05-24 时间:11:10
地点:会议中心第一报告厅
主办单位:计算机科学与通信工程学院


主讲简介:王翔,中国科学技术大学特任教授、博导,国家青年人才。在相关领域的国际顶会(如SIGIR、WWW、NeurIPS、ICLR)和顶刊(如IEEE TPAMI、ACM TOIS)上发表论文70余篇,谷歌学术引用2万余次,H-因子56,Elsevier中国高被引学者。四次获得国际顶会最佳论文奖项,两次获国际基础科学大会前沿科学奖,2025年获得人工智能国际顶会ICLR杰出论文奖,2024年获ACM SIGIR青年学者奖和吴文俊人工智能自然科学一等奖,入选《麻省理工科技评论》MIT TR35榜单、AI100青年先锋。主持多项国家级项目,如基金委重大研究计划培育项目,科技部重点研发计划课题等。研究专长:信息推荐与挖掘、大模型、可信人工智能等。


主讲内容简介:偏好对齐和知识编辑是大模型前沿研究方向。偏好对齐旨在使大模型的输出与人类价值观和偏好保持一致,从而提升模型的可信度和可用性;知识编辑则关注如何高效、安全地更新大模型中的知识,以应对动态变化的世界和潜在的风险。首先,针对大模型偏好对齐中的三大挑战,我们提出了三项解决方案:1)针对偏好数据中的噪声问题(如标签反转),我们开发了一种鲁棒的噪声过滤机制,有效提升了偏好数据质量;2)针对模型对不同质量数据训练效果不一致的问题,我们提出了动态调整策略,使模型能够自适应地优化训练过程;3)针对参考模型不可靠的问题,我们设计了一种基于多源参考模型的融合方法,显著提升了对齐的稳定性和可靠性。其次,在大模型知识编辑方面,我们提出了两项创新工作:1)面向大语言模型的零空间知识编辑技术,通过优化知识嵌入空间,实现了对已有知识的最大保护和新知识的完美学习;2)将零空间知识编辑扩展至多模态大模型(如文生图模型),解决了不安全内容生成的挑战,为多模态模型的安全应用提供了新思路。


欢迎师生参加!

专家姓名 王翔 讲座时间 2025-05-24 11:10
讲座地点 会议中心第一报告厅