讲准字【2025】第113号：大模型偏好对齐与知识编辑前沿进展-江苏大学欢迎您！

讲座报告主题：大模型偏好对齐与知识编辑前沿进展
专家姓名：王翔
日期：2025-05-24 时间：11:10
地点：会议中心第一报告厅
主办单位：计算机科学与通信工程学院

主讲简介：王翔，中国科学技术大学特任教授、博导，国家青年人才。在相关领域的国际顶会（如SIGIR、WWW、NeurIPS、ICLR）和顶刊（如IEEE TPAMI、ACM TOIS）上发表论文70余篇，谷歌学术引用2万余次，H-因子56，Elsevier中国高被引学者。四次获得国际顶会最佳论文奖项，两次获国际基础科学大会前沿科学奖，2025年获得人工智能国际顶会ICLR杰出论文奖，2024年获ACM SIGIR青年学者奖和吴文俊人工智能自然科学一等奖，入选《麻省理工科技评论》MIT TR35榜单、AI100青年先锋。主持多项国家级项目，如基金委重大研究计划培育项目，科技部重点研发计划课题等。研究专长：信息推荐与挖掘、大模型、可信人工智能等。

主讲内容简介：偏好对齐和知识编辑是大模型前沿研究方向。偏好对齐旨在使大模型的输出与人类价值观和偏好保持一致，从而提升模型的可信度和可用性；知识编辑则关注如何高效、安全地更新大模型中的知识，以应对动态变化的世界和潜在的风险。首先，针对大模型偏好对齐中的三大挑战，我们提出了三项解决方案：1）针对偏好数据中的噪声问题（如标签反转），我们开发了一种鲁棒的噪声过滤机制，有效提升了偏好数据质量；2）针对模型对不同质量数据训练效果不一致的问题，我们提出了动态调整策略，使模型能够自适应地优化训练过程；3）针对参考模型不可靠的问题，我们设计了一种基于多源参考模型的融合方法，显著提升了对齐的稳定性和可靠性。其次，在大模型知识编辑方面，我们提出了两项创新工作：1）面向大语言模型的零空间知识编辑技术，通过优化知识嵌入空间，实现了对已有知识的最大保护和新知识的完美学习；2）将零空间知识编辑扩展至多模态大模型（如文生图模型），解决了不安全内容生成的挑战，为多模态模型的安全应用提供了新思路。

欢迎师生参加！

专家姓名	王翔	讲座时间	2025-05-24 11:10
讲座地点	会议中心第一报告厅

新闻中心

新闻中心

讲准字【2025】第113号：大模型偏好对齐与知识编辑前沿进展

最新动态

图灵奖获得者约翰·爱德华·霍普克罗夫特院士来校访问交流

学校列2025自然指数榜单全球高校123位

我校协办2025年江苏省高等学校国有资产信息化管理培训会

第七期江苏高校学科建设与研究生教育管理干部学习班在校举办

全国高等学校物理基础课程数字化工作会议在校举办

学校召开“十五五”事业发展规划启动部署会

一周学校要闻（6.30-7.6）

李洪波带队检查校园安全