新闻中心

当前您的位置: 首页> 新闻中心> 学术讲座> 正文

讲准字【2025】第174号:人工智能大模型推理系统的研究与实践

发布时间:2025-08-09 浏览量:

讲座报告主题:人工智能大模型推理系统的研究与实践
专家姓名:郑纬民
日期:2025-08-10 时间:14:00
地点:计算机学院221会议室
主办单位:计算机科学与通信工程学院


主讲简介:郑纬民,清华大学计算机系教授,中国工程院院士。获北京市优秀教师奖和北京市教学名师称号,享受国务院政府特殊津贴,中国计算机学会第十届理事长。在存储系统扩展性、可靠性和集约性等科学问题和工程技术方面,取得了国内外同行认可的创新性成果;研制的网络存储系统、容灾系统和自维护存储系统在多个重大工程中发挥了重要作用。在国产神威太湖之光上研制的极大规模天气预报应用获得ACM Gordon Bell 奖。获国家科技进步一等奖1项、二等奖2项、国家技术发明二等奖1项,何梁何利科技进步奖。获首届中国存储终身成就奖。研究专长:长期从事网络存储系统科学研究、工程建设和人才培养。


主讲内容简介:本报告首先介绍人工智能大模型生命周期的五个环节:数据获取,数据预处理,模型训练,模型微调和模型推理,然后详细介绍本团队研发的用于模型推理的Mooncake和KTransformers系统,看如何解决大模型推理服务在系统层面的挑战,如何标准化问题,助力AI系统高效运行。


欢迎师生参加!

专家姓名 郑纬民 讲座时间 2025-08-10 14:00
讲座地点 计算机学院221会议室