学院讲座

大语言模型介绍 (Large Language ModelsAn lntroduction)

发布时间：2023-04-13 浏览量：

为了更好地发挥“学术交流主渠道”的积极作用，推动藏语智能信息处理及应用科学技术的发展创新，搭建高水平、高层次的学术交流平台，经省部共建藏语智能信息处理及应用国家重点实验室（以下简称实验室）学术委员会研究决定，于2023年04月15日（星期六）召开实验室2023年4月学术讨论会（腾讯会议号：189-990-333）”。有关事项的具体内容如下：

报告题目：大语言模型介绍 (Large Language ModelsAn lntroduction)

报告人：桑杰端珠博士，青海师范大学

会议时间：2023年04月15日（星期六）

会议地址：田家炳一楼学术报告厅

报告人简介：桑杰端珠博士，青海师范大学计算机学院博士研究生，研究方向为藏文信息处理，指导教师为才让加教授。从事多年的软件系统开发工作，具有较好的研发经验积累，目前在青海师范大学藏语智能信息处理及应用国家重点实验室研究汉藏机器翻译和藏语智能语音系统，曾协助实验室团队设计开发汉藏机器翻译系统、安多藏语语音识别系统、汉藏语音翻译系统、藏文文字识别系统等。

报告摘要：

从基于马尔可夫过程的n-gram到基于Transformer神经网络架构大规模语言模型，语言模型技术经历了研究范式的多轮选代，从性能、规模、适用场景等方面都发生了巨大的变化，是整个人工智能领域最为活跃的研究议题之一。

近年来，随着预训练语言模型的兴起尤其是以ChatGPT和GPT-4为代表的开创性生成式智能应用的迅速普及，语言模型技术正在变革我们与机器的交互手段，推动新一轮的研究创新和产业演进。

为跟进前沿的语言模型研究方法，本报告将回顾语言模型技术的发展轨迹和脉络，梳理其中里程碑式的研究工作，较为系统地介绍各类大语言模型的内部机制、训练过程、应用方法以及潜在的社会问题。

上一篇：跨模态内容生成技术与应用跨模态内容生成技术与应用

下一篇：阿里翻译&ChatGPT时代的思考

首页

学院讲座