科学研究

科学研究

统计与数据科学学院举办“大语言模型背景及相关技术交流”学术报告

为激发青年教师科研热情,促进学术交流,3月20日,统计与数据科学学院举办青年教师学术沙龙第十二讲,郑豪副教授做主题为“大语言模型背景及相关技术交流”的学术报告。

郑豪副教授毕业于北京交通大学,现任北京物资学院统计与数据科学学院副教授。曾受国家留学基金委资助作为访问学者到日本东北大学访学一年,并在日本筑波大学、日本长崎工业大学交流学习。主要研究方向组合设计与编码理论,主持完成国家自然科学基金青年基金一项,主持国家自然科学基金面上子课题一项。发表SCI论文8篇,中文论文2篇。

在本次讲座中,郑豪副教授提出当前Transformer已成为大语言模型(LLM)中的核心组成部分,并衍生出一系列优秀成果,如ChatGPT等。他详细阐述了LLM的定义、发展历史、相关技术比如Transformer、迁移学习、强化学习等相关概念,重点交流Transformer中的输入、输出,编码器、解码器,注意力机制,掩码等内容,并通过代码实例帮助理解相应的细节,为到场师生提供了宝贵的学术启示。

青年教师学术沙龙系列讲座的举办,为统计与数据科学学院师生提供了一个学习和交流的平台,有助于拓宽师生的学术视野。未来,学院将继续举办更多高质量的学术活动,以推动相关领域的研究和发展。