首页 > 正文

国家语言资源监测与研究民族语言中心成功举办“国家语言文字研究基地20年”活动并发布“大模型安全评测”任务

作者:时间:2024-11-22点击数:







2024年11月16日,由中国人工智能学会多语种智能信息处理专委会主办、北京理工大学承办的“国际多语种智能信息处理会议IMLIP2024”在北京理工大学(良乡校区)隆重举行。由国家语言资源监测与研究民族语言中心组织承办了“大模型时代多语种语言资源建设与测评分论坛CMLME2024”,中心主任赵小兵教授担任论坛主席并主持了论坛议程,论坛旨在推动人工智能多语种优质数据资源的持续汇聚、传播共享、评测服务、技术交流、国际合作及国家语言文字事业的高质量发展。



19F52


国家语言资源监测与研究民族语言中心主任赵小兵教授主持论坛

中央民族大学国家语言资源监测与研究民族语言中心在会上成功发布了“大模型安全评测”任务,这是“国家语言文字研究基地20年”系列活动之一。

作为国家语委科研机构,国家语言资源监测与研究民族语言中心始终关注国家民族语言事业,服务国家战略,围绕国家语言文字政策、国家语言信息安全以及传承中华民族优秀文化等方面开展工作。生成式人工智能的快速发展为民族语言文字事业同时带来了机遇和挑战,大模型的扩展使用不仅影响着人类的认知、沟通和决策,也塑造着人类的价值观、信念和行为,通过前期研究发现多数模型都存在一定程度的安全隐患,因此,大模型安全评测任务同时聚焦多民族语言大模型的基础能力评测和安全评测。未来工作组将一方面补全大模型基础能力评测数据,一方面针对大模型的安全问题进行深入研究,补充数据的基础上实现对更多开源模型的意识形态安全风险评估,并公开发布上述评测任务,邀请学界、业界共同参与。这也是国家语言资源监测与研究民族语言中心向“国家语言文字研究基地20年”活动的献礼!


2217C

国家语言资源监测与研究民族语言中心陈波副教授发布“大模型安全评测”任务

分论坛特邀新华通讯社“媒体融合生产技术与系统国家重点实验室”战略研究部副主任蔡津津和“中央民族大学国家语言资源监测与研究民族语言中心”副主任孙媛教授做了论坛主旨报告。蔡津津主任带来了题为《AIGC时代新闻舆论工作新阵地建设——数据集提升智能感知、生产、引导、治理能力》的主旨报告,指出在生成式人工智能快速发展的背景下,舆论环境面临着态势感知复杂度提高、高质量可控安全内容稀缺、舆论引导被动且难以评估等三方面的挑战,主流媒体应当在智能感知、智能生产、智能引导和智能治理四个方面开辟新的定位与主阵地,而数据建设将在其中起到举足轻重作用;孙媛教授的主旨报告题为《低资源语言大模型的现状与挑战》,针对目前大语言模型在高资源语言上的性能日益增强,而低资源语言模型面临包括数据稀缺、标注质量不一、以及文化差异难以通过算法完全理解等问题的现状,并结合中心实验室多语言大模型TiLamb的训练微调经验,分享了从高质量数据构建、低资源语言能力激活、检索增强、安全对齐等角度提高低资源语言大模型能力的经验和路径。


337EF

新华社“媒体融合生产技术与系统国家重点实验室”战略研究部副主任蔡津津做论坛主旨报告


1C8AA

国家语言资源监测与研究民族语言中心副主任孙媛教授做论坛主旨报告

论坛研究交流环节共有13组来自不同高校的研究团队发布了团队研究成果和多语种数据集,涉及语言包括汉语、藏语、蒙古语、英语等,面向包括多语种信息抽取、图文摘要、语音翻译、情感分析、手写字符识别等多种任务。


72C7

7D8E

8BC6

论坛交流环节部分报告人

本次论坛的成功举办,为多民族语言,尤其是低资源语言大模型的发展提供了交流平台,凸显了基础语料资源建设的重要性。同时,发布的评测任务将进一步推动语言模型基础能力和安全能力的提升。展望未来,中心将继续致力于服务国家民族语言文字事业,助力国家文化繁荣与科技进步,为实现中华民族伟大复兴的中国梦贡献力量。


C74C

“大模型时代多语种语言资源建设与测评分论坛CMLME2024”中央民族大学参会代表合影





版权所有©2008-2014 国家语言资源监测与研究少数民族语言中心

地址:北京市海淀区中关村南大街27号中央民族大学理工楼516室(100081)

电话:010-68932421-8016 传真:010-68930880