2024年7月26-7月29日,中央民族大学国家语言资源监测与研究民族语言中心主任赵小兵教授、副主任孙媛教授以及中心闫晓东副教授、陈波副教授带领11位在读硕、博士学生参加了在山西太原召开的第二十三届中国计算语言学大会(CCL 2024)。
中国计算语言学大会创办于1991年,经过30余年发展,已成为国内自然语言处理领域权威性最高、规模和影响最大的学术会议。本届CCL由中国中文信息学会计算语言学专业委员会主办,山西大学承办,参会人数达七百余人。特邀北京大学鄂维南院士、山西大学梁吉业教授、清华大学宋森研究员、华为语音语义首席科学家刘群教授、复旦大学黄萱菁教授以及爱丁堡大学&阿姆斯特丹大学Ivan Titov教授进行了大会报告。
图1 我中心教师及学生参加CCL 2024
我中心今年共有包括《基于生成式语言模型的立场检测探究》(作者:张袁硕、李澳华、尹召宁、王潘怡、陈波、赵小兵),《TiLamb:基于增量预训练的藏文大语言模型》(作者:庄文浩、孙媛、赵小兵),《Ko-LLaMA:基于LLaMA的朝鲜语大语言模型》(作者:庞杰、闫晓东、赵小兵),《融合多元特征表示的藏文命名实体识别方法》(作者:俄见才让、周毛克、陈波、赵小兵),《面相对话式阅读理解的高质量藏语数据集构建》(作者:达哇才仁、朋毛才让、孙媛),《TiComR:基于提示的藏文对话型阅读理解模型》(作者:朋毛才让、孙媛)等6篇工作中选会议论文,在大会进行了口头报告或张贴报告。其中硕士生张袁硕等《基于生成式语言模型的立场检测探究》工作获得大会亮点中文论文。
图2 我中心硕士生张袁硕等工作获大会亮点中文论文
中央民族大学国家语言资源监测与研究民族语言中心成立于2008年,由国家教育部语言文字信息管理司、国家民委教育科技司和中央民族大学三方共建,目前已进入第三个建设期。自成立以来,我中心聚焦于服务国家战略和国家语言文字事业,在民族语言信息安全、传承中华民族优秀文化等方面开展了一系列的工作,累积了丰富的多民族语言语料,并在此基础上建设了面向多领域的语料库和知识库,开展了包括语言文字信息处理及标准规范建设、语言文字与国家治理、语言生活及语言服务、中华优秀语言文化传承传播与发展、语言文字基础理论和新兴交叉领域等相关方面的研究,取得了丰厚的研究成果。伴随国际形势的变化和自然语言处理技术的快速发展,中心将在保持民族语言政策及标准规范研究、跨语言舆情分析研究、低资源语言机器翻译研究等优势方向外,积极关注面向国家安全的民族语言大模型、民族古籍文献智能分析以及跨境语言和涉华报道分析等研究方向,将中心建设成为全国一流的我国边疆及周边国家多语言资源汇聚的计算语言学、语言信息安全领域的学术研究基地。
图3 与会代表合影