简介
本次评测旨在全面、客观、准确地评估小语种拼写纠错模型的性能,包括模型对不同语种拼写错误的检测能力、纠正能力以及纠错的准确性和可靠性,为模型的优化和改进提供依据。
任务背景
在全球语言多元化的背景下,小语种在文化传承、国际交流等方面发挥着不可替代的作用,但由于资源有限,其在自然语言处理领域的研究进展相对滞后。为促进小语种拼写纠错技术的发展,提升小语种文本处理的准确性,特举办第一届小语种拼写纠错评测任务。此次评测任务涵盖了多种小语种,如印尼语、越南语,这些语言在语法结构、词汇构成以及书写规范等方面各具特色,这无疑极大地增加了拼写纠错任务的难度与复杂性。本次评测包含两个赛道,错误检测与错误纠正。
参赛队伍需开发算法或模型,对给定的含有拼写错误的小语种文本,准确识别错误位置,并给出正确的拼写形式(仅参加错误检测赛道的队伍不需要提供纠正结果)。本次评测任务面向国内外高校、科研机构、企业等开放,鼓励跨学科、跨领域合作。期待通过此次任务,汇聚各方智慧,攻克小语种拼写纠错难题,为小语种的数字化、智能化发展奠定坚实基础。
奖项设置
本次评测将在每个赛道(印尼语检错、印尼语纠错、越南语检错、越南语纠错)中评选出如下奖项:
一等奖拟定1名,奖金合计5000元;
二等奖拟定2名,奖金合计4000元;
三等奖拟定4名,奖金合计4000元;
由中国人工智能学会为本次评测获奖队伍提供荣誉证书;每个赛道的优秀队伍将有机会在《Data Intelligence》期刊(中科院分区表计算机科学类大类2区)发表评测方案的技术报告。
评测赛程
报名方式
报名团队需填写团队名称、团队负责人信息(姓名、联系方式),并列出团队成员姓名、所在单位/院校,团队人数上限为5人。所有成员信息需真实有效,便于后续沟通与评审。本次评测任务支持印尼语、越南语。参赛者可根据自身研究方向与技术优势,选择一个或多个赛道(印尼语检错、印尼语纠错、越南语检错、越南语纠错)报名参赛。选择多个语种时,需在报名系统中分别勾选,并确认所提交的技术方案与模型能够适配所选的全部语种。
以机构、团体或个人名义均可报名参加,有意向的参赛者可通过报名入口填写相关信息进行报名。
组织者
主办:
中国人工智能学会
中国人工智能学会多语种智能信息处理专业委员会
承办:
多语种智能信息处理专业委员会语料共享和评测工作组
多语种智能信息处理专业委员会东盟语言信息处理专业组
中央民族大学
国家语言资源监测与研究民族语言中心
中央民族大学海南国际学院
组织者:
蒋盛益(广东外语外贸大学)
赵小兵(中央民族大学)
翁彧(中央民族大学)
林楠铠(广东外语外贸大学)
陈波(中央民族大学)
王连喜(广东外语外贸大学)
孙京博(中央民族大学)
高歌(中央民族大学)
工作人员:
欧炎镁(广东外语外贸大学)
方浩男(广东外语外贸大学)
吴家骏(广东外语外贸大学)
联系人:林楠铠(neakail@outlook.com)