共建“一带一路”倡议是我国在新时期实行全方位对外开放的重大举措、推行互利共赢的重要平台,是我国参与全球开放合作、改善全球经济治理体系、促进全球共同发展繁荣、推动构建人类命运共同体的中国方案。6月7日,鹏城实验室举办“一带一路”多语言机器翻译国际大科学计划专题报告会,通过线上线下结合的方式,邀请学术界、企业界著名专家分享多语言机器翻译和自然语言处理的前沿技术和未来前景,共同研讨如何以“一带一路”多语言翻译平台为基础筹备和培育国际大科学计划。会上,鹏城实验室正式对外发布“丝路”翻译平台。
中国工程院、广东省科技厅、深圳市科创委的领导和专家出席会议。
▲专题报告会现场
会议致辞中,中国工程院国际合作局副局长田琦表示,希望将多语言机器翻译引入更多的国际工程科技与知识平台中,加强与国际组织的交流与合作,积极推动与“一带一路”相关的项目建设。深圳市科创委副主任钟海表示,将全力支持鹏城实验室聚焦世界科技前沿,努力形成大科学计划布局,不断优化大科学计划的发起、组织、建设、运行等机制。鹏城实验室主任、中国工程院院士高文在致辞中指出,需要明确实施多语言机器翻译的任务、做法和目标,并通过大模型训练形成引擎,通过“应用程序接口(API)”、“数据编程接口(DPI)”等方式实现模型和数据的平台共享。高文主任表示,希望各家单位可以借助鹏城实验室的平台协同协作、共商共建,争取尽快以“一带一路”多语言机器翻译平台为基础培育出信息领域的国际大科学计划。
▲中国工程院国际合作局副局长田琦致辞
▲深圳市科技创新委员会副主任钟海致辞
▲中国工程院院士、鹏城实验室主任高文致辞
会上,中国工程院院士、新疆多语种信息技术重点实验室主任吾守尔·斯拉木教授,美国国家工程院外籍院士、英国皇家工程院外籍院士沈向洋教授分别作了题为《以新一代人工智能技术为引领,共建“一带一路”多语种互译平台》和《人工智能小冰:从设计到实现》的主题报告。报告中两位院士深入浅出地介绍了自己团队多年来的研究成果,与大家探讨了机器翻译和人工智能技术的未来发展方向。
名家讲坛环节中,百度首席技术官王海峰,科大讯飞高级副总裁胡国平,加拿大蒙特利尔大学教授聂建云,哈尔滨工业大学计算机学部主任、鹏城实验室研究员刘挺,内蒙古大学副校长高光来,中央民族大学教授赵小兵等来自企业界和学术界顶尖专家相继作学术报告,从不同角度出发带领大家领略了机器翻译和自然语言处理各领域的前沿态势。
▲线上参会专家
值得一提的是,刘挺教授带来题为《鹏城“一带一路”多语言机器翻译平台与国际大科学计划》的报告,介绍了鹏城实验室首个自主研发的、以中文为核心的多语言机器翻译平台——“丝路”(http://mt.pcl.ac.cn)。“丝路”平台由吾守尔院士、刘挺教授领衔的鹏城实验室机器翻译团队与国内多家学术机构共同打造,该平台依托鹏城实验室的一流研发平台和“鹏城云脑”大科学装置的强大算力,基于超1.5亿条平行句对和100T单语言数据进行模型训练,并使用多模型集成策略进一步提升了性能。目前,“丝路”平台支持23种“一带一路”沿线相关语言与中文的互译,在新闻报道等多个领域和多个语种上的翻译性能已经超越国内许多领先的机器翻译平台。
借此次报告会契机,鹏城实验室“丝路”翻译平台正式对外发布,并计划在近期提供稳定的翻译接口。
▲鹏城“丝路”多语言机器翻译平台
截至2021年1月底,中国已同140个国家和31个国际组织签署了205份共建“一带一路”合作文件,其中涉及12语系、28语族,约132种语言。语言多样性所引发的语言障碍被认为是阻碍“一带一路”相关国家、地区深入交流的主要挑战之一。随着近年人工智能和自然语言处理技术的快速发展,机器翻译技术与人工翻译水平的差距不断拉近,机器翻译被看作是突破语言障碍的“金钥匙”,将在“一带一路”经济、政治、外交、文化交流等方面起到越来越重要的作用。因此,牵头培育和落实以“一带一路”多语种翻译为基础的国际合作课题,不但符合国务院关于组织和实施国际大科学计划和大科学工程的有关方针政策,对于提高我国在科学技术上的国际影响力也具有重要现实意义。
未来,实验室将以“丝路”翻译平台为起点,努力汇聚国内优势资源,推进“一带一路”多语言机器翻译研发和生态拓展,积极培育和参与国际合作项目,不断优化和提升多语言、特别是资源稀缺语种与中文之间的互译性能,推动提升中文的国际影响力。
本文转自鹏城实验室