资源中心

ziyuanzhongxin

当前位置: 首页›› 资源中心›› 资源下载

少数民族语言技术评测语料

来源:  浏览量:62  发布时间:2017-11-13 10:36:16

资源名称

少数民族语言技术评测语料

资源简介

本次评测包含3个项目,评测对象是蒙古文、维吾尔文、藏文三个语种文本自动分词的核心技术。藏文:提供1万句训练语料、1万句测试语料;蒙古文:提供5万句训练语料、5万句测试语料;维吾尔文:提供5万句训练语料、5万句测试语料。语料由中央民族大学、清华大学、西藏大学提供。评测语料库逐步扩充,规模在不断扩大。

资源语言

      简体中文  □ 繁体中文  □ 英文  █ 其他

(多选)

资源类型

█ 语料库  □ 词典  □ 数据集  □ 服务  □ 软件

(单选)

资源应用范围

      语言学研究  语言学习

      机器翻译 □ 语言模型 □ 信息检索 □ 情感分析

      信息抽取 □ 命名实体识别 □ 句法解析

      自动问答 □ 语言学习 □ 知识表示 □ 知识推理

 自然语言处理 □ 语音识别  □其他

(多选)

资源来源

      报纸 □ 杂志 □ 小说 □ 期刊 书籍 □ 电视新闻

  新闻网站 □ 网络评论 □ 论坛  □ 微博  □ 博客  □ 微信

      聊天记录  □其他

(多选)

资源发布者/发布机构

国家语言资源监测与研究少数民族语言中心

发布者邮箱

nmzxb_cn@163.com

联系电话

01068930880

资源访问方式

      在线访问   下载

(单选)

资源访问链接

(即网址)

http://nmlr.muc.edu.cn/upload/zyzx/少数民族语言技术评测语料.rar

资源规模

藏文:提供1万句训练语料、1万句测试语料;蒙古文:提供5万句训练语料、5万句测试语料;维吾尔文:提供5万句训练语料、5万句测试语料。

发布日期

 

备注

 



版权所有©2008-2014 国家语言资源监测与研究中心少数民族语言分中心

地址:北京市海淀区中关村南大街27号中央民族大学理工楼516室(100081)

电话:010-68932421-8016 传真:010-68930880