共检索到56条结果
全部
订阅
收起
  • [会议论文] 姚徐 郭淑妮 于洪志 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    本研究针对藏语模式匹配法自动分词,收集了多部藏语字词典的所有词条及藏语标点符号,进行归并、词性标注、删减审定、最后形成了约10万词条的大型藏语分词词典。如此大型的词典,切分正确率固然好,但访问查询速度缓慢,分词效...
    藏语自动分词分词词典索引多级索引词库
  • [会议论文] 高璐 于洪志 李应兴 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    本文采用计量统计的方法,从字、词、句、篇四个方面对藏、青、川、甘、滇西北五省(区)第1-12册藏语文小学教材课本进行了分析,分别阐述该教材的合理性及其需要改进的方面,并对以后藏语文小学教材的编写提出一些建议。
    藏语文课本小学课本教材编写计量统计教材合理性
  • [会议论文] 阿不都热依木·热合曼 艾山·吾买尔 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    本文中比较详细地描述了维吾尔语数词词干提取所存在的问题,并对其进行了分析。提出了基于有限状态自动机和词典查询相结合的维吾尔语数词词干提取算法,从而实现了以较高的准确率处理未登录词的词干提取算法。
    维吾尔语数词有限自动机词干提取
  • [会议论文] 买合木提·买买提 吐尔根·依布拉音 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    词性标注有很多不同的研究方法,目前的维吾尔语词性标注的方法都以基于规则的方法为主。本文在大规模人工标注的语料库的基础上研究了基于N-gram模型的维吾尔语词性标注的方法,比较了一元,二元以及三元文法模型对维吾尔语...
    词性标注N-gram模型维吾尔语人工标注语料库
  • [会议论文] 吐尔根·依布拉音 阿里甫·库尔班 阿不都热依木·热合满 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    本文叙述了现代维吾尔语词类体系和构词自动机,确定了现代维吾尔语词性标注标记集。最终提出了一种基于规则的维吾尔语词性自动标注的方法,介绍了整个系统的结构并且对自动标注设计的兼类词表、基本词表、未登录词词表、词性...
    词类自动标注封闭词维吾尔语词性标注集构词自动机标注规则
  • [会议论文] 雪艳 应玉龙 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    在汉蒙词对齐任务的背景下,我们针对数词这一特殊的词类,提出了以阿拉伯数字作为转换中介的对齐方法。其基本思想是,将汉蒙文本中的数词分别转换为阿拉伯数字后再决定它们之间是否存在对应关系,即是否可以成为一个对齐连...
    汉蒙词对齐数词对齐阿拉伯转换标志位信息数字信息对应表
  • [会议论文] 骆凯 李淼 强静 乌达巴拉 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    为了提高汉民翻译系统的翻译准确率,本文提出了在短语基础上结合模板的方法自动抽取模板结构;解码时,首先进行模板匹配,套用模板结构进行翻译,然后再按照Beam Search搜索算法进行后续翻译。因此,该方法可以有效地解决单一...
    统计机器翻译模板抽取短语模型解码汉蒙翻译系统模板匹配
  • [会议论文] 王斯日古楞 斯琴图 那顺乌日图 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    基于短语的统计机器翻译是当前统计机器翻译的主流方法。本文研究了利用现有技术和资源搭建一个基于短语的汉蒙机器翻译系统的方法,并且构建了一个汉蒙机器翻译的自动评价平台,在此基础上利用词典和蒙古语形态学信息来提...
    短语汉蒙翻译统计机器翻译自动评测蒙古语形态学
  • [会议论文] 更尕易西 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    目前国内外有不少机构都在研究关于藏学和藏文文献的学科分类及文献资源共享问题。随着国内外的藏文化研究者的增多,对藏文文献的运用程度非常高,使用藏语和藏文文献的人数也越来越多,而藏文的信息资源分布不均衡、经费短...
    藏文文献信息共建文献资源共享藏文信息处理藏文软件
  • [会议论文] 木合亚提·尼亚孜别克 达吾力·阿不都哈依尔 古丽拉·阿东别克 ,2008 - 第二届全国少数民族青年自然语言处理学术研讨会
    在信息网络化时代,哈萨克文信息处理技术也应跟上中国其他民族语言文字信息处理发展的步伐,为尽早实现完整的中文信息处理平台尽力尽责。
    哈萨克文民族语言文字信息处理技术平台中文信息处理
回到顶部
选择了条数据