汉语盲文分词连写特点及自动分词研究

本文对《中国盲文》国家标准规定的现行盲文方案和双拼盲文方案中涉及分词连写规则的部分进行了初步归纳整理,分析了影响盲文分词连写规则的几个重要语言特征参数,如词语长度、盲文字符方数、词性、句法功能等。在此基础上,本文将盲文分词连写规则和《汉语拼音正词法基本规则》《信息处理用现代汉语分词规范》等相关规范标准中对分词连写的规定进行了对比分析,提出了相对于汉语明眼文的盲文分词连写特殊规则,建立了实验性词库和分词规则库,并编写了面向盲文的自动分词软件进行实验。本文的研究主要基于对盲文和汉语相关分词规范进行的定性分析。目前汉语盲文语料库的建设作为国家社科重大项目已经提上日程,有了大规模盲文语料库的帮助,就可以通过定量分析方法,更加全面地把握汉语盲文词汇问题的全貌,从而提高盲文信息化、自动化的水平。

作者: 肖航
作者单位: 教育部语言文字应用研究所
母体文献: 第八届全国语言文字应用学术研讨会论文集
会议名称: 第八届全国语言文字应用学术研讨会
会议时间: 2013年11月1日
会议地点: 金华
主办单位: 中国应用语言学会
语 种: chi
分类号: G76 TP3
在线出版日期: 2018年3月21日