HSK动态口语语料库的标注研究

本文介绍以HSK的高等考试的口试资料为资源,建立一个主要为语法研究和对外汉语教学服务的口语语料库—HSK动态口语语料库。HSK口语语料库的标注建立在语料转写的基础之上,遵循真实性、科学性和全面性的原则。标注过程中只标示偏误,不改动原文,尽量保持学习者的语言原貌。为了便于电脑软件的识别,所有的标注代码都采用国际通用代码—置标语言(XML)进行赋码。标注的范围包括拼音层和汉字层两个层面。拼音层标注的内容包括声、韵、调的偏误标注。汉字层标注的内容包括字、词、句、篇章等层次的标注。

作者: 王之岭 杨雯
作者单位: 北京语言大学汉语水平考试中心
母体文献: 第七届全国语言文字应用学术研讨会论文集
会议名称: 第七届全国语言文字应用学术研讨会
会议时间: 2011年10月22日
会议地点: 湘潭
主办单位: 中国应用语言学会
语 种: chi
分类号: H31 H3
在线出版日期: 2017年3月15日