一个用于汉语汽车评论的意见挖掘系统

近年来,对描述非事实的主观性文本处理方面的研究十分活跃,主要的特点是对基于断言或评论的文本进行处理,此类文本内容包含有个人、群体、组织等的意见、情感和态度等.基于主观性文本的意见挖掘技术是一种新颖的语言技术,它不仅可以运用于自然语言接口、文本分类、文本过滤、自动摘要、自然语言生成、问答系统等方面,还可以应用于现实生活中的许多方面,如电子商务、电子学习、商业智能、出版编辑、企业管理、信息监控、民意调查等.我们所开发的用于汉语汽车论坛的意见挖掘系统的目的是在电子公告板、门户网站的各大论坛上挖掘并且概括顾客们对各种汽车品牌的不同性能指标的评论和意见,并且判断这些意见的褒贬性以及强度.通过对文本处理的综合统计,给出可视化的结果.这项研究是对汉语主观性文本处理的一次探索,特别是文本各个层次处理所涉及到的词汇、句子和文本极性和强度判断以及它们之问关系的分析.意见挖掘系统的测试结果显示了系统总平均召同率达到了80%,总平均精确率达到了60%.因此,这种用于汉语汽车评论的意见挖掘系统是合理和有效的.

作者单位: 上海交通大学计算机科学与工程系,上海,200030
母体文献: 中文信息处理前沿进展——中国中文信息学会二十五周年学术会议
会议名称: 中国中文信息学会二十五周年学术会议
会议时间: 2006年11月21日
会议地点: 北京
主办单位: 中国中文信息学会
语 种: chi
在线出版日期: 2007年6月13日