基于单层扁平结构的XML网页信息抽取系统的研究与初步实现

  从Web网页中自动抽取所需要的信息内容,是互联网信息智能搜索的一个重要研究课题。为有效解决网页信息的自动抽取问题,文章将JAVA和XML技术相结合,构建了一个基于单层扁平结构的网页信息抽取系统,只要存贮信息的标记的内部结构不发生变化,该系统基本可以实现对网页信息的自动抽取。

作者单位: 昆明理工大学 信息工程与自动化学院,云南 昆明 650051
母体文献: 2005年昆明理工大学研究生学术交流年会论文集
会议名称: 2005年昆明理工大学研究生学术交流年会
会议时间: 2005年10月1日
会议地点: 昆明
主办单位: 昆明理工大学
语 种: chi
在线出版日期: 2012年7月10日