基于主题的Web信息采集系统研究

  构建了基于主题的Web信息采集系统模型,描述了采用上下文图的基于主题的Web信息采集方法,所采用的上下文图能抓取有价值页面的典型的链接层次,也能模拟出相关页面的文档的内容,本算法显示出比普通主题采集方法更高的采集效率。

作者单位: 昆明理工大学 信息工程与自动化学院,云南 昆明 650051
母体文献: 2005年昆明理工大学研究生学术交流年会论文集
会议名称: 2005年昆明理工大学研究生学术交流年会
会议时间: 2005年10月1日
会议地点: 昆明
主办单位: 昆明理工大学
语 种: chi
在线出版日期: 2012年7月10日