摘 要随着web上信息的迅速扩展,各项基于web的服务也逐渐繁荣起来。作为这些信息服务的基础和重要组成部分,web信息采集正应用于搜索引擎、站点结构分析、页面有效性分析、web图进化、用户兴趣挖掘以及个性化信息获取等多种应用和研究中。然而,随着人们对提供的各项信息服务要求越来越高,传统的基于整...