WebSpider蓝蜘蛛互联网定向采集系统 6.0OS:License: Size:40.61 M Evaluation: Uudate:2010-12-2 Downloads: 0 WebSpider蓝蜘蛛互联网定向采集系统 6.0 Description:
WebSpider蓝蜘蛛互联网定向采集系统可以采集指定网站上指定范围内的页面数据,然后通过正则表达式解析出页面上的任意数据项。定向采集的采集目标可以是各种类型的网站,比如新闻网站、博客网站、论坛网站等,比如行业网站、服务型网站、内网等。系统可以根据您的需求精确地解析出网页上的各个数据项,比如标题、作者、来源、时间、正文、电话、产品、价格、评论、公司名、联系人等等,前提是您需要配置将要采集网站的入口URL以及解析模版。该系统的特点是精准。 1、新闻、博客、论坛网站的采集 (1)可以对新闻网站上的新闻、资讯进行采集,可以采集网页上的标题、作者、来源、时间、正文等信息项,例如可以采集新华网、人民网、中国政府网、新浪新闻、搜狐新闻、联合早报、路透中文网、中国网、环球网、腾讯新闻、北京晚报、广州日报等新闻网站上的数据; (2)可以对博客网站上的博文信息进行采集,可以采集博文标题、发表时间、内容、标签、分类、每篇评论、阅读人次等信息项,例如可以采集新浪博客、博客网、网易博客、搜狐博客、百度空间、QQ空间、MSN空间等博客博文信息; (3)可以对论坛网站上的发帖回帖信息进行采集,可以采集帖子标题、发表时间、发帖人昵称、帖子内容、浏览次数、回复次数、回帖人昵称、每个回帖内容等信息项,例如可以采集强国论坛、天涯社区、西祠胡同、大众点评、新浪论坛等社区论坛信息;您也可以重点采集娱乐、体育、军事、女性、生活、财经、汽车、房产、家居、教育、数码、旅游、游戏等类别中的某类论坛或论坛的某个栏目。 2、行业网站、服务型网站、内网的采集 (1)可以对服装、纺织、饰品、农业、能源、机械、工业设备、仪表、五金、灯具、汽车、化工、冶金、建材、安防、食品、医药、物流等某类行业网站进行采集和数据项分析; (2)可以对火车票务、商品买卖、求职招聘、企业库、产品库、it商情、福利彩票等某类服务型网站进行采集和数据项分析;(酷讯网站当初就是靠采集火车票转让信息而一夜成名) (3)可以对内网发布的各种数据、各种指标等内网页面进行采集和数据项分析; 对于想做垂直搜索门户的用户来说,这就是您需要的垂直采集功能。 |
Related Software Download of Class
Related Software New Downloads
|
*In order to achieve the fastest download speeds, recommended FlashGet Download software. |