﻿采集系统教程
	目标: 海报网－＞美丽达人频道
	链接：http://www.haibao.cn/beauty/

第一步：创建任务 (一般以一个目标站为一个大任务)

第二步：新建采集任务 (一般以一个频道为一个采集任务)
	一级采集任务一定是一个列表页,找出分页的规律，变化的页数用[page]来匹配
	(节省时间，只采集两页)

第三步：规则配置
	一级采集任务的规则只有一个，就是匹配到文章链接页
	查看页面源文件，找出文章链接的重复规律(建议用firefox的firebug组件找) <h2 class="artitle"><a href="/article/130786.htm" target="_blank">明星猜猜看！这是哪位大明星小时候的青涩旧照？从普通人到大明星，谁真正“面目全非”？(3) </a></h2>,其中/article/130786.htm是我的需要的链接，用||匹配,明星猜猜看！这是哪位大明星小时候的青涩旧照？从普通人到大明星，谁真正“面目全非”？标题也是变化的，但这里并不要提取，用*匹配,最后得出的规则为：<h2 class="artitle"><a href="||" target="_blank">*</a></h2>
	
第四步：创建二级采集任务
		文章是否列表页，有分页，则要配置文章分页规则
		如果想要替换正文某些内容，也可以设置，这里演示如何去掉文章中的说明文字

第五步：设置二级采集任务规则，用于最终获取相关数据(注意选好数据类别)

第六步：开始采集

可以看到，内容已采集入库，并且会自动采集内容中的图片

演示结束
----------------------------------------------------------------------
此文件下载自"傲看软件园"------免费绿色软件下载站点
--------------------------------------------------------------
如果你觉得我们不错，请向你的朋友推荐！

                    ------傲看软件园,下载我喜欢(www.okhan.net)
                    ------源码下载,精品源码社区(www.okhan.cn)
--------------------------------------------------------------