蓝鸟网搜帮助文件

1. 新建搜集任务

1.1 点击“文件 -> 新建”菜单,或点击工具栏“新建”按钮或在任务列表中点击鼠标右键,在弹出菜单中选择“新建”选项,打开新建任务对话框:

1.1.1 任务名称

输入搜索任务的名称,可以是任意中文或英文字符,最多200字符

1.1.2 任务类别

为搜索任务选择类别(类别也可以添加、删除或修改),以方便任务多时按类别检索

1.1.3 目标网址

一般是目标网站某个栏目的网址,如:软件下载网的“系统工具、常用工具 ...”等软件列表页地址,可以使用通配符,一般是页码,如:

http://www.domain.com/class/list.asp?id=1&page=*

(其中*号是通配符,表示用其他字符代替)

1.1.4,1.1.5 通配符的起始和结束值

表示页码范围如起始值是:1,结束值是:18,则软件从以下网址搜集数据:

http://www.domain.com/class/list.asp?id=1&page=1

http://www.domain.com/class/list.asp?id=1&page=2

......

http://www.domain.com/class/list.asp?id=1&page=18

从1.2版开始,如果这两个值为非数字,则这两个值表示要搜集的链接的开始标记和结束标记。(即:这两个值用于定位目标网页中程序要访问的下一个链接)

1.1.6 网页字符集

目标网页使用的字符编码方式,国内大多数网站采用ANSI编码方式,极少数网站采用UTF-8编码。技巧:先选择ANSI字符集,如果搜集到的数据有乱码的现象,则改成UTF-8编码方式。

1.1.7 任务描述

任务备注信息,可为空。

设置完任务基本信息后点击“下一步”按钮进行搜集规则设置

下一页 数据搜集规则