八爪鱼数据采集器

时间：2024-08-30 07:46:01编辑：思创君

怎样用八爪鱼采集淘宝商品列表页数据

您好，很高兴为您解答，亲·~为您查询到用八爪鱼采集淘宝商品列表页数据步骤一：输入网址在首页【输入框】中输入目标网址（以豆瓣读书为例），点击【开始采集】，八爪鱼会自动打开网页。步骤二：建立采集流程-【循环提取数据】观察可以发现，该网页上的图书信息以列表形式呈现，每个列表结构相同，都包含书名、出版信息、评分、评价数、图书简介等。那么如何让八爪鱼识别所有列表，并采集所需类型的数据呢？在八爪鱼中，我们需要建立【循环提取数据】的流程：第一，任意点击选中页面上的一个图书列表。选中后的列表会呈绿色框选状态，其中红色虚线框内的称为【子元素】。（需要注意的是，要确保待采集的所有内容都在绿色框内。）第二，在弹出的黄色操作提示框中选择【选中子元素】。此时当前列表数据的全部具体字段已被识别出来，并且八爪鱼还自动识别出了其他同类元素。第三，在黄色操作提示框中，继续选择【选中全部】。【摘要】
怎样用八爪鱼采集淘宝商品列表页数据【提问】
您好，很高兴为您解答，亲·~为您查询到用八爪鱼采集淘宝商品列表页数据步骤一：输入网址在首页【输入框】中输入目标网址（以豆瓣读书为例），点击【开始采集】，八爪鱼会自动打开网页。步骤二：建立采集流程-【循环提取数据】观察可以发现，该网页上的图书信息以列表形式呈现，每个列表结构相同，都包含书名、出版信息、评分、评价数、图书简介等。那么如何让八爪鱼识别所有列表，并采集所需类型的数据呢？在八爪鱼中，我们需要建立【循环提取数据】的流程：第一，任意点击选中页面上的一个图书列表。选中后的列表会呈绿色框选状态，其中红色虚线框内的称为【子元素】。（需要注意的是，要确保待采集的所有内容都在绿色框内。）第二，在弹出的黄色操作提示框中选择【选中子元素】。此时当前列表数据的全部具体字段已被识别出来，并且八爪鱼还自动识别出了其他同类元素。第三，在黄色操作提示框中，继续选择【选中全部】。【回答】

关于八爪鱼采集器采集分页的问题

根据你的描述来看，这个是个非常特殊的下一页按钮，绝大多数的网页上的下一页链接或者按钮，八爪鱼采集器都能自动识别并自动添加下一页循环，但是也有非常少的特殊情况，你这种就是，这种情况下其实处理起来也不难，只是不能全自动生成采集流程，要稍微半自动手动拖一下流程：具体的操作方式我查阅了八爪鱼论坛，以下是摘录的八爪鱼论坛回帖中的解决方案：

“建议你把你的页面地址发出来，看看你的下一页是不是比较特殊，如果是你这个下一页的标签比较特殊，可以通过以下方式来手动建立下一页循环:
1. 获取下一页的XPath，有好几种方式：
使用firepath。
在群里找客服帮你。
建立一个测试任务，打开包含下一页的页面，直接点击提取下一页的文字，选中提取的字段，点自定义按钮，选第二项，里面有一个“//”开头的一串字符，就是XPath。

2. 回到你的任务，当你导航至列表页需要创建翻页循环的时候，不用惦记下一页，直接拖一个循环动作到流程中，打开高级选项，选中循环固定元素，并在右边输入获取的XPath，点保存。

3. 拖动一个点击动作到循环内部，打开高级选项，选中“使用当前循环项”，点保存。

通过以上步骤即可实现手动创建翻页循环。”

八爪鱼采集手机商品数据的步骤

1.登陆软件,先去采集规则的规则市场内,搜索到店铺商品采集,将规则下载下来,已经下载过一次的规则无需再反复下载,系统会自动保存。
2.将下载的规则导入到任务中去,修改采集的网址,你可以单网址采集,也可以自己再增设一个网址循环采集。修改后点击保存。
3.再修改要提取的数据内容,页面上有的内容基本都可以采集到,可以根据自己的需要删除或增加字段。修改完成后点击保存。
4.点击下一步直到完成界面,选择单机采集(调试任务),看看数据采集的情况,如无数据出来,请返回第2、3步检查。【摘要】
八爪鱼采集手机商品数据的步骤【提问】
1.登陆软件,先去采集规则的规则市场内,搜索到店铺商品采集,将规则下载下来,已经下载过一次的规则无需再反复下载,系统会自动保存。
2.将下载的规则导入到任务中去,修改采集的网址,你可以单网址采集,也可以自己再增设一个网址循环采集。修改后点击保存。
3.再修改要提取的数据内容,页面上有的内容基本都可以采集到,可以根据自己的需要删除或增加字段。修改完成后点击保存。
4.点击下一步直到完成界面,选择单机采集(调试任务),看看数据采集的情况,如无数据出来,请返回第2、3步检查。【回答】

上一篇：视频服务器架设

下一篇：磷化