使用八爪鱼采集器采集滚动加载和点击加载数据的教程

 更新时间:2023年05月20日 17:12:18   投稿:yin  
现在很多网站的列表,需要向下滚动页面,才能加载出新数据。或者点击“查看更多”加载新数据。使用广泛的火车头采集器相对无力,使用八爪鱼采集器可以采集滚动刷新和点击刷新。

现在很多网站的列表,需要向下滚动页面,才能加载出新数据。使用广泛的火车头采集器相对无力,使用八爪鱼采集器可以采集滚动刷新和点击刷新。

适用场景:将滚动条直接下来到网页底部,出现类似【加载中】字样,稍后马上有新数据出现,且滚动条变短回弹。

我们需采集新闻列表数据。就需要在打开网页后不断向下滚动,加载新数据。

在八爪鱼中怎么实现呢?以下为具体操作步骤。

步骤一、进入自定义任务编辑页面

把网址复制到八爪鱼客户端首页的输入框中,点击开始采集进入自定义任务配置页面。

步骤二、设置滚动方式,调整滚动次数、每次间隔时间

点击打开网页步骤,在下方步骤设置区域点击高级设置,找到页面滚动,点击勾选页面滚动。此网页是无限滚动的,八爪鱼默认设置的【滚动方式】是滚动到底部,默认【滚动次数】100次、默认【每次间隔】1秒。大家可根据实际需求进行调整。【每次间隔】时间需稍大于网页上数据加载的时间(网页上数据加载的时间又跟网速等因素有关)。

结合这个网站的加载特征,这里修改【滚动方式】为向下滚动一屏(一般情况滚动方式都建议大家选择向下滚动一屏);为方便演示,在这里,设置【滚动次数】5次。

步骤三:配置列表数据采集。

启动采集来看一下采集结果。八爪鱼自动执行了【直接滚动到底部】5次,然后采集滚动5次后的数据。

特别说明:

1、此网页是无限向下滚动加载数据的,八爪鱼无法一次采集到所有数据。上面示例是设置了滚动5次,实际采集过程中可根据需求来设置滚动次数。

2、此类网页常见于数据实时性高的新闻类网站,在八爪鱼中可以使用云采集,设置定时启动,少量多次采集最新数据。

3、有时候网页很快,类似【加载中】的提示不明显。【是否有新数据出现】、【观察滚动条的回弹次数】是比较好用的判断标准,请注意观察网页。

4. 【向下滚动一屏】的一屏,跟运行采集任务时的窗口展示区域有关。如下图,左侧滚动的一屏 > 右侧滚动的一屏。

5.若设置滚动后启动采集不滚动的,可能是页面是局部滚动的,需要设置局部滚动不是全局滚动。局部滚动判断方式,在目标网页打开【调试控制台】输入:document.scrollingElement.scrollBy(0, 100) 回车运行。如果页面没有向下滚动,说明不是全局滚动。

到此这篇关于使用八爪鱼采集器采集滚动刷新和点击刷新的教程的文章就介绍到这了,更多相关八爪鱼采集器采集滚动刷新和点击刷新内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 打造博客园(cnblogs)超级自定义界面

    打造博客园(cnblogs)超级自定义界面

    有部分网友提出想了解一下像我这样的高度订制化博客界面是如何做出来的。所以在这里给大家分享一下经验。
    2009-12-12
  • HTTP状态代码集合 方便查询

    HTTP状态代码集合 方便查询

    HTTP协议是基于请求/响应范式的。一个客户机与服务器建立连接后,发送一个请求给服务器,请求方式的格式为,统一资源标识符、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。
    2011-02-02
  • 解决Visual Studio 2019本地不能运行Azure Functions

    解决Visual Studio 2019本地不能运行Azure Functions

    本文主要介绍了Visual Studio 2019本地不能运行Azure Functions的解决方方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-06-06
  • ApacheBeam中的延迟数据处理方法

    ApacheBeam中的延迟数据处理方法

    Apache Beam是一个用于批处理和流处理的统一编程模型,可以处理实时数据流和批量数据,本文给大家介绍ApacheBeam中的延迟数据处理方法,感兴趣的朋友跟随小编一起看看吧
    2024-03-03
  • 2022最新腾讯轻量云 debian 10 安装pve教程详解

    2022最新腾讯轻量云 debian 10 安装pve教程详解

    这篇文章主要介绍了腾讯轻量云 debian 10 安装pve教程 2022,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-10-10
  • 通过Cursor使用chatgpt-4的ai辅助编程工具的方法

    通过Cursor使用chatgpt-4的ai辅助编程工具的方法

    cursor是一款与openai合作的,使用gpt-4的一款编程工具,它可以让你通过gpt-4进行辅助编程,以此提高效率,这篇文章主要介绍了Cursor一个使用chatgpt-4的ai辅助编程工具,需要的朋友可以参考下
    2023-05-05
  • 在本地快速部署deepseek的操作指南(3分钟极速部署)

    在本地快速部署deepseek的操作指南(3分钟极速部署)

    这篇文章介绍了如何在本地快速部署Deepseek模型,包括下载、安装、运行和测试,文中通过图文结合的方式讲解的非常详细,对大家本地快速部署deepseek有一定的帮助,需要的朋友可以参考下
    2025-02-02
  • Deepseek部署到本地Windows的详细过程

    Deepseek部署到本地Windows的详细过程

    如何在Windows10系统上部署DeepSeekAI人工智能,步骤包括安装Ollama底层软件和选择合适的模型进行部署,感兴趣的朋友跟随小编一起看看吧
    2025-02-02
  • 调用DeepSeek API的详细指南

    调用DeepSeek API的详细指南

    章详细介绍了如何在DeepSeek开放平台上获取API密钥,并使用Apifox进行API调试,步骤包括登录平台、创建和保存APIKey、配置Apifox环境变量、导入cURL并设置Authorization、发送请求以及根据需要修改参数实现对话和流式输出,需要的朋友可以参考下
    2025-02-02
  • git merge 命令行操作实现

    git merge 命令行操作实现

    在使用Git进行版本控制时,我们经常需要合并不同分支上的代码变动,Git提供了git merge命令来完成分支合并操作,本文将详细介绍git merge命令的使用,感兴趣的可以了解一下
    2026-03-03

最新评论