当前位置: 首页 > news >正文

7.无代码爬虫八爪鱼采集器软件——采集规则/项目的创建与网址输入

接上篇 6.零代码网页爬虫软件基础实操——下载与安装八爪鱼采集器

八爪鱼免费爬虫软件下载:

八爪鱼采集器下载 小白数据采集神器​​icon-default.png?t=N7T8https://affiliate.bazhuayu.com/retrieve

直接复制粘贴要采集的网站在这里就可以进入采集规则的设计器

自定义任务

通过这个功能,可以进入到网址构建的更高阶使用方法

手动输入

直接填写网址或者复制网址到这个输入框,再点击保存设置即可

文件导入

导入的文件可以是txt、csv、xlsx,最多100万条数据

从任务导入

我们采集到的数据,在相关规则下,所以可以直接从这里导入之前采集到的数据,作为二次采集的起始网址。

批量生成

这个功能可以把有规律的网址,通过批量生成的方式构建出来,例如:网址的page页是有规律的,每一篇文章的数字编号+1,那就直接构建一个参数即可,可以通过测试生成网站来确认构建是否正确,下方“网址预览”中会显示出100条数据供查看。

数字变更

字母变更

时间变更

有一些新闻站上通过日期的方式生成文章/帖子,用这个时间变更的构建方案就很方便

自定义列表

这里可以填写你提前准备好的内容,例如我们做搜索词项目的采集就会常常用到这个功能,提前把词汇放进这里,会自动循环调取这个自定义列表的参数

至此我们如何创建项目输入网址方法就讲完了,下节课我们来进行一个实际案例的操作讲解


教程专栏的目录链接,快速直达各个知识点:

八爪鱼采集器入门基础教程,日常更新中-CSDN博客


相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 推荐一个github项目
  • Pikachu靶场--文件包含
  • 解决使用Jmeter进行测试时出现“302“,‘‘401“等用户未登录的问题
  • Ubuntu修改MySQL的tmpdir参数失败的解决方法
  • C# —— 字典
  • 情系端午,爱暖精诚 | 我院开展温情献礼端午慰问活动
  • MongoDB入门与实践
  • 【串口通信-USART】
  • Vue I18n国际化插件
  • 数据库 |试卷1试卷2
  • python 数据清洗基础教程
  • 19、架构-虚拟化容器
  • Trees Grass Rocks Enviroment Pack
  • 深度理解微信小程序技术架构:从前端到后台
  • 第6天:表单处理与验证
  • 自己简单写的 事件订阅机制
  • 【Redis学习笔记】2018-06-28 redis命令源码学习1
  • create-react-app项目添加less配置
  • Docker 笔记(2):Dockerfile
  • JavaWeb(学习笔记二)
  • Mysql数据库的条件查询语句
  • Python连接Oracle
  • Redis 中的布隆过滤器
  • vue:响应原理
  • vue总结
  • 创建一种深思熟虑的文化
  • 给第三方使用接口的 URL 签名实现
  • 检测对象或数组
  • 简单实现一个textarea自适应高度
  • 快速体验 Sentinel 集群限流功能,只需简单几步
  • 使用docker-compose进行多节点部署
  • 带你开发类似Pokemon Go的AR游戏
  • ​【原创】基于SSM的酒店预约管理系统(酒店管理系统毕业设计)
  • #NOIP 2014#day.2 T1 无限网络发射器选址
  • #数学建模# 线性规划问题的Matlab求解
  • (2024.6.23)最新版MAVEN的安装和配置教程(超详细)
  • (二刷)代码随想录第15天|层序遍历 226.翻转二叉树 101.对称二叉树2
  • (附源码)ssm基于jsp的在线点餐系统 毕业设计 111016
  • (转)Mysql的优化设置
  • (转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据
  • (自用)learnOpenGL学习总结-高级OpenGL-抗锯齿
  • ./configure、make、make install 命令
  • .mp4格式的视频为何不能通过video标签在chrome浏览器中播放?
  • .net core 控制台应用程序读取配置文件app.config
  • .Net Remoting(分离服务程序实现) - Part.3
  • .net 反编译_.net反编译的相关问题
  • .NET 跨平台图形库 SkiaSharp 基础应用
  • .Net(C#)常用转换byte转uint32、byte转float等
  • .NET:自动将请求参数绑定到ASPX、ASHX和MVC(菜鸟必看)
  • .Net8 Blazor 尝鲜
  • .net和php怎么连接,php和apache之间如何连接
  • .NET企业级应用架构设计系列之应用服务器
  • /3GB和/USERVA开关
  • :class的用法及应用
  • @requestBody写与不写的情况