当前位置: 首页 > news >正文

chrome插件:User-Agent Switcher for Chrome模拟搜索引擎蜘蛛之访问蜘蛛页

目录

  • 概要
  • 所使用的的工具
  • 安装User-Agent Switcher for Chrome插件
  • 使用User-Agent Switcher for Chrome插件
  • 更多User-Agent
  • 关注更多知识,不迷路

概要

蜘蛛页可以简单的理解为百度搜索引擎抓取的页面。那么在上线项目中,怎么模拟蜘蛛去访问蜘蛛页呢?在这里提供一种利用谷歌插件User-Agent Switcher for Chrome来进行模拟查看。

所使用的的工具

  • Chrome 谷歌浏览器
  • Chrome 扩展程序:User-Agent Switcher for Chrome

安装User-Agent Switcher for Chrome插件

  1. 打开Chrome 谷歌浏览器。
  2. 下载User-Agent Switcher for Chrome插件。我在这里直接提供1.1.0版本的下载地址:链接:https://pan.baidu.com/s/1uc29pYrmYce5ALmR34EnfQ 提取码:3h40 。如果可以访问谷歌应用商店,直接去搜索插件下载添加就是了。在这里主要介绍的是第一种方式。
  3. 下载了插件之后直接在谷歌浏览器右上角更多工具打开扩展程序页面,或者直接输入chrome://extensions。
  4. 将下载的插件拖到扩展程序页面,然后点击添加扩展程序。

    image
  5. 添加成功后可以看到扩展程序。到这里,安装就完成了。

    image

使用User-Agent Switcher for Chrome插件

  1. 在浏览器顶部找到该插件的图标=》选项打开user-agent列表页:

    image

  2. 添加user-agent规则:

    image

  3. New User-agent name 是自定义的可以辨识的名字。

  4. New User-Agent String 添加UA标识,在这里我直接添加百度的pc访问模式Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html),了解更多User-Agent。

  5. Group分组,如图我是分组在Chrome下面的,这个随意,只要能找到就行。

  6. Append? 默认选择Replace。

  7. Indicator Flag 开启蜘蛛模式的标志。

  8. 添加之后可以在列表中看到:
    image

  9. 以https://max.book118.com/这个网站来做个示例。打开网址,点击蜘蛛插件图标,选择Chrome组别里面的百度,就可以查看蜘蛛页:

    image

  10. 最后呈现的蜘蛛页:

    image

  11. 也可以查看控制台的 Request Headers 信息中的 user-agent,f12打开控制台直接在Network中看到user-agent也是Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html)

更多User-Agent

以下为部份搜索引擎的蜘蛛 user-agent :

百度:Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html)

谷歌:Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)

搜狗:Sogou+web+spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

Bing:Mozilla/5.0+(compatible;+bingbot/2.0;++http://www.bing.com/bingbot.htm)

关注更多知识,不迷路

小伙伴,用你可爱的小手,点个赞,关注我了解更多知识!!!

如果任何疑问的可以在评论区留言或者私聊。

可以加QQ群交流:568984539,加群备注‘地区-名字-技术类型’。

更多前端、uniapp、nodejs等相关知识可关注我个人博客:https://blog.csdn.net/qq_42961150?spm=1011.2124.3001.5343

相关文章:

  • 学习小笔记---正则表达式
  • Fiddler抓包工具之详细使用步骤(超详细)
  • Apifox接口管理之前端快速mock各种数据
  • 识别诈骗邮件
  • uniapp开发:uniapp之vue3.2开发页面传值的解决方案
  • 获取的文件大小转换成MB
  • 数据包一些概念解释说明
  • 基于jQuery轮播carousel.js(轻量化-企业级)
  • uniapp开发:uniapp之vue3.2获取节点信息的差异
  • jq实现拖拽功能-解决滚动条引起的偏差
  • JavaScript类型识别
  • 前端页面跳转的6大类方法及其使用场景特性分析
  • [saiku] olap数据源管理
  • uniapp开发:瀑布流 灵活配置 简单易用 兼容vue2vue3小程序、H5、app等多端
  • Chrome浏览器使用Overrides调试线上代码的技巧
  • 【刷算法】求1+2+3+...+n
  • 77. Combinations
  • android 一些 utils
  • canvas绘制圆角头像
  • Cookie 在前端中的实践
  • emacs初体验
  • Go 语言编译器的 //go: 详解
  • Linux后台研发超实用命令总结
  • React组件设计模式(一)
  • 阿里云爬虫风险管理产品商业化,为云端流量保驾护航
  • 大数据与云计算学习:数据分析(二)
  • 反思总结然后整装待发
  • 服务器从安装到部署全过程(二)
  • 面试题:给你个id,去拿到name,多叉树遍历
  • 巧用 TypeScript (一)
  • 深入浏览器事件循环的本质
  • 使用iElevator.js模拟segmentfault的文章标题导航
  • 数据库写操作弃用“SELECT ... FOR UPDATE”解决方案
  • 数组的操作
  • 王永庆:技术创新改变教育未来
  • 我的zsh配置, 2019最新方案
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • Redis4.x新特性 -- 萌萌的MEMORY DOCTOR
  • Spring Batch JSON 支持
  • 关于Android全面屏虚拟导航栏的适配总结
  • ​sqlite3 --- SQLite 数据库 DB-API 2.0 接口模块​
  • # 达梦数据库知识点
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #NOIP 2014#Day.2 T3 解方程
  • #单片机(TB6600驱动42步进电机)
  • $.ajax()方法详解
  • (floyd+补集) poj 3275
  • (Matlab)使用竞争神经网络实现数据聚类
  • (ZT)薛涌:谈贫说富
  • (五)IO流之ByteArrayInput/OutputStream
  • (一)kafka实战——kafka源码编译启动
  • (转)关于pipe()的详细解析
  • .360、.halo勒索病毒的最新威胁:如何恢复您的数据?
  • .axf 转化 .bin文件 的方法
  • .describe() python_Python-Win32com-Excel