当前位置: 首页 > news >正文

屏蔽搜索引擎的无用蜘蛛,减轻服务器压力

现在有很多的未知蜘蛛,总是频繁抓取我们的网站,特别是服务器配置不高的情况下,那么如何屏蔽这些垃圾蜘蛛减轻服务器压力呢?

一般来说,屏蔽蜘蛛抓取有三种方法:

  1. Robots屏蔽
  2. UA屏蔽
  3. IP屏蔽

主机教程网一般都是通过Robots屏蔽这个方法,Robots 协议(也称为爬虫协议、机器人协议等)用来告诉搜索引擎、爬虫哪些页面https://2bcd.com可以抓取,哪些页面不能抓取。

常见垃圾蜘蛛:

  • AhrefsBot:通过抓取网页建立索引库,并提供反向链接分析和服务。
  • dotbot:在线营销分析软件。
  • MJ12bot:英国搜索引擎。
  • Deusu:个人的项目一个搜索引擎。
  • grapeshot:这家公司好像也是分析网站用的。

屏蔽方式如下:

在robots.txt目录下添加下面的代码,添加之后再用百度站长平台检测一下robots是否正确。

  1. User-agent: AhrefsBot
  2. Disallow: /
  3. User-agent: dotbot
  4. Disallow: /
  5. User-agent: MJ12bot
  6. Disallow: /
  7. User-agent: DeuSu
  8. Disallow: /
  9. User-agent: grapeshot
  10. Disallow: /

各大常见蜘蛛:

百度蜘蛛:Baiduspider

谷歌蜘蛛:Googlebot

必应蜘蛛:bingbot

搜狗蜘蛛:Sogou web spider

360蜘蛛:360Spider

来源:https://2bcd.com/37.html

相关文章:

  • 微信小程序开发开篇词 自顶向下,云端赋能:小程序的高效开发之道
  • Docker的常用命令
  • MySQL高级篇03【逻辑架构】
  • 云原生之容器编排实践-阿里云私有容器镜像仓库
  • 对二维数组从两个维度进行排序(Arrays.sort()方法使用Lambada表达式)
  • SpringBoot 接口整理
  • SpringBoot工程打包与发布运行
  • 芒格-“永远不要有受害者心态”
  • 【位运算】leetcode 190. 颠倒二进制位
  • nexus on k8s最佳实战
  • LeetCode 每日一题 2022/8/29-2022/9/4
  • webpack定制化 高级配置[热更新、热打包、别名、调试]
  • 外贸员需要知道的那些事儿
  • c++11 多线程支持 (std::shared_future)
  • webpack定制化 基础配置[基础、配置、初运行]
  • “寒冬”下的金三银四跳槽季来了,帮你客观分析一下局面
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • android图片蒙层
  • Angular 响应式表单 基础例子
  • docker python 配置
  • FastReport在线报表设计器工作原理
  • HashMap剖析之内部结构
  • Java 内存分配及垃圾回收机制初探
  • java架构面试锦集:开源框架+并发+数据结构+大企必备面试题
  • 百度贴吧爬虫node+vue baidu_tieba_crawler
  • 动态规划入门(以爬楼梯为例)
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 技术发展面试
  • 王永庆:技术创新改变教育未来
  • 我与Jetbrains的这些年
  • 一些css基础学习笔记
  • 云栖大讲堂Java基础入门(三)- 阿里巴巴Java开发手册介绍
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • $.each()与$(selector).each()
  • (3)(3.5) 遥测无线电区域条例
  • (九)信息融合方式简介
  • (论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking
  • (免费领源码)Java#ssm#MySQL 创意商城03663-计算机毕业设计项目选题推荐
  • (使用vite搭建vue3项目(vite + vue3 + vue router + pinia + element plus))
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (原+转)Ubuntu16.04软件中心闪退及wifi消失
  • (正则)提取页面里的img标签
  • (转)清华学霸演讲稿:永远不要说你已经尽力了
  • . ./ bash dash source 这五种执行shell脚本方式 区别
  • ./include/caffe/util/cudnn.hpp: In function ‘const char* cudnnGetErrorString(cudnnStatus_t)’: ./incl
  • .bat批处理(十):从路径字符串中截取盘符、文件名、后缀名等信息
  • .dat文件写入byte类型数组_用Python从Abaqus导出txt、dat数据
  • .NET Core中的去虚
  • .Net mvc总结
  • .NET精简框架的“无法找到资源程序集”异常释疑
  • .Net转Java自学之路—基础巩固篇十三(集合)
  • []C/C++读取串口接收到的数据程序
  • [AutoSar]BSW_Memory_Stack_003 NVM与APP的显式和隐式同步
  • [BZOJ3223]文艺平衡树
  • [C# WPF] 如何给控件添加边框(Border)?