当前位置: 首页 > news >正文

Training: WWW-Robots (HTTP, Training)

设置robots.txt可以防止搜索引擎爬虫爬取重要目录,但是可能也会泄露出去。

题目:

In this little training challenge, you are going to learn about the Robots_exclusion_standard.
The robots.txt file is used by web crawlers to check if they are allowed to crawl and index your website or only parts of it.
Sometimes these files reveal the directory structure instead protecting the content from being crawled.

Enjoy!

这题没有提交按钮。

但是最后给出了一个提示:有时,robots.txt文件会泄露目录结构,而不是防止内容被爬取。

所以先访问下: http://www.wechall.net/robots.txt 查看一下内容:

User-agent: *
Disallow: /challenge/training/www/robots/T0PS3CR3T


User-agent: Yandex
Disallow: *

复制

/challenge/training/www/robots/T0PS3CR3T 是禁止爬虫爬取的,那么一定有问题。

把这个目录加到主站点,就是这个网址:[WeChall] Training: WWW-Robots

访问下,解题成功。

相关文章:

  • Node.js中 打印让输出不换行
  • Typecho博客 通过修改后台管理员昵称 来减少安全隐患
  • idea复制css img静态资源 不显示
  • idea jsp隐藏了nbsp
  • <div class=“clear“></div>
  • jsp使用include文件中的变量
  • jsp <%= 和 ${}
  • mac chrome 无缓存刷新
  • [WeChall]Training: Stegano I的解法
  • Caesar I (Crypto, Training) 的多种简单解法
  • 简单在线提取查看 清晰QQ头像的API 可以定义图片尺寸
  • 超级简单题目 [WeChall] Training: Get Sourced 的解法
  • 解决 arpspoof: libnet_open_link(): UID/EUID 0 or cap
  • Ubuntu18.04 安装配置桌面便签 Indicator Stickynotes
  • Ubuntu18.04下 安装 arpspoof ARP欺骗局域网攻击工具
  • 11111111
  • es6要点
  • JAVA SE 6 GC调优笔记
  • Java到底能干嘛?
  • js数组之filter
  • October CMS - 快速入门 9 Images And Galleries
  • TCP拥塞控制
  • Vultr 教程目录
  • 从0实现一个tiny react(三)生命周期
  • 从零到一:用Phaser.js写意地开发小游戏(Chapter 3 - 加载游戏资源)
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 仿天猫超市收藏抛物线动画工具库
  • 聊聊directory traversal attack
  • 如何实现 font-size 的响应式
  • 入门级的git使用指北
  • 深入浏览器事件循环的本质
  • 怎样选择前端框架
  • 智能网联汽车信息安全
  • ​​​​​​​Installing ROS on the Raspberry Pi
  • $.ajax()参数及用法
  • (06)Hive——正则表达式
  • (4) openssl rsa/pkey(查看私钥、从私钥中提取公钥、查看公钥)
  • (k8s中)docker netty OOM问题记录
  • (八)Spring源码解析:Spring MVC
  • (翻译)Entity Framework技巧系列之七 - Tip 26 – 28
  • (仿QQ聊天消息列表加载)wp7 listbox 列表项逐一加载的一种实现方式,以及加入渐显动画...
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (转) Face-Resources
  • (转)IOS中获取各种文件的目录路径的方法
  • (转)项目管理杂谈-我所期望的新人
  • ./和../以及/和~之间的区别
  • .360、.halo勒索病毒的最新威胁:如何恢复您的数据?
  • .Net Framework 4.x 程序到底运行在哪个 CLR 版本之上
  • .NET6 开发一个检查某些状态持续多长时间的类
  • .Net6使用WebSocket与前端进行通信
  • .NET开发不可不知、不可不用的辅助类(三)(报表导出---终结版)
  • .NET使用存储过程实现对数据库的增删改查
  • .Net中的集合
  • /dev下添加设备节点的方法步骤(通过device_create)
  • @entity 不限字节长度的类型_一文读懂Redis常见对象类型的底层数据结构