当前位置: 首页 > news >正文

157-安全开发-Python 自动化挖掘项目SRC 目标FOFA 资产Web 爬虫解析库

案例一:Python-WEB 爬虫库&数据解析库

这里开发的内容不做过多描述,贴上自己写的代码
爬取数据

要爬取p标签,利用Beautyfulsoup模块

import requests,time
from bs4 import BeautifulSoup#url="https://src.sjtu.edu.cn/rank/firm/0/?page=2"
def get_content():for i in range (30,40):url="http://192.168.172.132/cms/show.php?id=%s"%iprint(url+'\n')try:response = requests.get(url)markup = response.text# print(markup)soup=BeautifulSoup(markup, "lxml")#divs = soup.find_all('div',attrs={'class','nav'})ps = soup.find_all('p')# print(ps)for p in ps:print(p.string+'\n')with open("examples.txt",'a+',encoding='utf-8') as file:file.write(p.string+'\n')except Exception as e:time.sleep(1)passif __name__ == "__main__":get_content()

运行结果,把所有p标签的文字都输入到了文件中

案例二:Python-EDU_SRC-目标列表爬取

fofa挖掘数据,这里代码还可以优化,如果要挖掘更多数据可以带上cookie去访问

这里fofa搜索后面的参数就是的就是base64的编码值,所以可以直接搜好以后用url地址去跑

import requests
from bs4 import BeautifulSoup#获取页码
def get_pages():pages = soup.find('span',attrs={"class":"hsxa-highlight-color"})#print(pages.get_text().strip())page = int(int(pages.get_text().strip())/10)page = page + 1print("一共有%s页"%page)#获取网页(title)名
def get_titles():ps = soup.find_all('p',attrs={"class":"el-tooltip hsxa-one-line item"})for p in ps:print(p.string.strip())#获取ip名
def get_ips():ips = soup.find_all('span',attrs={"class":"hsxa-host"})#print(ips)for ip in ips:print(ip.a.get_text().strip())#获取指纹
def get_serves():servers = soup.find_all('span',attrs={"class":"el-tooltip hsxa-list-span hsxa-list-span-sm"})#print(servers)for server in servers:print(server.get_text().strip())if __name__ == "__main__":url = input("请输入fofa的url地址:")response = requests.get(url)markup = response.textsoup = BeautifulSoup(markup,"lxml")while(True):math = int(input("\n"+"获取页码输入1"+"\n"+"获取title输入2"+"\n"+"获取ip输入3"+"\n"+"获取指纹输入4"+"\n"+"退出请输入5"+"\n"))if math == 1:get_pages()if math == 2:get_titles()if math == 3:get_ips()if math == 4:get_serves()if math == 5:break

运行结果

案例三: Python-FOFA_API-资产信息爬取

这里fafo自带有api接口可以利用去访问,不过呢这里需要fofa会员或者有F点才能够搜索,这里只能先贴上代码,没办法复现

import requests
import base64#https://fofa.info/api/v1/search/all?email=your_email&key=your_key&qbase64=dGl0bGU9ImJpbmcidef get_fofa_data(email,apikey):for eduname in open('eduname.txt',encoding='utf-8'):e=eduname.strip()search='"%s" && country="CN" && title=="Error 404--Not Found"'%eb=base64.b64encode(search.encode('utf-8'))b=b.decode('utf-8')url='https://fofa.info/api/v1/search/all?email=%s&key=%s&qbase64=%s'%(email,apikey,b)s=requests.get(url).json()print('查询->'+eduname)print(url)if s['size'] != 0:print(eduname+'有数据啦!')for ip in s['results']:print(ip[0])else:print('没有数据')if __name__ == '__main__':email='471656814@qq.com'apikey='0fccc926c6d0c4922cbdc620659b9a42'get_fofa_data(email,apikey)

 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • oracle 条件取反
  • discuz论坛3.4 截图粘贴图片发帖后显示不正常问题
  • Qt_控件的QWidget属性介绍
  • C/C++调试工具GDB简单介绍
  • 蓝桥杯真题——数星星
  • gitlab无法push(pre-receive hook declined)
  • vue3 响应式 API:readonly() 与 shallowReadonly()
  • MMdetection改进的目标检测算法
  • Mysql基础练习题 1407.排名靠前的旅行者(力扣)
  • ICLR2024: 大视觉语言模型中对象幻觉的分析和缓解
  • C#编写上位机通过OPC DA读取西门子PLC数据
  • EmguCV学习笔记 C# 11.3 DNN其它
  • C++学习笔记(20)
  • Unity for Android使用蓝牙低功耗Bluetooth LE
  • linux 操作系统下crontab命令及使用案例介绍
  • [PHP内核探索]PHP中的哈希表
  • 【391天】每日项目总结系列128(2018.03.03)
  • android高仿小视频、应用锁、3种存储库、QQ小红点动画、仿支付宝图表等源码...
  • CentOS从零开始部署Nodejs项目
  • gf框架之分页模块(五) - 自定义分页
  • MySQL Access denied for user 'root'@'localhost' 解决方法
  • nfs客户端进程变D,延伸linux的lock
  • Redux系列x:源码分析
  • UEditor初始化失败(实例已存在,但视图未渲染出来,单页化)
  • WebSocket使用
  • 笨办法学C 练习34:动态数组
  • 干货 | 以太坊Mist负责人教你建立无服务器应用
  • 技术:超级实用的电脑小技巧
  • 紧急通知:《观止-微软》请在经管柜购买!
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 项目实战-Api的解决方案
  • 译自由幺半群
  • 鱼骨图 - 如何绘制?
  • 栈实现走出迷宫(C++)
  • 仓管云——企业云erp功能有哪些?
  • 好程序员web前端教程分享CSS不同元素margin的计算 ...
  • ​Java并发新构件之Exchanger
  • # Panda3d 碰撞检测系统介绍
  • #LLM入门|Prompt#3.3_存储_Memory
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (2)MFC+openGL单文档框架glFrame
  • (4)Elastix图像配准:3D图像
  • (70min)字节暑假实习二面(已挂)
  • (C++17) std算法之执行策略 execution
  • (day6) 319. 灯泡开关
  • (JSP)EL——优化登录界面,获取对象,获取数据
  • (python)数据结构---字典
  • (阿里云在线播放)基于SpringBoot+Vue前后端分离的在线教育平台项目
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)spring boot车辆管理系统 毕业设计 031034
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • (四)软件性能测试
  • (转)jQuery 基础
  • (转)平衡树
  • . ./ bash dash source 这五种执行shell脚本方式 区别