当前位置: 首页 > news >正文

Go语言用Colly库编写的图像爬虫程序

下面是一个使用Colly库编写的Go语言图像爬虫程序,该程序会爬取news.qq上的图片,并使用proxy_host:duoip和proxy_port:8000的爬虫IP服务器进行抓取。

在这里插入图片描述

package mainimport ("fmt""net/http""github.com/crawlab-collective/go-colly"
)func main() {// 创建一个Collector实例c := colly.NewCollector()// 设置爬虫IP服务器c.SetProxy("http", "duoip:8000")// 添加要爬取的URLc.OnRequest(func(r *colly.Request) {r.URL = "news.qq"})// 当抓取到图片时,将其下载到本地c.OnHTML("img", func(e *colly.HTMLElement) {imgURL := e	attr := e.Attr("src")fmt.Println(imgURL)c.Image(imgURL)})// 开始抓取c.Start()
}

这个程序首先创建一个colly.Collector实例,并设置爬虫IP服务器为duoip:8000。然后,它添加要爬取的URL为news.qq

当程序抓取到网页上的图片时,它会打印出图片的URL,并使用c.Image()方法将其下载到本地。

最后,程序使用c.Start()方法开始抓取。

相关文章:

  • 【多媒体文件格式】AAC
  • c面向对象编码风格(上)
  • ebay、虾皮、Lazada、poshmark等跨境本土店群多账号如何做防关联
  • 音乐免费下载mp3格式+音频格式转换+剪辑音频+合并音频教程
  • PyCharm 无法登陆 Codeium 的解决方法
  • 实用篇-Git
  • 22款奔驰GLE450升级23P驾驶辅助 智能L2领航
  • 增强swagger
  • 记一次 Android 周期性句柄泄漏的排查
  • pytest中的pytest.ini
  • 长春理工大学漏洞报送证书
  • 【QT】Qt读取ANSI格式文件
  • Bash 4关联数组:错误“声明:-A:无效选项”
  • C++编程案例讲解-使用类模板封装数组类
  • 使用正则表达式模块“re”遇到的错误
  • “Material Design”设计规范在 ComponentOne For WinForm 的全新尝试!
  • css的样式优先级
  • eclipse的离线汉化
  • GDB 调试 Mysql 实战(三)优先队列排序算法中的行记录长度统计是怎么来的(上)...
  • Java 网络编程(2):UDP 的使用
  • JavaScript HTML DOM
  • Java超时控制的实现
  • JWT究竟是什么呢?
  • mysql 5.6 原生Online DDL解析
  • Redis 中的布隆过滤器
  • Swift 中的尾递归和蹦床
  • vue--为什么data属性必须是一个函数
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 前端路由实现-history
  • 用Visual Studio开发以太坊智能合约
  • 白色的风信子
  • 微龛半导体获数千万Pre-A轮融资,投资方为国中创投 ...
  • 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源 ...
  • ​软考-高级-系统架构设计师教程(清华第2版)【第15章 面向服务架构设计理论与实践(P527~554)-思维导图】​
  • #Linux(make工具和makefile文件以及makefile语法)
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (13):Silverlight 2 数据与通信之WebRequest
  • (Git) gitignore基础使用
  • (zt)基于Facebook和Flash平台的应用架构解析
  • (搬运以学习)flask 上下文的实现
  • (附源码)计算机毕业设计SSM智慧停车系统
  • (剑指Offer)面试题41:和为s的连续正数序列
  • (三十五)大数据实战——Superset可视化平台搭建
  • (转)iOS字体
  • .[backups@airmail.cc].faust勒索病毒的最新威胁:如何恢复您的数据?
  • .bat批处理(七):PC端从手机内复制文件到本地
  • .Net CoreRabbitMQ消息存储可靠机制
  • .net framework profiles /.net framework 配置
  • .NET gRPC 和RESTful简单对比
  • .NET MVC 验证码
  • .net 程序发生了一个不可捕获的异常
  • .NET 除了用 Task 之外,如何自己写一个可以 await 的对象?
  • .net 验证控件和javaScript的冲突问题
  • .netcore 6.0/7.0项目迁移至.netcore 8.0 注意事项
  • .NET开发不可不知、不可不用的辅助类(一)