当前位置: 首页 > news >正文

scrapy爬取城市天气数据

scrapy爬取城市天气数据

  • 一、创建scrapy项目
  • 二、修改settings,设置UA,开启管道
  • 三、编写爬虫文件
  • 四、编写items.py
  • 五、在weather.py中导入WeatherSpiderItem类
  • 六、管道中存入数据,保存至csv文件
  • 七、完整代码

一、创建scrapy项目

先来看一下爬取的字段情况:
在这里插入图片描述

本次爬取城市天气数据的scrapy项目使用pycharm创建。首先,使用pycharm创建一个项目并打开该项目,创建的项目名称为scrapyProject。打开pycharm的终端,输入命令scrapy startproject weatherspider,接下来在终端输入命令cd weatherspider进入该目录下。然后输入命令scrapy genspider weather www.xxx.com,这里的weather是spider的名字。项目便创建好了。

二、修改settings,设置UA,开启管道

打开settings.py,将ROBOTSTXT_OBEY改为False,LOG_LEVEL设置为ERROR,将User-Agent改为自己的User-Agen,如下图所示:
在这里插入图片描述
在settings.py文件中取消管道代码的注释,如下图所示:
在这里插入图片描述

<

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【Golang 面试 - 进阶题】每日 3 题(一)
  • WordPress原创插件:启用关闭经典编辑器和小工具
  • 力扣刷题----42. 接雨水
  • 【图像处理】不智能的目标识别
  • C语言 | Leetcode C语言题解之第279题完全平方数
  • 大型语言模型LLM的核心概念
  • 【数据结构】线性表与顺序表
  • Ubuntu22.04使用NVM安装多版本Node.js和版本切换
  • RedisTemplate、StringRedisTemplate、序列化器配置
  • Django REST Framework(十四)路由Routes
  • 二十四、【机器学习】【非监督学习】- 高斯混合模型 (Gaussian Mixture Models, GMM)
  • 深入理解 Redis 的使用与监控
  • 移动UI:排行榜单页面如何设计,从这五点入手,附示例。
  • 【DP】01背包
  • Linux嵌入书学习—数据结构——栈(seqstak)
  • 【跃迁之路】【699天】程序员高效学习方法论探索系列(实验阶段456-2019.1.19)...
  • - C#编程大幅提高OUTLOOK的邮件搜索能力!
  • Docker下部署自己的LNMP工作环境
  • express + mock 让前后台并行开发
  • java 多线程基础, 我觉得还是有必要看看的
  • js学习笔记
  • node.js
  • opencv python Meanshift 和 Camshift
  • PAT A1092
  • PhantomJS 安装
  • SegmentFault 2015 Top Rank
  • Storybook 5.0正式发布:有史以来变化最大的版本\n
  • 彻底搞懂浏览器Event-loop
  • 初识MongoDB分片
  • 开源SQL-on-Hadoop系统一览
  • 浅谈Golang中select的用法
  • 使用Maven插件构建SpringBoot项目,生成Docker镜像push到DockerHub上
  • 探索 JS 中的模块化
  • 没有任何编程基础可以直接学习python语言吗?学会后能够做什么? ...
  • # 职场生活之道:善于团结
  • #Z2294. 打印树的直径
  • #如何使用 Qt 5.6 在 Android 上启用 NFC
  • (1) caustics\
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (含笔试题)深度解析数据在内存中的存储
  • (六)激光线扫描-三维重建
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (数据结构)顺序表的定义
  • (一)python发送HTTP 请求的两种方式(get和post )
  • (一)SvelteKit教程:hello world
  • (原創) 人會胖會瘦,都是自我要求的結果 (日記)
  • (转)h264中avc和flv数据的解析
  • .equals()到底是什么意思?
  • .NET Core 网络数据采集 -- 使用AngleSharp做html解析
  • .NET 发展历程
  • .NET与 java通用的3DES加密解密方法
  • .php文件都打不开,打不开php文件怎么办
  • .sh文件怎么运行_创建优化的Go镜像文件以及踩过的坑
  • @Autowired多个相同类型bean装配问题