当前位置: 首页 > news >正文

【一起学爬虫】scrapy框架的安装

简介

scrapy是一个强大的异步爬虫框架,具有丰富的组件,有了scrapy框架,我们只需要关心爬虫的逻辑就可以了。

scrapy框架的安装

scrapy的安装有多种方式,它支持 Python2.7版本及以上或 Python3.3版本及以上。下面说明 Python3环境下的安装过程

scrap依赖的库比较多,至少需要依赖库有 Twisted14.0,m34, pyopenSSL0.14。而在不同平台环境又各不相同,所以在安装之前最好确保把一些基本库安装好,尤其是 Windows

windows平台

1.Anaconda 这种方法是一种比较简单的安装 scrap的方法(尤其是对 Windows来说),你可以使用该方法安装。

Anaconda是包含了常用的数据科学库的 Python发行版本,如果没有安装,可以到这里下载对应平台的包安装。如果已经安装,那么可以轻松地通过 conda命令安装 Scrap。 安装命令如下

conda install scrapy


方式二、比较繁琐

  • 安装lxml 最好的安装方式是通过wheel文件来安装:从这里找到lxm的相关文件。 假如是 Python3.5版本, WIndows64位系统,那就找到 lxm-3.72cp35cp35 m-win amd64whl这个文件井下载,然后通过pip安装:
    下载后,运行如下命令安装:

pip install wheel pip install lxm1-3.7.2-cp35-cp35m-win_amd64.whl

注意:上面的whl文件为你下载的那个文件名,要切换到下载文件所在的目录执行上述指令

  • 安装 pyOpenSSL

官方网站下载 wheel文件,如当前最新版本

名称是pyOpenSSL-19.0.0-py2.py3-none-any.whl ,下载后安装即可。

pip instal pyOpenSSL-19.0.0-py2.py3-none-any.whl

  • 安装 Twisted

同理,下载 wheel文件,利用pip安装即可。

如Python 3.5版本,Windows 64位系统,下载Twisted‑19.2.0‑cp35‑cp35m‑win_amd64.whl,然后使用pip安装:

pip instal Twisted‑19.2.0‑cp35‑cp35m‑win_amd64.whl

  • 安装 pywin32

从官方网站下载对应版本的安装包安装即可。

  • 安装 scrapy

最后安装 scrapy即可,依然使用pip,命令如下:

pip instal scrapy

linux 平台: CentOS、RedHat、Fedora

1.安装依赖库 确保一些必须的类库已经安装 , 运行如下命令:

sudo yum groupinstal development tools sudo yum instal python34-devel epel-release libxslt-devel libxml2-devel openssl-devel

2.安装scrapy

pip instal scrapy

Ubuntu、Debian、Deepin平台

1.依赖库安装 首先确保一些必须的类库已经安装 , 运 行如下命令:

sudo apt-get instal build-essential python3-dev libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zliblg-dev 2.安装 Scrapy 利用pip安装 Scrapy即可, 运 行如下命令: pip3 instal1 scrapy

Mac OS平台

1.依赖库安装 在Mac上构建Scrapy的依赖库需要 C编译器以及开发头文件,它一般由Xcode提供, 运 行如下命令安装即可:

xcode-select --instal1 2.安装 scrapy

利用pip安装 scrapy即可, 运 行如下命令:

pip3 instal1 scrapy

验证是否安装成功

安装之后,在命令行下输入scrapy ,如果出现类似下方的结果,就证明Scrapy安装成功。

公众号‘菜鸟名企梦’后台发送“scrapy”即可获取scrapy的pdf安装文档

资料分享

java学习笔记、10T资料、100多个java项目分享


欢迎关注个人公众号【菜鸟名企梦】,公众号专注:互联网求职面经javapython爬虫大数据等技术分享**: 公众号**菜鸟名企梦后台发送“csdn”即可免费领取【csdn】和【百度文库】下载服务; 公众号菜鸟名企梦后台发送“资料”:即可领取5T精品学习资料**、java面试考点java面经总结,以及几十个java、大数据项目资料很全,你想找的几乎都有

转载于:https://juejin.im/post/5cbd75c1e51d456e62545aea

相关文章:

  • java 实现DFA 算法(理论百度搜索)
  • v-lazyload数据变化图片不切换
  • 记录微博爬虫遇到问题
  • 一张思维导图辅助你深入了解 Vue | Vue-Router | Vuex 源码架构
  • SpringBoot Cmd运行Jar文件指定active文件的命令如下
  • JavaScript短信验证码60秒倒计时插件
  • 雷林鹏分享:让nginx支持CodeIgniter框架
  • 看看这些大龄程序员都做了些什么
  • 配置mysql允许远程连接的方法
  • 杂记 -春风十里不如你
  • 用户访问网页的流程原理
  • 重复枚举和不重复枚举
  • c++初级(本人scdn)
  • hibernate5.3版本出现hibernate中The server time zone value“乱码”问题的解决办法。
  • linux测试某进程占用oi、cpu、内存的使用情况
  • 【跃迁之路】【699天】程序员高效学习方法论探索系列(实验阶段456-2019.1.19)...
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • Create React App 使用
  • JavaScript中的对象个人分享
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • maya建模与骨骼动画快速实现人工鱼
  • PHP的类修饰符与访问修饰符
  • SegmentFault 技术周刊 Vol.27 - Git 学习宝典:程序员走江湖必备
  • Spring Cloud中负载均衡器概览
  • UEditor初始化失败(实例已存在,但视图未渲染出来,单页化)
  • 动态魔术使用DBMS_SQL
  • 给github项目添加CI badge
  • 蓝海存储开关机注意事项总结
  • 七牛云假注销小指南
  • 协程
  • 一个项目push到多个远程Git仓库
  • 因为阿里,他们成了“杭漂”
  • PostgreSQL之连接数修改
  • 正则表达式-基础知识Review
  • (1)STL算法之遍历容器
  • (27)4.8 习题课
  • (C++20) consteval立即函数
  • (HAL库版)freeRTOS移植STMF103
  • (补)B+树一些思想
  • (二)fiber的基本认识
  • (蓝桥杯每日一题)love
  • (力扣记录)235. 二叉搜索树的最近公共祖先
  • (四)linux文件内容查看
  • (转)linux 命令大全
  • (转)德国人的记事本
  • (轉貼) VS2005 快捷键 (初級) (.NET) (Visual Studio)
  • .a文件和.so文件
  • .NET DevOps 接入指南 | 1. GitLab 安装
  • .Net Winform开发笔记(一)
  • .NET/C# 编译期能确定的字符串会在字符串暂存池中不会被 GC 垃圾回收掉
  • .NET企业级应用架构设计系列之结尾篇
  • [AX]AX2012 AIF(四):文档服务应用实例
  • [BZOJ1008][HNOI2008]越狱
  • [c++] 单例模式 + cyberrt TimingWheel 单例分析
  • [c++] 自写 MyString 类