当前位置: 首页 > news >正文

Python 采集相关设定

前言

手上有个项目,采集国外物流信息,本来想用PHP,后来想想还是用时下热门的python跑采集试试吧

准备

安装Python v2.7.14
https://www.python.org/downloads/windows/

装好后修改pip源

在%USERPROFILE%目录里创建pip文件夹,在这个文件夹里新建pip.ini文件,内容如下

[global]
index-url=https://pypi.douban.com/simple
[list]
format=columns

这样就是使用国内豆瓣源,然后就可以愉快的安装插件了

PIP 常用采集库

pip install scrapy requests beautifulsoup4

MySQL-Python

https://pypi.python.org/pypi/MySQL-python

自动更新包脚本

import pip
from subprocess import call

for dist in pip.get_installed_distributions():
    call("pip install --upgrade " + dist.project_name, shell=True)

尾声

requests抓数据好方便啊,比urllib1、2高级100倍

Requests中文文档 http://docs.python-requests.org/zh_CN/latest/user/install.html

To be continue…….

相关文章:

  • 从MTK的scat文件谈ROM和RAM的分配,管理和问题解决
  • MTK资源管理和问题解决
  • 基于树莓派使用DuerOS的笔记,待续
  • 树莓派、百度DuerOS等RAW格式的镜像浏览、提取文件的方法
  • 几个常见的C语言面试题分析
  • Linux定期备份mysql
  • MTK基于基站和小区的定位技术研究
  • 第一次交叉编译基于群晖 213j(CPU:Armada 370)的iperf过程
  • MTK界面设计中消除PNG图片的杂色背景
  • 知道这20个正则表达式,能让你少写1,000行代码
  • MTK一些有用的层函数
  • 基于SWOOLE的分布式SOCKET消息服务器架构
  • MTK的铃声修改与替换
  • 基于SWOOLE的高可用分布式SOKET服务器系统搭建V2.0
  • 美化MTK的拨号窗口
  • [译]前端离线指南(上)
  • 08.Android之View事件问题
  • ComponentOne 2017 V2版本正式发布
  • EOS是什么
  • Java,console输出实时的转向GUI textbox
  • laravel5.5 视图共享数据
  • nginx(二):进阶配置介绍--rewrite用法,压缩,https虚拟主机等
  • PHP 7 修改了什么呢 -- 2
  • Redis的resp协议
  • socket.io+express实现聊天室的思考(三)
  • v-if和v-for连用出现的问题
  • Yeoman_Bower_Grunt
  • 纯 javascript 半自动式下滑一定高度,导航栏固定
  • 技术胖1-4季视频复习— (看视频笔记)
  • 开源SQL-on-Hadoop系统一览
  • 前端工程化(Gulp、Webpack)-webpack
  • 前端知识点整理(待续)
  • 实习面试笔记
  • 使用 @font-face
  • 数据可视化之 Sankey 桑基图的实现
  • 移动端唤起键盘时取消position:fixed定位
  • 追踪解析 FutureTask 源码
  • 关于Kubernetes Dashboard漏洞CVE-2018-18264的修复公告
  • ​Java基础复习笔记 第16章:网络编程
  • ​LeetCode解法汇总307. 区域和检索 - 数组可修改
  • # 透过事物看本质的能力怎么培养?
  • #14vue3生成表单并跳转到外部地址的方式
  • (LNMP) How To Install Linux, nginx, MySQL, PHP
  • (超简单)使用vuepress搭建自己的博客并部署到github pages上
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)ssm户外用品商城 毕业设计 112346
  • (附源码)计算机毕业设计ssm基于Internet快递柜管理系统
  • (规划)24届春招和25届暑假实习路线准备规划
  • (力扣题库)跳跃游戏II(c++)
  • (十)c52学习之旅-定时器实验
  • (十三)Maven插件解析运行机制
  • (十一)图像的罗伯特梯度锐化
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (原創) 博客園正式支援VHDL語法著色功能 (SOC) (VHDL)