当前位置: 首页 > news >正文

Python之Requests库使用总结

概述
Requests是python中一个很Pythonic的HTTP库,用于构建HTTP请求与解析响应

Requests开发哲学

Beautiful is better than ugly.(美丽优于丑陋)
Explicit is better than implicit.(直白优于含蓄)
Simple is better than complex.(简单优于复杂)
Complex is better than complicated.(复杂优于繁琐)
Readability counts.(可读性很重要)
安装
直接安装

pip install requests

简单上手

导入模块

import requests

发送请求

#get
r = requests.get('http://httpbin.org/get')#post
r = requests.post('http://httpbin.org/post', data = {'key':'value'})

通过requests.get或post方法实际发出一个http请求,返回一个response对象,http://httpbin.org是一个可以测试http请求的网站

处理响应

r.text  #返回响应内容主体,Requests 会自动解码来自服务器的内容r.content  #返回二进制的响应内容主体r.json() #处理json的响应内容,返回解码后的dict

构造请求

Requests中requests.get或post这些方法实际都是通过requests.request(method, url, **kwargs)实现的,主要返回response对象,下面主要介绍这个方法的参数

method -- Request对象的请求方法.
url -- 请求的URL.
params -- (可选) 请求的URL查询字符串中要发送的字典或字节.
data -- (可选) 字典或者元组列表[(key, value)] (form-encoded), 字节, 或者文件对象包含在请求主体中发生,主要是post put使用.
json -- (可选) 包含请求主体中的json数据.
headers -- (可选) HTTP首部(请求/通用/实体首部),字典形式.
cookies -- (可选) Dict 或者 CookieJar对象包含在首部cookie字段发送.
files -- (可选) “名称”:类文件对象(或{“名称:file-tuple}”)的字典,用于分段编码上传。 file-tuple可以是2元组(“ filename”,fileobj),3元组(“ filename”,fileobj,“ content_type”)或4元组(“ filename”,fileobj,“ content_type”,custom_headers), 其中,“ content-type”是一个字符串,用于定义给定文件的内容类型,而custom_headers是一个类似dict的对象,其中包含要为该文件添加的其他标题。
auth -- (可选)  用于Basic/Digest/Custom HTTP 认证,元组类型.
timeout (float or tuple) -- (可选)超时时间,在放弃请求之前,等待服务器发送数据的秒数,以浮点数或(连接超时,读取超时)元组为单位.
allow_redirects (bool) -- (可选)布尔值。 启用/禁用GET / OPTIONS / POST / PUT / PATCH / DELETE / HEAD重定向。 默认为True。
proxies -- (可选)字典,代理设置
verify -- (可选)布尔值(在这种情况下,它控制我们是否验证服务器的TLS证书)或字符串(在这种情况下,它必须是要使用的CA捆绑包的路径)。 默认为True。
stream -- (可选) 如果为False,则将立即下载响应内容。
cert -- (可选) 如果为String,则为ssl客户端证书文件(.pem)的路径。 如果是元组,则(“证书”,“密钥”)配对。

GET请求 

requests.get(url, params=None, **kwargs)等价于requests.request('get', url, params=None,**kwargs),**kwargs即上面支持的可选参数

payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.get("http://httpbin.org/get", params=payload)#即向http://httpbin.org/get?key2=value2&key1=value1请求

POST请求
requests.post(url, data=None, json=None, **kwargs)等价于requests.request('post', url, data=None, json=None, **kwargs),**kwargs即上面支持的可选参数

POST提交请求,数据一般是放在HTTP报文主体中,数据编码主要有以下三种方式并在请求首部Content-Type 中指定

application/x-www-form-urlencoded :最常见post提交数据的方式,以form表单形式提交数据。
application/json :以json串提交数据。
multipart/form-data :一般使用来上传文件。

#application/x-www-form-urlencoded,一般form提交payload = {'key1': 'value1', 'key2': 'value2'}r = requests.post("http://httpbin.org/post", data=payload)#application/json,如果使用 json 参数直接传递dict,就会被自动编码等同于json.dumps(payload)。如果使用data参数传递json.dumps(payload),与json参数不同在于前者有Content-Type,后者无payload = {'key1': 'value1', 'key2': 'value2'}r = requests.post("http://httpbin.org/post", json=payload)#multipart/form-data 传文件url = 'http://httpbin.org/post'files = {'file': open('report.xls', 'rb')}r = requests.post(url, files=files)

定制请求头

如果想为请求添加 HTTP 头部,只要简单地传递一个 dict 给 headers 参数就可以了

headers = {'user-agent': 'my-app/0.0.1'}r = requests.get('http://httpbin.org/get', headers=headers)

注意的是如果headers中包含Cookie会覆盖使用cookies参数时传入的dict

传入Cookie

直接将字典类型的cookies传入到cookies参数即可

cookies = dict(cookies_are='working')r = requests.get('http://httpbin.org/get',cookies=cookies)

处理响应

requests方法返回一个response对象

响应内容主体

r = requests.get('http://httpbin.org/get')r.text  #返回响应内容主体,Requests 会自动解码来自服务器的内容r.content  #返回二进制的响应内容主体r.json() #处理json的响应内容,返回解码后的dict

注意:有的中文网站使用r.text时,返回的内容为乱码,实际是自动解码错误了,解决办法主要有

#先返回二进制内容,再根据实际的编码解码r.content.decode("utf-8")#不知道具体编码形式时,可以使用下面方法自动解码r.encoding = r.apparent_encodingr.text

获取响应头部

1.响应头部信息

r.headers

2.获取此响应的原始请求的头部

r.request.headers

响应状态

1.返回状态码

r.status_code

2.响应是400或500类就抛出HTTPError异常

r.raise_for_status()

3返回状态原因

r.reason

 响应内容编码

r.encoding     #从HTTP报文header中猜测的响应内容的编码方式r.apparent_encoding  #从内容中分析响应内容的编码方式(备选编码方式,一般从html<meta>标签中属性charset获取)

需要注意的是

r.encoding:如果header中不存在charset,则认为编码是ISO-8859-1
r.text根据r.encoding显示网页内容
r.apparent_encoding:根据网页内容分析处的编码方式可以看做是r.encoding的备选
其它方法与属性
response对象其它的方法与属性参考,具体可以查看官网地址http://cn.python-requests.org/zh_CN/latest/api.html#requests.Response

apparent_encoding:由html chardet属性表示的编码
close():关闭连接,一般不用
content:二进制内容主体
cookies:返回CookieJar对象
elapsed:从发送请求到响应到达之间经过的时间
encoding:决定.text的编码,从头部获取
headers:响应的头部信息,以字典形式
history:是一个 Response 对象的列表,为了完成请求而创建了这些对象。这个对象列表按照从最老到最近的请求进行排序。主要用在重定向中
is_permanent_redirect:如果此响应是重定向的永久版本之一,则为True。
is_redirect:如果此响应是自动处理后格式正确的HTTP重定向,则为true
links:返回响应的已解析头链接(如果有)。
ok:如果status_code小于400,则返回True。
request:这个响应的原始request对象
url:响应的最终URL
会话对象
有时候可能需要多个请求才能完成任务的情况,比如模拟登录后的请求操作,如果单独用requests去请求的话,就需要将最初的请求响应的cookie或header保存下来并且在后面的请求中都加入,这样比较麻烦。

所以requests提供了个Session对象,用来让你能够跨请求保持某些参数,它也会在同一个 Session 实例发出的所有请求之间保持 cookie,并且向同一主机发送多个请求,底层的 TCP 连接将会被重用,从而带来显著的性能提升。

1.跨请求保持一些 cookie

s = requests.Session()s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = s.get("http://httpbin.org/cookies")print(r.text)
# '{"cookies": {"sessioncookie": "123456789"}}'

2.属性的合并

s = requests.Session()
s.auth = ('user', 'pass')
s.headers.update({'x-test': 'true'})# both 'x-test' and 'x-test2' are sent
s.get('http://httpbin.org/headers', headers={'x-test2': 'true'})

注意的是,只有对象属性才能合并,方法层的参数覆盖则会覆盖

s = requests.Session()r = s.get('http://httpbin.org/cookies', cookies={'from-my': 'browser'})
print(r.text)
# '{"cookies": {"from-my": "browser"}}'r = s.get('http://httpbin.org/cookies')
print(r.text)
# '{"cookies": {}}'

3.前后文管理器

with requests.Session() as s:s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')

这样就能确保with区块退出后会话能被关闭,即使发生了异常也一样

总结:

感谢每一个认真阅读我文章的人!!!

作为一位过来人也是希望大家少走一些弯路,如果你不想再体验一次学习时找不到资料,没人解答问题,坚持几天便放弃的感受的话,在这里我给大家分享一些自动化测试的学习资源,希望能给你前进的路上带来帮助。

软件测试面试文档

我们学习必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

 

相关文章:

  • 随机梯度下降的代码实现
  • git patch和使用
  • excel数据重复率怎么计算【保姆教程】
  • Linux(20):软件安装:原始码与 Tarball
  • 【Spring Boot】如何在IntelliJ IDEA中由同一份spring boot源码运行多个不同端口的实例
  • 3.4 路由器的DHCP配置
  • 从零开发短视频电商 AWS OpenSearch Service开发环境申请以及Java客户端介绍
  • PHP基础(4)
  • scala表达式
  • 洛谷 P8802 [蓝桥杯 2022 国 B] 出差
  • List截取指定长度(java截取拼接URL)
  • Anaconda建虚拟环境并在jupyter中打开
  • 前端知识库Html5和CSS3
  • ubuntu server 20.04 备份和恢复 系统 LTS
  • 【VRTK】【VR开发】【Unity】11-甩臂移动
  • 网络传输文件的问题
  • 77. Combinations
  • CentOS 7 防火墙操作
  • CentOS7 安装JDK
  • CentOS从零开始部署Nodejs项目
  • css布局,左右固定中间自适应实现
  • Idea+maven+scala构建包并在spark on yarn 运行
  • java2019面试题北京
  • js继承的实现方法
  • Python 基础起步 (十) 什么叫函数?
  • spring boot 整合mybatis 无法输出sql的问题
  • VirtualBox 安装过程中出现 Running VMs found 错误的解决过程
  • 记一次用 NodeJs 实现模拟登录的思路
  • 将 Measurements 和 Units 应用到物理学
  • 蓝海存储开关机注意事项总结
  • 我建了一个叫Hello World的项目
  • 详解移动APP与web APP的区别
  • 学习笔记TF060:图像语音结合,看图说话
  • 怎样选择前端框架
  • 如何在 Intellij IDEA 更高效地将应用部署到容器服务 Kubernetes ...
  • ​configparser --- 配置文件解析器​
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • #数学建模# 线性规划问题的Matlab求解
  • #我与Java虚拟机的故事#连载09:面试大厂逃不过的JVM
  • (arch)linux 转换文件编码格式
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (solr系列:一)使用tomcat部署solr服务
  • (定时器/计数器)中断系统(详解与使用)
  • (五)Python 垃圾回收机制
  • (转)程序员技术练级攻略
  • .NET Core 2.1路线图
  • .net php 通信,flash与asp/php/asp.net通信的方法
  • .NET Standard / dotnet-core / net472 —— .NET 究竟应该如何大小写?
  • .NET/C# 避免调试器不小心提前计算本应延迟计算的值
  • .Net中的集合
  • .sdf和.msp文件读取
  • .vue文件怎么使用_vue调试工具vue-devtools的安装
  • @TableLogic注解说明,以及对增删改查的影响
  • [ vulhub漏洞复现篇 ] Jetty WEB-INF 文件读取复现CVE-2021-34429
  • [AUTOSAR][诊断管理][ECU][$37] 请求退出传输。终止数据传输的(上传/下载)