脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - python中requests库安装与使用详解

python中requests库安装与使用详解

2022-07-07 10:16米兔-miny Python

requests是一个很实用的Python HTTP客户端库,爬虫和测试服务器响应数据时经常会用到,下面这篇文章主要给大家介绍了关于python中requests库安装与使用的相关资料,需要的朋友可以参考下

前言

记得我刚学python-requests库的时候总会有点晕,于是我做了以下关于requests库的知识点整理,方便初学者可以更好的了解requests库。如果有补充或错误,或者不懂的地方,可以评论区留言。

1、Requests介绍

Requests是Python一个很实用的HTTP客户端,完全满足如今网络爬虫的需求

urllib库和requests库功能类似,但requests库功能更多更实用

2、requests库的安装

pip命令安装(方法一)

  • windows操作系统:pip install requests
  • Mac操作系统:pip3 install requests
  • Linux操作系统:sodo pip install requests

源码安装(方法二)

  • 下载 requests源码 http://mirrors.aliyun.com/pypi/simple/ requests/
  • 下载文件到本地之后,解压到Python安装目录,之后打开解压文
  • 运行命令行输入python setup.py install 即可安装

测试

  • import requests
  • 如果没提示错误,那说明已经安装成功了!

3、requests库常用的方法

序号

方法

描述

1

requests.request(url)

构造一个请求,支持以下各种方法

2

requests.get()

发送一个Get请求

3

requests.post()

发送一个Post请求

4

requests.head()

获取HTML的头部信息

5

requests.put()

发送Put请求

6

requests.patch()

提交局部修改的请求

7

requests.delete()

提交删除请求

最常用的方法为get()和post()分别用于发送Get请求和Post请求

4、response对象的常用属性

序号

属性或方法

描述

1

response.status_code

响应状态码

2

response.content

把response对象转换为二进制数据

3

response.text

把response对象转换为字符串数据

4

response.encoding

定义response对象的编码

5

response.cookie

获取请求后的cookie

6

response.url

获取请求网址

7

response.json()

内置的JSON解码器

8

Response.headers

以字典对象存储服务器响应头,字典键不区分大小写

5、使用requests发送get请求

  • 不带参数的get请求
    • 案例:爬取百度主页
  • 带参数的get请求
    • 案例:贴吧
  • 获取JSON数据
    • 案例:百度美女图片
  • 获取二进制数据
    • 案例:下载百度logo

5.1  不带参数的get请求

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 不带参数的get请求
 
import requests
url='http://www.baidu.com'
resp = requests.get(url)
# 设置响应的经编码格式
resp.encoding='utf-8'
cookie=resp.cookies    # 获取请求后的cookie信息
headers=resp.headers
print('响应状态码:', resp.status_code)
print('请求后的cookie:', cookie)
print('获取请求的网址:', resp.url)
print('响应头:', headers)
print('响应内容', resp.text)
----------------------------------以下为输出结果----------------------------------
'''
响应状态码: 200
请求后的cookie: <RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>]>
获取请求的网址: http://www.baidu.com/
响应头: {'Cache-Control': 'private, no-cache, no-store, proxy-revalidate, no-transform', 'Connection': 'keep-alive', 'Content-Encoding': 'gzip', 'Content-Type': 'text/html', 'Date': 'Fri, 23 Apr 2021 00:10:35 GMT', 'Last-Modified': 'Mon, 23 Jan 2017 13:28:16 GMT', 'Pragma': 'no-cache', 'Server': 'bfe/1.0.8.18', 'Set-Cookie': 'BDORZ=27315; max-age=86400; domain=.baidu.com; path=/', 'Transfer-Encoding': 'chunked'}
响应内容 <!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equiv=content-type.........
'''

5.2 带参数的get请求

5.2.1 查询参数params

  • params,数据类型为字典
  • 作用:对URL地址中的查询参数自动进行编码拼接
  • 使用示例:resp = requests.get(url=baseurl, params=params, headers=headers)
?
1
2
3
4
5
6
7
8
9
# 带参数的get请求
 
import requests
url = 'https://tieba.baidu.com/f?'
params = {'kw':'大学吧', 'pn':'3'}
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; WOW64)'}
# 开始请求
html = requests.get(url=url, params=params, headers=headers).text
print(html)

5.2.2 SSL证书认证参数 verify

  • 参数值:True(默认)| False
  • 适用网站:https类型网站但是没有经过 证书认证机构 认证的网站
  • 适用场景:当程序中抛出SSLError异常则考虑使用此参数
  • 使用示例:requests.get(url=url,headers=headers,verify=False)
  • 当verify参数设置为False时,则不会再对网站进行SSL证书认证

5.2.3 设置超时时间 timeout

我们可以通过timeout属性设置超时时间,一旦超过这个时间还没获得响应内容,就会提示错误。

?
1
2
3
4
5
6
7
import requests
requests.get('http://github.com', timeout=0.001)
 
---------------------以下为输出结果(报错)---------------------
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
requests.exceptions.Timeout: HTTPConnectionPool(host='github.com', port=80): Request timed out. (timeout=0.001)

5.2.4 代理IP参数 proxies

5.2.4.1 免费代理IP

  • 语法格式:proxies = { '协议':'协议://IP:端口号'}
  • 示例:
    • python中requests库安装与使用详解
    • 当我们抓取的地址为http时,则会选择proxies中http的代理,反之为https
?
1
2
3
4
5
6
7
8
9
10
11
import requests
 
url = 'http://httpbin.org/get'
headers = {'User-Agent':'Mozilla/5.0'}
# 定义代理,再代理IP网站中查找免费代理IP
proxies = {
    'http':'http://112.85.164.220:9999',
    'https':'https://112.85.164.220:9999'
}
html = requests.get(url=url,proxies=proxies,headers=headers,timeout=5).text
print(html)

5.2.4.1 私密代理和独享代理

语法格式:proxies = { '协议':'协议://用户名:密码@IP:端口号'}

示例:

python中requests库安装与使用详解

5.3 获取JSON数据

?
1
2
3
4
5
6
7
8
9
10
11
# 获取json数据
 
# 案例:百度获取宫崎骏动漫图片
# 滑动页面,URL没变化,F12中的文件越来越多,说明这是动态网页
# 选择XHR中的一个,复制其Request URL,粘贴给url
 
import requests
url='https://image.baidu.com/search/acjson?tn=resultjson_com&logid=10167214135414424439&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%AE%AB%E5%B4%8E%E9%AA%8F%E5%8A%A8%E6%BC%AB%E5%9B%BE%E7%89%87&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=&copyright=&word=%E5%AE%AB%E5%B4%8E%E9%AA%8F%E5%8A%A8%E6%BC%AB%E5%9B%BE%E7%89%87&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=&fr=&expermode=&force=&pn=30&rn=30&gsm=1e&1619134335166='
resp=requests.get(url)
json_data=resp.json()
print(json_data)

5.4 获取二进制数据

一般来说,对于非文本请求,可以以字节形式访问响应正文。

?
1
2
3
4
5
6
7
8
9
10
# 获取二进制数据
 
# 案例:保存百度图片
import requests
url='https://www.baidu.com/img/bd_logo1.png'
resp=requests.get(url)
# 存储
with open('logo.png','wb') as file:
    # resp.content:把response对象转换为二进制数据
    file.write(resp.content)

6、使用requests发送post请求

  • 语法结构
    • requests.post(url, data=None, json=None)
  • 参数说明
    • url:需要爬取的网站的网址
    • data:请求数据
    • json:json格式的数据
  • 案例:登录小说楼
    • https://www.xslou.com/login.php
?
1
2
3
4
5
6
7
import requests
url='https://www.xslou.com/login.php'
data={'username':'18600605736', 'password':'57365736', 'action':'login'}
resp = requests.post(url,data)
resp.encoding='gb2312'
print('响应状态码:', resp.status_code)   # 200
print('响应内容', resp.text)        # <html>......</html>

7、使用requests的session发送请求

?
1
2
3
4
5
6
7
8
9
import requests
url='https://www.xslou.com/login.php'
data={'username':'18600605736', 'password':'57365736', 'action':'login'}
 
# 使用session发送请求
session = requests.session()
resp=session.post(url,data=data)    # 使用session发送post请求
resp.encoding='gb2312'
# print( resp.text)        # <html>..<title>登录成功</title>....</html>

总结

到此这篇关于python中requests库安装与使用的文章就介绍到这了,更多相关python requests库详解内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_45932368/article/details/121508547

延伸 · 阅读

精彩推荐
  • Python基于Python的关键字监控及告警

    基于Python的关键字监控及告警

    这篇文章主要为大家详细介绍了基于Python的关键字监控及告警,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    伟成6012020-11-24
  • PythonPython的Django框架下管理站点的基本方法

    Python的Django框架下管理站点的基本方法

    这篇文章主要介绍了Python的Django框架下管理站点的基本方法,需是Django站点部署的基础,要的朋友可以参考下...

    Python教程网3822020-07-24
  • Python解析目标检测之IoU

    解析目标检测之IoU

    Intersection over Union(IoU)是一种测量在特定数据集中检测相应物体准确度的一个标准。IoU是一个简单的测量标准,只要是在输出中得出一个预测范围(boundi...

    黑暗星球6602021-12-09
  • Pythonpython+opencv识别图片中的圆形

    python+opencv识别图片中的圆形

    这篇文章主要为大家详细介绍了python+opencv识别图片中的圆形 ,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 ...

    Tina_Wei16862021-01-25
  • PythonPython实现的质因式分解算法示例

    Python实现的质因式分解算法示例

    这篇文章主要介绍了Python实现的质因式分解算法,涉及Python数学运算相关操作技巧,需要的朋友可以参考下...

    grey_csdn12472021-02-15
  • PythonPython获取某一天是星期几的方法示例

    Python获取某一天是星期几的方法示例

    这篇文章主要介绍了Python获取某一天是星期几的方法,结合完整实例形式分析了Python针对日期与时间的相关计算技巧,需要的朋友可以参考下...

    finallyly10362020-09-18
  • Pythonpython矩阵/字典实现最短路径算法

    python矩阵/字典实现最短路径算法

    这篇文章主要为大家详细介绍了python矩阵/字典实现最短路径算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    your_answer11422021-05-18
  • Pythonpython数学建模(SciPy+Numpy+Pandas)

    python数学建模(SciPy+Numpy+Pandas)

    这篇文章主要介绍了python数学建模(SciPy+Numpy+Pandas),文章基于python的相关资料紧接上一篇文章内容展开主题详情,需要的小伙伴可以参考一下...

    lxw-pro8862022-07-04