2024 一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、selenium:
https://www.bilibili.com/video/BV1Ju4y1Y7k6/
Requests是一个优秀的Http开发库,支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 URL 和 POST 数据自动编码等
开源地址:
https://github.com/psf/requests
中文官方文档:
https://requests.readthedocs.io/projects/cn/zh_CN/latest/
request安装:
pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple
helloWorld测试:
import requests
r = requests.get("http://www.baidu.com")
# 设置返回对象的编码
r.encoding = "utf-8"
# 返回响应状态码
print(r.status_code)
# 获取网页内容
print(r.text)
# 查看返回对象类型
print(type(r))