打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python 异步加载XHR数据抓取

对于有的网页,我们滑动滚轮或者点击下一页,我们发现网址url没有发生变化,我们称这些网页为动态网页

因此,我们需要F12开发者工具,选中Network--XHR不断滑动滚轮或者点击下一页,我们就会发现网页中的内容就隐藏在XHR里面。

但要注意网页的请求方式GET还是POST

GET和POST是不一样的, GET的数据在请求链接中是可以直接看见的。我们可以在浏览器中输入内容所在的链接,是有内容返回的,而POST则不能。

下面以今日头条图片网页和美团外卖评论网页作为对比进行分析。

注意:

所有的url都是XHR下的链接,去掉多余的参数。

今日头条图片

美团外卖评论

如果是GET请求:

则需要利用from urllib.parse import urlencode构造完整的请求url。

如果是POST请求:

美团外卖

则不需要构造完整请求url,但需要通过POST传入参数。注意,有时需要将传入的parameters参数转为字符串,借助json.dumps()。因为在Python中,没有json类型的数据,实质上json数据是字符串。

华为商城

因为提交的数据是字符串,所以我们需要借助json.dumps(),将字典dict类型数据转换为字符串,因此需要对这数据类型进行判断。

下图是华为商城评论页面网址所要提交的数据:


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
python测试开发django-130.jQuery中$.ajax()方法发GET/POST/DELETE请求
Ajax第一阶段学习
AJAX原理及常见面试题
qt与ajax通信,AJAX发送GET和POST请求
基于Promise实现对Ajax的简单封装
谁说同花顺很难爬?一文带你学会用Python爬取财经动态网页!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服