打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
头条视频的数据隐藏的好深啊!隐藏的再深也逃不过Python的法眼!

目标情况

这次我们的目标网站,是ajax加载的数据,首先,打开网页后,直接用浏览器(火狐)自带的开发者工具,点击网络,然后下滑网页,点击xhr,找到json数据,可以看到大概有100条内容!私信小编007即可获取数十套PDF哦!

里面有每一个视频的相关信息,我们只需要取出每一个视频的url即可!然后在去看看详情页的情况

有没有发现,在url中的关键字,是存在于网页源代码中的,虽然不是完全一样,但是我们可以和前面的那个标签中内容,对比下

可以判定,这里的值就是网页渲染后出现在html标签中的值,而且在源代码中它存在2个不同格式的视频地址!,这就很简单了,我们来写代码吧!

代码实现

简单写了一下,直接用requests请求内容,然后用re匹配,取出目标url

类似网站

用关键字在源代码中查找

最终代码

验证结果

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
如何编写python脚本?教你做简单的爬虫,适合初学者
爬虫笔记——东方财富科创板数据爬取(requests方法)
python如何从零写一个爬虫
Python入门(一):爬虫基本结构&简单实例
爬虫必备工具,掌握它就解决了一半的问题
抓取在线源元素代码的软件(抓取网站源代码)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服