打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
前辈们,问个XPATH的问题,如何能在一个页面内一次性提取多个数据?

回复“资源”即可获赠Python学习资料

金灶初开火,仙桃正发花。

大家好,我是皮皮。

一、前言

前几天在Python钻石交流群【海南菜同学】问了一个Python网络爬虫的处理问题,提问截图如下:

像这样子,现在是使用多条xpath规则一条一条取数据,是不是有更快捷的方法,通过一个xpath规则,一次性提取这几个位置的标签然后打印出来呢?

二、实现过程

其实他自己也查到了,使用|号确实可以获取多个。

不过后来他还是遇到了另外一个问题,如下图所示:

这个问题就更加基础了,其实就是变量的命名规则问题,导致语法错误。正确的命名规则是英文字母、数字、下划线,并且不能以数字开头。当然了,大Python里边也是支持中文命名的。

这里【甯同学】和【dcpeng】都指出了这个问题。

针对网页数据提取,一方面是考虑到提取速度,另外一方面也需要考虑到后续的存储,尤其是针对网页结构可能有变化的网页,就更加难顶了。

不同的字段,分开进行提取,针对性更强。

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【海南菜同学】提问,感谢【dcpeng】、【瑜亮老师】、【🌑中华小矿工】、【猫药师Kelly】给出的思路和代码解析,感谢【【冫马讠成】等人参与学习交流。

有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Python爬虫入门,掌握这1234点,总结
采集规则如何排错?
Python爬虫工具篇 - 必会用的6款Chrome插件
第一个最基础的Python程序
实战|手把手教你用Python爬虫(附详细源码)
PYTHON极简主义爬虫——豆瓣图书爬取实战
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服