回复“资源”即可获赠Python学习资料
大家好,我是皮皮。
前几天在Python钻石交流群【海南菜同学】问了一个Python
网络爬虫的处理问题,提问截图如下:
像这样子,现在是使用多条xpath
规则一条一条取数据,是不是有更快捷的方法,通过一个xpath
规则,一次性提取这几个位置的标签然后打印出来呢?
其实他自己也查到了,使用|
号确实可以获取多个。
不过后来他还是遇到了另外一个问题,如下图所示:
这个问题就更加基础了,其实就是变量的命名规则问题,导致语法错误。正确的命名规则是英文字母、数字、下划线,并且不能以数字开头。当然了,大Python
里边也是支持中文命名的。
针对网页数据提取,一方面是考虑到提取速度,另外一方面也需要考虑到后续的存储,尤其是针对网页结构可能有变化的网页,就更加难顶了。
不同的字段,分开进行提取,针对性更强。
大家好,我是皮皮。这篇文章主要盘点了一个Python
网络爬虫的问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【海南菜同学】提问,感谢【dcpeng】、【瑜亮老师】、【🌑中华小矿工】、【猫药师Kelly】给出的思路和代码解析,感谢【【冫马讠成】等人参与学习交流。
有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。
------------------- End -------------------
联系客服