大家好,我是皮皮。
前几天在Python钻石交流群【花间一壶酒】问了一个Python
网络爬虫的问题,这里拿出来给大家分享下。
截图如下:
看上去有加密参数:
使用爬虫工具得到的结果不是预期的。
这里【吴大佬】给了一个思路,使用selenium
可以搞定,代码如下:
from selenium import webdriver
from selenium.webdriver.common.by import By
url = 'http://ggzyjy.baiyin.gov.cn/InfoPage/TradeInfomation.aspx?state=3'
browser = webdriver.Chrome()
browser.get(url)
li_list = browser.find_elements(By.XPATH, '//ul[@id="tradMainWrap"]/li')
for li in li_list:
url_detail = li.find_element(By.XPATH, './a').get_attribute('href')
print(url_detail)
顺利地解决了粉丝的问题。
后来【甯同学】经验丰富,看出了代码的问题,给了一个提示,入下图所示。
将请求的字典,修改为字符串,然后就出来对应的请求结果了,真是太强了!
大家好,我是皮皮。这篇文章主要盘点了一个Python
网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【花间一壶酒】提问,感谢【吴大佬】和【甯同学】给出的思路和代码解析,感谢【eric】、【未央.】等人参与学习交流。
------------------- End -------------------
联系客服