打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
python岂止于强大,22行代码实现资源大咖,抓取整站最新资源!

利用Python去爬了某个资源网,主要是爬最新的资源。经过测试,只要是用相同模板的网站都可以爬。

其实很多网站都差不多,随便写个正则想爬什么都可以。我已经把脚本挂到服务器了,调用接口就可以得到我们爬取的内容。

我把自己的接口发出来,大家如果有需要可以用:(私信小编007获取大量python学习资料)

http://hh52.cn:6600/zyw/ziyuan/

(希望不是很多人用,不然我9块5的服务器是挺不住的)

代码可以看看,都写有注释,有很多可以拓展的,有时间我也还拓展。

import requests,time,re #一共三个模块,没装的先装 #学习群号码前面548中间377后面875def zyw(): while(True): url='https://www.525zyw.com/' #爬的网站URL html=requests.get(url).text #获取网站的首页源代码 re_url=re.findall('
  • (.*?)
    .*?
  • ',html,re.S) #比配最新资源 list_r='' for i in re_url: tiem=re.findall('.*?>(.*?).*?',i,re.S)[0] #这里的四个正则主要是进一步的提取我们需要的东西 src=re.findall('.*?
    .*?',i,re.S)[0] # href=re.findall('.*?%s
    %s
    '%(tiem,url,src,url,href,title,title) list_r=list_r+res #经过上面的拼接,这里是所有的内容加入一个字符串 f=open('./templates/zyw.html','w') #打开文件 f.write(list_r) #把字符串写入文件 f.close() time.sleep(3600) #这里是每隔1个小时去爬一次,测试时先注释掉 if __name__ == '__main__': zyw() #调用

    效果展示:

    本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
    打开APP,阅读全文并永久保存 查看更多类似文章
    猜你喜欢
    类似文章
    【热】打开小程序,算一算2024你的财运
    零代码编程:用ChatGPT提取新闻网站上的文本
    30行Python爬虫代码爬取淘女郎网美女图,哇太多了,我U盘要满了
    Python工作常用工具
    靠谱兼职:新手如何快速搭建属于自己的电影网站并实现盈利?
    Mango的2020总结与2021展望
    一文读懂 Python web 框架和 web 服务器之间的关系
    更多类似文章 >>
    生活服务
    热点新闻
    分享 收藏 导长图 关注 下载文章
    绑定账号成功
    后续可登录账号畅享VIP特权!
    如果VIP功能使用有故障,
    可点击这里联系客服!

    联系客服