打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息


输出结果

后期更新……

实现代码

import scrapy
class DmozSpider(scrapy.Spider): 
    name ="dmoz" 
    allowed_domains = ["dmoz.org"] 
    start_urls = [
        "https://dmoztools.net/Computers/Programming/Languages/Python/Resources/"
        "https://dmoztools.net/Computers/Programming/Languages/Python/Books/"
        ]
    def parse(self,response): 
        filename = response.url.split("/")[-2] 
        with open(filename, 'wb') as f:  
            f.write(response.body) 

相关文章
Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Python网络爬虫入门到实战
Python爬虫与Web开发库总结
小白学 Python 爬虫(36):爬虫框架 Scrapy 入门基础(四) Downloader Middleware
Python——网络爬虫
使用Scrapy构建一个网络爬虫
开源网络爬虫汇总(Java、Python、C……)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服