Crawler之Scrapy：Python实现scrapy框架爬虫两个网址下载网页内容信息

打开APP

未登录

开通VIP，畅享免费电子书等14项超值服

开通VIP

首页

好书

留言交流

下载APP

联系客服

Crawler之Scrapy：Python实现scrapy框架爬虫两个网址下载网页内容信息

userphoto

处女座的程序猿 >《待分类》

2021.09.28

关注

Crawler之Scrapy：Python实现scrapy框架爬虫两个网址下载网页内容信息

输出结果

后期更新……

实现代码

import scrapy
class DmozSpider(scrapy.Spider): 
    name ="dmoz" 
    allowed_domains = ["dmoz.org"] 
    start_urls = [
        "https://dmoztools.net/Computers/Programming/Languages/Python/Resources/"
        "https://dmoztools.net/Computers/Programming/Languages/Python/Books/"
        ]
    def parse(self,response): 
        filename = response.url.split("/")[-2] 
        with open(filename, 'wb') as f:  
            f.write(response.body)

相关文章
Scrapy：Python实现scrapy框架爬虫两个网址下载网页内容信息

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。

打开APP，阅读全文并永久保存查看更多类似文章

猜你喜欢

类似文章

【热】打开小程序，算一算2024你的财运

Python网络爬虫入门到实战

Python爬虫与Web开发库总结

小白学 Python 爬虫（36）：爬虫框架 Scrapy 入门基础（四） Downloader Middleware

Python——网络爬虫

使用Scrapy构建一个网络爬虫

开源网络爬虫汇总（Java、Python、C……）

更多类似文章 >>

生活服务

热点新闻

分享收藏导长图关注下载文章

绑定账号成功
后续可登录账号畅享VIP特权！

如果VIP功能使用有故障，
可点击这里联系客服！

联系客服