打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python学习工具:9个用来爬取网络站点的 Python 库

Python学习工具 :总结了9个用来爬取网络站点的Python 库,有你在用的吗

Scrapy

一个开源和协作框架,用于从网站中提取所需的数据。 以快速,简单,可扩展的方式。

cola

一个分布式爬虫框架。

Demiurge

基于 PyQuery 的爬虫微型框架。

feedparser

通用 feed 解析器。

Grab

Grab 是一个用于构建 Web scraper 的 python 框架。 使用 Grab,您可以构建各种复杂性的 Web scraper,从简单的5行脚本到处理数百万个 Web 页面的复杂异步网站爬虫。 Grab 提供用于执行网络请求和处理所接收内容的 API。 与 HTML 文档的 DOM 树交互。

MechanicalSoup

用于自动和网络站点交互的 Python 库。

portia

Scrapy 可视化爬取。允许你在不需要任何编程知识的情况下直观地抓取网站。 使用 Portia 可以注释一个网页以识别您想要提取的数据,Portia 将根据这些注释了解如何从类似页面中抓取数据。

pyspider

一个强大的爬虫系统。

RoboBrowser

一个简单的,Python 风格的库,用来浏览网站,而不需要一个独立安装的浏览器。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
十个Python爬虫武器库示例,十个爬虫框架,十种实现爬虫的方法!
这儿有8个最实用的Python爬虫框架,你了解过他吗?附爬虫教程
7款好用的Python爬虫框架!
哪些Python库让你拍案叫绝,相识见晚?
python大神们!都在用的什么爬虫工具呢?
走近代码之Python–爬虫框架Portia | 艾伯特
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服