打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
无需编程,用Excel中的Powerquery爬取网页上的多页表格
in GetResults前面我有一篇教程爬虫何必用Python,用EXCEL爬取网页上的多页表格,里面说到了用EXCEL 加简单的VBA,爬取多页表格,今天我教大家如何用Excel Powerquery来爬取多页表格,这次的爬取目标还继续用上次的网站:http://www.eiken-kk.com/scripts/eng/eng_kekka.asp?mv=PREVIOUS&rec=31&search=1&tol=1111&val=C-
  1. 新建查询

新建查询

2.输入网址然后点确定

输入网址

3.网站加载完毕,点击编辑

点击编辑

4.点击视图-高级编辑器

高级编辑器

5.修改程序

程序界面

将上图程序开始和结束的位置分别添加"let GetResults=(URL) =>"和"in GetResults",并将要抓取的网址改为URL,修改后的程序如下

完成后点击已完成。

let GetResults=(URL) =>

let

源 = Web.Page(Web.Contents(URL)),

Data1 = 源{1}[Data],

更改的类型 = Table.TransformColumnTypes(Data1,{{"CLICK", Int64.Type}, {"FILTER TYPE", type text}, {"VIC No.", type text}, {"OEM No.", type text}})

in

更改的类型

in GetResults

6.将名称table1改为vicfilter

7.完成后点击关闭后上载

点击已完成后

7.在表格中构造112页的网站链接(不懂可以参见上次的教程),并点击数据从表格

构造链接

10.点击添加-自定义列

添加自定义列

11.输入公式=vicfilter([URL]),点击确定

添加自定义列

12.点击继续,并忽略隐私检查,点保存

继续

隐私检查

13.点击扩展,然后点击确定

点击扩展

14.爬取成功,点击关闭并上载 ,速度杠杠的,比VBA的方法快上好几倍

爬取完成

好了教程就到这里了,有点长。。。如果有任何错误的地方还望指正,^_^

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
PowerBI在线刷新遇到"动态数据源"报错?简单一步轻松避开
设置关键词URL的两种方法
适合做网站优化的blog程序推荐
node.js静态资源访问
Excel如何获取实时股票数据
power BI 天气数据爬取
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服