打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
PuppeteerSharp读取页面完整HTML(.NetCore)

1.使用NUGET安装PuppeteerSharp

通过工具或者命令方式安装

2.初始化浏览器

await new BrowserFetcher().DownloadAsync(BrowserFetcher.DefaultRevision);

3.具体代码

using (Browser browser = await Puppeteer.LaunchAsync(new LaunchOptions { Headless = true })){    using (var page = await browser.NewPageAsync())    {        //设置浏览器的页面大小        await page.SetViewportAsync(new ViewPortOptions        {            Width = 1024,            Height = 768        });        await page.GoToAsync("http://www.baidu.com");        var html = await page.GetContentAsync();        var sourceFile = "";        var memoryStream = new MemoryStream(Encoding.Default.GetBytes(html));        var sr = new StreamReader(memoryStream);        sourceFile = sr.ReadToEnd();                //针对源代码进行分析        sr.Close();                //将页面保存为图片        //await page.ScreenshotAsync(@"D:\1.png",        //    new ScreenshotOptions() { FullPage = true, Type = ScreenshotType.Png });    }}
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Python Playwright API使用实例详解
Playwright上手学习
Puppeteer 入门与实战
.NET中实现HTML生成图片或PDF的几种方式
Puppeteer Sharp: 使用C#和Headless Chrome爬网页
Chromium扩展(Extension)机制简要介绍和学习计划
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服