C#使用PuppeteerSharp库的示例代码

 更新时间:2023年12月07日 09:38:55   作者:rjcql  
PuppeteerSharp 是一个用于在 .NET 平台上控制无头(Headless) Chrome 浏览器的库,本文主要为大家详细介绍了C#中使用PuppeteerSharp库的工具类,需要的可以了解下

写在前面

类库介绍:PuppeteerSharp 是一个用于在 .NET 平台上控制无头(Headless) Chrome 浏览器的库。它允许开发者通过编程方式模拟浏览器行为,执行网页操作,截取网页截图,获取网页内容,可以把网页转换成PDF等等。PuppeteerSharp 是 Puppeteer 在 .NET 环境中的等效实现,Puppeteer 是由 Google 提供的一个用于控制无界面浏览器 Chrome 的工具。

老规矩通过NuGet进行安装

代码实现

        public static async void DoScreenshot(string url)
        {
            using var browserFetcher = new BrowserFetcher();
            await browserFetcher.DownloadAsync();
            await using var browser = await Puppeteer.LaunchAsync(new LaunchOptions { Headless = true });
            await using var page = await browser.NewPageAsync();
            await page.SetViewportAsync(new ViewPortOptions
            {
                Width = 1920,
                Height = 1080
            });
            await page.GoToAsync(url);
            var picPath = Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "test.jpg");
            await page.ScreenshotAsync(picPath);
            await browser.CloseAsync();
        }
 
        public static async void ExportAsPdf(string url)
        { 
            using var browserFetcher = new BrowserFetcher();
            await browserFetcher.DownloadAsync();
            await using var browser = await Puppeteer.LaunchAsync(new LaunchOptions { Headless = true });
            await using var page = await browser.NewPageAsync();
            await page.GoToAsync(url);
            //等待字体加载完毕
            await page.EvaluateExpressionHandleAsync("document.fonts.ready");
            var pdfPath = Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "test.pdf");
            await page.PdfAsync(pdfPath);
            await browser.CloseAsync();
        }
 
        public static async void FetchUrls(string url)
        {
            //浏览器配置
            var options = new LaunchOptions { Headless = true };
            await new BrowserFetcher().DownloadAsync();
 
            //打开浏览器
            using (var browser = await Puppeteer.LaunchAsync(options))
            using (var page = await browser.NewPageAsync())
            {
                //加载页面
                await page.GoToAsync(url);
                var urlList = new List<string>();
                //获取所有超链接
                var jsSelectAllAnchors = @"Array.from(document.querySelectorAll('a')).map(a => a.href);";
                var urls = await page.EvaluateExpressionAsync<string[]>(jsSelectAllAnchors);
                foreach (string u in urls)
                {
                    urlList.Add($"Url: {u}");
                }
                var urlPath = Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "urls.txt");
                File.WriteAllLines(urlPath, urlList);
                await browser.CloseAsync();
            }
        }
 
 
        public static async void SearchTest(string url)
        {
            using var browserFetcher = new BrowserFetcher();
            await browserFetcher.DownloadAsync();
            await using var browser = await Puppeteer.LaunchAsync(new LaunchOptions { Headless = true });
            await using var page = await browser.NewPageAsync();
            await page.SetViewportAsync(new ViewPortOptions
            {
                Width = 1920,
                Height = 1080,
                //Devtools = true // 启用 Chrome DevTools,无头配置将自动禁用
            });
 
            //load: window.onload事件被触发时候完成导航,某些情况下它根本不会发生。
            //domcontentloaded: Domcontentloaded事件触发时候认为导航成功
            //networkidle0: 在 500ms 内没有网络连接时就算成功(全部的request结束),才认为导航结束
            //networkidle2: 500ms 内有不超过 2 个网络连接时就算成功(还有两个以下的request),就认为导航完成
            //加载时长 networkidle0 > networkidle2 > load > domcontentloaded 
            //await page.GoToAsync(url, new NavigationOptions() { WaitUntil = new WaitUntilNavigation[] { WaitUntilNavigation.Networkidle0 } });
 
            // 跟踪日志
            //await page.Tracing.StartAsync(new TracingOptions { Path = Path.Combine(AppDomain.CurrentDomain.BaseDirectory,"race.json") });
            //await page.Tracing.StopAsync();
 
            await page.GoToAsync(url);
            await page.WaitForSelectorAsync(".searchbox input");
            await page.FocusAsync(".searchbox input"); // 聚焦
            await page.Keyboard.TypeAsync("CN Tower, Toronto, Ontario, Canada"); // 键盘输入
            await page.ClickAsync(".searchIcon"); // 点击
            await page.WaitForNavigationAsync();
            var content = await page.GetContentAsync();
 
            // 下载配置
            //var cdp = await page.Target.CreateCDPSessionAsync();
            //await cdp.SendAsync("Page.setDownloadBehavior", new
            //{
            //    behavior = "allow",
            //    downloadPath = Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "testing_downloads")
            //});
            //await cdp.DetachAsync();
        }

调用示例

PuppeteerHelper.DoScreenshot("https://www.baidu.com/");
PuppeteerHelper.ExportAsPdf("https://www.baidu.com/");
PuppeteerHelper.FetchUrls("https://www.baidu.com/");

 执行结果如下:

需要注意的是运行时记得科学上网,不然还是手动将chrome包下载好后,下载后内容是这样的

官网源码: https://github.com/hardkoded/puppeteer-sharp

到此这篇关于C#使用PuppeteerSharp库的示例代码的文章就介绍到这了,更多相关C# PuppeteerSharp内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:

相关文章

  • C#调用打印机实现打印

    C#调用打印机实现打印

    这篇文章介绍了C#调用打印机实现打印的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-04-04
  • .NET实现父窗体关闭而不影响子窗体的方法

    .NET实现父窗体关闭而不影响子窗体的方法

    这篇文章主要介绍了.NET实现父窗体关闭而不影响子窗体的方法,很实用的功能,需要的朋友可以参考下
    2014-08-08
  • C# 8.0中的范围类型(Range Type)示例详解

    C# 8.0中的范围类型(Range Type)示例详解

    这篇文章主要给大家介绍了关于C# 8.0中范围类型(Range Type)的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-12-12
  • C# 使用NModbus的实现示例

    C# 使用NModbus的实现示例

    本文主要介绍了在C#中使用NModbus4库进行Modbus通信,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-01-01
  • C#泛型接口的协变和逆变

    C#泛型接口的协变和逆变

    本文详细讲解了C#泛型接口的协变和逆变,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-04-04
  • C#面向对象编程基础概念汇总

    C#面向对象编程基础概念汇总

    今天小编就为大家分享一篇关于C#面向对象编程基础概念汇总的文章,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-10-10
  • C#提示:“在证书存储区中找不到清单签名证书”的解决方法

    C#提示:“在证书存储区中找不到清单签名证书”的解决方法

    这篇文章主要介绍了C#提示:“在证书存储区中找不到清单签名证书”的解决方法,分析了几种常见的解决方案供大家选择使用,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-01-01
  • C# WinForm编程获取文件物理路径的方法

    C# WinForm编程获取文件物理路径的方法

    这篇文章主要介绍了C# inForm编程获取文件物理路径的方法,获取的物理路径是软件即软件安装所在目录,需要的朋友可以参考下
    2014-08-08
  • 详解如何在C#中处理空值

    详解如何在C#中处理空值

    在任何编程语言中开发应用程序时,经常会遇到空异常或空引用异常,那么下面让我们探讨一下在C#中处理空值的各种方法吧,需要的可以收藏下
    2023-07-07
  • 浅谈c# 浮点数计算

    浅谈c# 浮点数计算

    本文通过具体的示例给大家演示了下C#中浮点数运算所遇到的问题及解决方法,有需要的小伙伴可以参考下
    2017-09-09

最新评论