python之playwright的基本使用及说明

 更新时间:2025年12月29日 09:21:04   作者:382427827  
这段代码使用Playwright库自动化操作三种主流浏览器(Chromium、Firefox、WebKit),访问百度首页,对每个浏览器进行截图并打印网页标题
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    for browser_type in [p.chromium,p.firefox,p.webkit]:
        browser = browser_type.launch(headless=False)
        page = browser.new_page()
        page.goto('https://www.baidu.com')
        page.screenshot(path=f'screenshot-{browser_type.name}.png')
        print(page.title())
        browser.close()

运行结果如下:

关键知识点

这段代码使用了 Playwright(一个用于自动化浏览器操作的 Python 库)来依次启动三种主流浏览器(Chromium、Firefox、WebKit),访问百度首页,并对每个浏览器进行截图和打印网页标题。

下面是对每一行代码的详细解释:

导入模块

from playwright.sync_api import sync_playwright
  • playwright.sync_api 模块中导入 sync_playwright
  • Playwright 提供了同步(sync)和异步(async)两种 API 风格,这里使用的是同步风格,适合脚本式、顺序执行的任务。

启动上下文管理器

with sync_playwright() as p:
  • 使用 with 语句创建一个 Playwright 的同步运行时上下文。
  • p 是 Playwright 的主对象,通过它可以访问浏览器类型(如 chromium, firefox, webkit)。

好处with 会自动在结束时关闭所有资源(如浏览器进程),防止内存泄漏。

遍历三种浏览器

for browser_type in [p.chromium, p.firefox, p.webkit]:
  • p.chromium:代表基于 Chromium 的浏览器(如 Chrome、Edge)。
  • p.firefox:代表 Mozilla Firefox。
  • p.webkit:代表 Apple WebKit(在 macOS 上模拟 Safari 行为)。
  • 这里将依次启动这三种浏览器。

注意:首次运行时,Playwright 会自动下载这些浏览器的精简版(如果尚未安装)。

启动浏览器并打开新页面

browser = browser_type.launch(headless=False)
page = browser.new_page()

browser_type.launch(headless=False)

  • 启动对应类型的浏览器。
  • headless=False 表示以有头模式(即可见窗口)运行;若设为 True 则后台无界面运行(默认值通常是 True)。

browser.new_page()

  • 打开一个新的标签页(Page 对象),用于后续操作。

访问百度首页

page.goto('https://www.baidu.com')
  • 在当前页面中导航到 https://www.baidu.com
  • Playwright 会等待页面加载完成(包括网络空闲)后再继续执行。

截图保存

page.screenshot(path=f'screenshot-{browser_type.name}.png')

对当前页面进行截图,并保存为 PNG 文件。

文件名根据浏览器类型动态生成,例如:

  • screenshot-chromium.png
  • screenshot-firefox.png
  • screenshot-webkit.png

打印网页标题

print(page.title())
  • 获取当前页面的 <title> 标签内容(即网页标题)。
  • 百度首页的标题通常是 "百度一下,你就知道"
  • 将其打印到控制台。

关闭浏览器

browser.close()
  • 关闭当前浏览器实例及其所有页面。
  • 释放系统资源。

虽然 with sync_playwright() 会在最后清理资源,但显式调用 browser.close() 是良好实践,尤其在循环中。

总结:这段代码的作用

使用 Playwright 自动化测试框架,在 Chromium、Firefox 和 WebKit 三种浏览器中分别打开百度首页,截图保存,并打印页面标题。

补充说明

依赖安装

pip install playwright
playwright install  # 安装浏览器二进制文件

常见用途

  • 跨浏览器兼容性测试
  • 自动化截图对比
  • 爬虫(绕过简单反爬)
  • UI 自动化测试

注意事项

  • WebKit 在 Windows/Linux 上的行为可能与 macOS 不完全一致。
  • 如果网络受限,goto() 可能超时,可加 timeout=5000 参数。
  • 生产环境中建议使用 headless=True 提高性能。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • PyInstaller 完美打包 Python 脚本

    PyInstaller 完美打包 Python 脚本

    PyInstaller 是一个用于将 Python 脚本打包成可执行文件的工具,支持 Windows、Linux 和 macOS 等多个平台。它可以将 Python 脚本及其依赖项打包成一个独立的可执行文件,方便用户在没有 Python 环境的机器上运行程序。
    2023-06-06
  • Python实现批量修改图片格式和大小的方法【opencv库与PIL库】

    Python实现批量修改图片格式和大小的方法【opencv库与PIL库】

    这篇文章主要介绍了Python实现批量修改图片格式和大小的方法,结合实例形式分析了Python基于opencv库与PIL库针对图片的读写、转换相关操作技巧,需要的朋友可以参考下
    2018-12-12
  • python3实现tailf命令的示例代码

    python3实现tailf命令的示例代码

    本文主要介绍了python3实现tailf命令的示例代码,tail -f 是一个linux的操作命令.其主要的是会把文件里的最尾部的内容显显示在屏幕上,并且不断刷新,只要文件有变动就可以看到最新的文件内容,感兴趣的可以了解一下
    2023-11-11
  • python 网络编程常用代码段

    python 网络编程常用代码段

    这篇文章主要介绍了python 网络编程常用代码段,需要的朋友可以参考下
    2016-08-08
  • Python如何解除一个装饰器

    Python如何解除一个装饰器

    这篇文章主要介绍了Python如何解除一个装饰器,帮助大家更好的理解和学习Python装饰器,感兴趣的朋友可以了解下
    2020-08-08
  • pytest fixtures装饰器的使用和如何控制用例的执行顺序

    pytest fixtures装饰器的使用和如何控制用例的执行顺序

    这篇文章主要介绍了pytest fixtures装饰器的使用和如何控制用例的执行顺序,帮助大家更好的理解和使用pytest测试框架,感兴趣的朋友可以了解下
    2021-01-01
  • opencv实现回形遍历像素算法

    opencv实现回形遍历像素算法

    这篇文章主要为大家详细介绍了opencv实现回形遍历像素算法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-03-03
  • 在MAC上搭建python数据分析开发环境

    在MAC上搭建python数据分析开发环境

    这篇文章主要介绍了在MAC上搭建python数据分析开发环境的相关资料,需要的朋友可以参考下
    2016-01-01
  • Pandas进行文本数据处理的全面指南

    Pandas进行文本数据处理的全面指南

    在数据分析中,文本数据是常见的数据类型之一,本文将详细介绍 Pandas 中的文本处理功能,并通过实际代码示例展示如何使用它们,希望对大家有一定的帮助
    2025-05-05
  • python+influxdb+shell编写区域网络状况表

    python+influxdb+shell编写区域网络状况表

    这篇文章主要为大家详细介绍了python+influxdb+shell编写区域网络状况表,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07

最新评论