Docker平台下NodeJs Puppeteer实现html转pdf过程示例

更新时间：2023年12月21日 14:03:10 作者：强子

这篇文章主要为大家介绍了Docker平台下NodeJs Puppeteer实现html转pdf过程示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

Docker 平台 NodeJs Puppeteer实现html转pdf

1. 背景

PDM系统中有需求工艺单需要打印成PDF（客户对细节要求极高），当时出了5个方案：

从DOM制作屏幕截图 html2canvas jspdf 文字无法拷贝
使用PDF库 jsPDF 或 PDFKit 按组件一个一个拼凑，不合适已有html的打印模板方式
CSS打印规则，调用浏览器打印，pdf 文件导入到系统，操作繁琐
itext (目前用的) 和spire功能强大，但商业用途需收费，wkhtmltopdf开源免费，后端生成，黑匣子，后端开发前端代码，可视化麻烦通过模板生成PDF的实际效果和模板效果相差较大，修改起来不好把握
基于Node.js的Puppeteer和HeadlessChrome 展示效果与实际生成的PDF接近

使用方案5是可以借助puppeteer调用headless浏览器生成PDF，对css的支持度很高，PDF能很大限度反应模板的样式（对css支持度很高），前端对模板的控制度更高，支持dom操作，以下是模板样式和PDF样式对比：

生成的pdf文件样式和编写的html模板样式一致度较高，可以让前端编写模板文件实时查看html内容样式，改完之后用该模板调用后端的node服务生成的pdf模板能较高程度的还原模板内容，前端可以通过模板引擎如EJS（类似于当前方案后端技术的freemarker模板）生成模板执行一些复杂的dom操作和样式控制。

2. 所需依赖

npm install express jsdom puppeteer

express: 用来和业务系统通信，返回pdf流给业务系统

jsdom: 解析DOM，在生成pdf的时候要让前端可以自定义pdf的页头页尾

puppeteer: 调用headless生成PDF

3. 核心代码

genPdfFile.js

const puppeteer = require('puppeteer');
const fs = require('fs');
const jsdom = require("jsdom");
const { JSDOM } = jsdom;
let browserInstance;
async function getBrowserInstance() {
    if (!browserInstance) {
        browserInstance = await puppeteer.launch({
            headless: true,
            args: ['--no-sandbox', '--disable-setuid-sandbox']
        });
    }
    return browserInstance;
}
async function generatePDFFromHTML(htmlString) {
    try {
            // 启动Puppeteer
    const browser = await getBrowserInstance();
    const page = await browser.newPage();
         // 页眉
        let headerTemplate = "";
        // 页脚
        let footerTemplate = "";
        {
            // 构建页眉
            console.log("headerTemplate");
            let dom = new JSDOM(htmlString);
            let document = dom.window.document;
            const elementsToRemove = document.querySelectorAll(".page_start");
            if(elementsToRemove.length > 0) {
                headerTemplate = elementsToRemove[0].outerHTML;
            }
            elementsToRemove.forEach(el => el.parentNode.removeChild(el));  
            updatedHtmlString = dom.serialize();
        }
        {
            // 构建页脚
            console.log("footerTemplate");
            dom = new JSDOM(updatedHtmlString);
            document = dom.window.document;
            const endelementsToRemove = document.querySelectorAll(".page_end");
            if(endelementsToRemove.length > 0) {
                footerTemplate = endelementsToRemove[0].outerHTML;
            }
            endelementsToRemove.forEach(el => el.parentNode.removeChild(el));  
            updatedHtmlString = dom.serialize();
        }
        // 设置HTML内容并生成PDF的Buffer
        await page.setContent(updatedHtmlString);
        // 设置 PDF 选项
        const pdfOptions = {
            path: 'example.pdf',
            format: 'a4',
            displayHeaderFooter: true,
            headerTemplate,
            footerTemplate,
            margin: {
                top: '60px',
                bottom: '20px',
                left: '20px',
                right: '50px'
            },
        };
        // 生成 PDF
         // 如果要生成带着 screen media的pdf，在page.pdf() 前面先调用 page.emulateMedia('screen')
        const pdfBuffer = await page.pdf(pdfOptions);
        return pdfBuffer;
    } catch(error) {
        console.log(error);
    }
}
module.exports = {
    getBrowserInstance,
    generatePDFFromHTML
}

4. DockerFile

FROM ghcr.io/puppeteer/puppeteer:latest
MAINTAINER weiqlog@126.com
USER root
RUN mkdir -p /pdfG
WORKDIR /pdfG
COPY package*.json ./
COPY . .
RUN npm instal
EXPOSE 10030
ENTRYPOINT ["node", "main.js", "10030"]

使用：

docker pull 1505774577/html_to_pdf:1.0.0.dev
docker run -d -p 10030:10030 --cap-add=SYS_ADMIN 1505774577/html_to_pdf:1.0.0.dev

以上就是Docker平台下NodeJs Puppeteer实现html转pdf过程示例的详细内容，更多关于Docker 平台 NodeJs Puppeteer实现html转pdf的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

npm报错:npm WARN config global '--global', &apo
这篇文章主要给大家介绍了关于npm报错:npm WARN config global '--global', '--local' are deprecated. Use `--location=global` instead.的解决方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
2022-08-08
NodeJS使用文件流解决大文件处理的内存与时间效率问题
在 NodeJS 中,文件操作是常见的任务之一,然而,当处理大文件时,直接将整个文件加载到内存中可能会导致内存溢出或性能瓶颈,为了解决这一问题,NodeJS 提供了文件流（Stream）机制,本文将详细介绍文件流的优点、使用方法、应用场景,并探讨背压（Backpressure）的概念
2025-01-01
NodeJS远程代码执行
这篇文章主要介绍了NodeJS远程代码执行方法的相关资料,需要的朋友可以参考下
2016-08-08
express框架，报错：“Cannot set headers after t
这篇文章主要介绍了express框架，报错：“Cannot set headers after they are sent to the client”，解决方法,结合实例形式总结分析了常见的问题原因与对应的解决方案,需要的朋友可以参考下
2023-05-05
node.js中使用node-schedule实现定时任务实例
这篇文章主要介绍了node.js中使用node-schedule实现定时任务实例,包括安装方法和4种使用例子,需要的朋友可以参考下
2014-06-06
Dapr+NestJs编写Pub及Sub装饰器实战示例
这篇文章主要为大家介绍了Dapr+NestJs编写Pub及Sub装饰器的实战示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-08-08
深入理解Node.js中import.meta的使用
import.meta提供模块的上下文信息,如文件URL、解析模块路径、判断模块是否为入口等,本文就来介绍一下Node.js中import.meta的使用,具有一定的参考价值,感兴趣的可以了解一下
2026-01-01
Nodejs+angularjs结合multiparty实现多图片上传的示例代码
这篇文章主要介绍了Nodejs+angularjs结合multiparty实现多图片上传的示例代码,具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-09-09
图文详解如何开发一个自己的包并发布到npm
前端开发将自己编写的常用组件、工具模块、指令,常用api库、框架等代码,为了能够更好、更灵活的管理这些代码,上传到npm库是一个非常好的选择方式,这篇文章主要介绍了如何开发一个自己的包并发布到npm的相关资料,需要的朋友可以参考下
2025-10-10
nodejs实现套接字服务功能详解
这篇文章主要介绍了nodejs实现套接字服务功能,简单描述了套接字的概念、功能,并结合实例形式分析了nodejs使用socket对象创建及使用套接字进行数据传输相关操作技巧与注意事项,需要的朋友可以参考下
2018-06-06