Python爬虫将爬取的图片写入world文档的方法

 更新时间:2018年11月07日 10:52:23   作者:霜之哀伤彡  
今天小编就为大家分享一篇Python爬虫将爬取的图片写入world文档的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

作为初学爬虫的我,无论是爬取文字还是图片,都可以游刃有余的做到,但是爬虫所爬取的内容往往不是单独的图片或者文字,于是我就想是否可以将图文保存至world文档里,一开始使用了如下方法保存图片:

 with open('123.doc','wb')as file:
  file.write(response.content)
  file.close() 

结果就是,world文档里出现了一堆乱码,此法不同,我就开始另寻他法,找了很久也没有找到,只找到了关于Python操作world的方法。

于是我就开始了新的思路:使用原来的方法将图片保存下来,再将图片添加到world文档里,最后将图片删除。这里使用的是python-dox库,代码如下:

import requests
from bs4 import BeautifulSoup
import os
import docx
from docx import Document
from docx.shared import Inches

url = 'https://www.qiushibaike.com/article/119757360'
html = requests.get(url).content
soup = BeautifulSoup(html,'html.parser')
wen = soup.find('div',{"class":"content"}).text
img = str(soup.find('div',{"class":"thumb"})).split('src="')[1].split('"/')[0]
tu = 'https:' + img
img_name = img.split('/')[-1]

#保存图片至本地
with open(img_name,'wb')as f:
 response = requests.get(tu).content
 f.write(response)
 f.close()

document = Document()
document.add_paragraph(wen)#向文档里添加文字
document.add_picture(img_name)#向文档里添加图片
document.save('tuwen.doc')#保存文档
os.remove(img_name)#删除保存在本地的图片

最后,还是实现了将图文保存在了world文档里,尽管方法有些笨……

以上这篇Python爬虫将爬取的图片写入world文档的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • numpy 对矩阵中Nan的处理:采用平均值的方法

    numpy 对矩阵中Nan的处理:采用平均值的方法

    今天小编就为大家分享一篇numpy 对矩阵中Nan的处理:采用平均值的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • python nmap实现端口扫描器教程

    python nmap实现端口扫描器教程

    这篇文章主要为大家详细介绍了python nmap实现端口扫描器教程,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • 深入解析PYTHON 虚拟机令人拍案叫绝的字节码设计

    深入解析PYTHON 虚拟机令人拍案叫绝的字节码设计

    这篇文章主要为大家介绍了PYTHON虚拟机中令人拍案叫绝的字节码设计深入详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • python 实现一个图形界面的汇率计算器

    python 实现一个图形界面的汇率计算器

    这篇文章主要介绍了python 实现一个图形界面的汇率计算器,帮助大家更好的理解和学习如何制作gui程序,感兴趣的朋友可以了解下
    2020-11-11
  • Python中的int函数使用

    Python中的int函数使用

    这篇文章主要介绍了Python中的int函数使用方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • Python实现根据Excel生成Model和数据导入脚本

    Python实现根据Excel生成Model和数据导入脚本

    最近遇到一个需求,有几十个Excel,每个的字段都不一样,然后都差不多是第一行是表头,后面几千上万的数据,需要把这些Excel中的数据全都加入某个已经上线的Django项目。所以我造了个自动生成 Model和导入脚本的轮子,希望对大家有所帮助
    2022-11-11
  • python可变对象,不可变对象详解

    python可变对象,不可变对象详解

    这篇文章主要介绍了Python可变对象和不可变对象的相关资料,文中讲解非常细致,代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下
    2021-09-09
  • python如何设置静态变量

    python如何设置静态变量

    在本篇内容里小编给大家整理的是一篇关于python如何设置静态变量的相关文章,有兴趣的朋友们可以参考下。
    2020-09-09
  • 网站渗透常用Python小脚本查询同ip网站

    网站渗透常用Python小脚本查询同ip网站

    这篇文章主要介绍了网站渗透常用Python小脚本查询同ip网站,需要的朋友可以参考下
    2017-05-05
  • Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

    Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

    这篇文章主要介绍了Python爬虫获取op.gg英雄联盟英雄对位胜率,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-01-01

最新评论