Python处理Excel文件实例代码

 更新时间:2017年06月20日 09:09:12   作者:Berne  
本篇文章主要介绍了Python处理Excel文件实例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

因为工作需求,需要审核一部分query内容是否有效,query储存在Excel中,文本内容为页面的Title,而页面的URL以HyperLink的格式关联到每个Cell。

于是本能的想到用Python读取Excel文件之后进行文本分析,之后对每个链接进行一次HttpRequest,通过分析HttpResponse的内容来判断当前链接是否有效。

于是上网搜了下,发现比较主流的是用xlrd的插件,但是实际使用过程中发现,无论如何,最终获取的hyperlink_map值一直都是None,也没空去分析到底是为什么。最后经过搜索发现一个叫xlwings的Python库,可以有效使用。

xlwings:Python For Excel

具体的代码如下:

# -*- coding=utf-8 -*-
import xlwings as xw
import urllib
import sys

type = sys.getfilesystemencoding() 

def get_html(url):
  page = urllib.urlopen(url)
  html = page.read()
  return unzip(html)

## Debug的时候发现无论怎样做Decode,最后的结果都是乱码
## 后来发现是因为对应的网页做了压缩处理,所以需要对获取的网页内容手动解压缩
def unzip(data):
  import gzip
  import StringIO
  data = StringIO.StringIO(data)
  gz = gzip.GzipFile(fileobj=data)
  data = gz.read()
  gz.close()
  return data

wb = xw.Book(r"C:\Users\hasee\Desktop\Test.xlsx")
main_data = wb.sheets["Sheet2"]
## 通过获取Last Cell来确定当前Sheet的有效行数与列数
rownum = main_data.range('A1').current_region.last_cell.row
colnum = main_data.range('A1').current_region.last_cell.column

## 定位column对应的列
col_dict = {"2":"B","3":"C","4":"D","5":"E","6":"F"}

for row in range(1, rownum + 1):
  for col in range(2, colnum + 1):
    query = main_data.range(row, 1).value
    cell = main_data.range(row, col)
    link = cell.hyperlink
    html = get_html(link)
    if "error-container" in html:
      print "%s,%s,%s,%s" % (query, col_dict.get(str(col))+str(row), cell.value, cell.hyperlink)
      ## 对无效的链接所属的Cell染色,直接写入文件
      cell.color = (253,218,4)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python 统计列表中不同元素的数量方法

    python 统计列表中不同元素的数量方法

    今天小编就为大家分享一篇python 统计列表中不同元素的数量方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Pandas数据清洗和预处理的实现示例

    Pandas数据清洗和预处理的实现示例

    本文主要介绍了Pandas数据清洗和预处理的实现示例,包括处理缺失值、异常值,进行数据转换和规范化,以及处理重复数据等操作,感兴趣的可以了解一下
    2024-01-01
  • django使用多个数据库的方法实例

    django使用多个数据库的方法实例

    这篇文章主要给大家介绍了关于django使用多个数据库的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • Python实现的RSS阅读器实例

    Python实现的RSS阅读器实例

    这篇文章主要介绍了Python实现的RSS阅读器,实例分析了XML解析实现RSS阅读的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07
  • 浅谈Python数据处理csv的应用小结

    浅谈Python数据处理csv的应用小结

    这篇文章主要介绍了Python数据处理csv的简单应用,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-01-01
  • 解决pycharm 格式报错tabs和space不一致问题

    解决pycharm 格式报错tabs和space不一致问题

    这篇文章主要介绍了解决pycharm 格式报错tabs和space不一致问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-02-02
  • nlp自然语言处理学习CBOW模型类实现示例解析

    nlp自然语言处理学习CBOW模型类实现示例解析

    这篇文章主要为大家介绍了nlp自然语言处理学习CBOW模型类实现示例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步早日升职加薪
    2022-04-04
  • Python Scrapy库构建基础爬虫

    Python Scrapy库构建基础爬虫

    这篇文章主要为大家介绍了Python Scrapy库构建基础爬虫示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-08-08
  • Python简单的GUI程序示例详解

    Python简单的GUI程序示例详解

    这篇文章主要为大家详细介绍了Python简单的GUI程序示例,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-02-02
  • Python中使用logging模块代替print(logging简明指南)

    Python中使用logging模块代替print(logging简明指南)

    这篇文章主要介绍了Python中使用logging模块代替print的好处说明,主旨是logging模块简明指南,logging模块的使用方法介绍,需要的朋友可以参考下
    2014-07-07

最新评论