Python实现抓取网页生成Excel文件的方法示例

 更新时间:2017年08月05日 10:57:48   作者:liumengcheng  
这篇文章主要介绍了Python实现抓取网页生成Excel文件的方法,涉及PyQuery模块的使用及Excel文件相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python文件与目录操作技巧汇总》、《Python文本文件操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • Python3爬虫里关于Splash负载均衡配置详解

    Python3爬虫里关于Splash负载均衡配置详解

    在本篇文章里小编给大家分享了关于Python3爬虫里关于Splash负载均衡配置的相关内容,需要的朋友们可以学习参考下。
    2020-07-07
  • Python网络编程之xmlrpc模块

    Python网络编程之xmlrpc模块

    这篇文章介绍了Python网络编程之xmlrpc模块,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-05-05
  • python如何实现异步调用函数执行

    python如何实现异步调用函数执行

    这篇文章主要介绍了python如何实现异步调用函数执行,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python argparse库的基本使用步骤

    Python argparse库的基本使用步骤

    argparse库是python下的一个命令行参数管理库,支持int、str、float、bool、数组等5种基本数据类型,这篇文章主要介绍了Python argparse库的基本使用,需要的朋友可以参考下
    2022-07-07
  • python定义具名元组实例操作

    python定义具名元组实例操作

    在本篇文章里小编给大家分享的是一篇关于python定义具名元组实例操作内容,有兴趣的朋友们可以学习下。
    2021-02-02
  • 盘点Python 爬虫中的常见加密算法

    盘点Python 爬虫中的常见加密算法

    这篇文章主要介绍了盘点Python 爬虫中的常见加密算法,加密即Encryption指将明文数据变换为密文的过程,解密即Decryption指加密的逆过程,即由密文恢复出原明文的过程
    2022-07-07
  • python OpenCV图像金字塔

    python OpenCV图像金字塔

    这篇文章主要介绍了python OpenCV图像金字塔,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-06-06
  • Python socket编程实例详解

    Python socket编程实例详解

    这篇文章主要介绍了Python socket编程,以实例形式较为详细的分析了Python中socket模块的使用技巧,非常具有实用价值,需要的朋友可以参考下
    2015-05-05
  • Pandas替换及部分替换(replace)实现流程详解

    Pandas替换及部分替换(replace)实现流程详解

    这篇文章主要介绍了Pandas替换及部分替换(replace)实现流程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • Python函数默认参数常见问题及解决方案

    Python函数默认参数常见问题及解决方案

    这篇文章主要介绍了Python函数默认参数常见问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03

最新评论