python爬取全国水雨情信息详解

 更新时间:2021年10月21日 10:35:43   作者:韩起  
这篇文章主要为大家详细介绍了python爬取全国水雨情信息,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

分析.png

分析

我们没有找到接口,所以打算利用selenium来爬取。

代码

import datetime
import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.options import Options #建议使用谷歌浏览器
import time
chrome_options = Options()
chrome_options.add_argument('--headless')
driver = webdriver.Chrome()

# 存储中英文对应的变量的中文名
word_dict = {"poiBsnm": "流域",
             "poiAddv": "行政区",
             "rvnm": "河名", 
             "stnm": "站名",
             "tm": "时间", 
             "zl": "水位(米)",
             "ql": "流量(立方米/秒)",
             "wrz": "警戒水位(米)"}
# 空df接收结果
rain_total = pd.DataFrame([])

url = 'http://xxfb.mwr.cn/sq_dxsk.html'
driver.get(url)
time.sleep(5)
infos = driver.find_elements_by_xpath("/html/body//tbody[@id='DataContainer']/tr")
# pd.set_option('display.max_columns', None)#所有列
# pd.set_option('display.max_rows', None)#所有行

# 列表提取
for info in infos:
    poiBsnm = info.find_element_by_xpath("./td[1]").text
    poiAddv = info.find_element_by_xpath("./td[2]").text
    rvnm = info.find_element_by_xpath("./td[3]").text
    stnm = info.find_element_by_xpath("./td[4]").text
    tm = info.find_element_by_xpath("./td[5]").text
    zl = info.find_element_by_xpath("./td[6]").text
    ql = info.find_element_by_xpath("./td[7]").text
    wrz = info.find_element_by_xpath("./td[8]").text
# 组成pandas对象
    rain_data = [[poiBsnm,poiAddv,rvnm,stnm,tm,zl,ql,wrz]]  
    rain_df = pd.DataFrame(data=rain_data,columns=list(word_dict.values()))
    rain_total = pd.concat([rain_total,rain_df])
    print(rain_total)
# 关闭浏览器
driver.close()
# 保存数据
data_str = datetime.datetime.now().strftime('%Y_%m_%d')
rain_total.to_csv("%s_全国水雨情信息.csv" % (data_str),index=None, encoding="GB18030")

结果

结果.png

总结

时间爬取出现了一点问题,我也很不理解,其次,循环哪里应该可以简洁代码,写的不是很好,第三,没有形成模块化的代码。还有就是谢谢崔工的支持。

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!

相关文章

  • 关于命令行执行Python脚本的传参方式

    关于命令行执行Python脚本的传参方式

    这篇文章主要介绍了关于命令行执行Python脚本的传参方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-09-09
  • Python实现提取音乐频谱的方法详解

    Python实现提取音乐频谱的方法详解

    你有没有经常好奇一些音乐软件的频谱特效是怎么做的,为什么做的这么好看?有没有想试试自己提取音乐频谱并可视化展现出来?本文就来教你如何利用Python提取音乐频谱,快来学习一下吧
    2022-06-06
  • python比较两个列表是否相等的方法

    python比较两个列表是否相等的方法

    这篇文章主要介绍了python比较两个列表是否相等的方法,实例分析了Python中==和is两种方法的区别,需要的朋友可以参考下
    2015-07-07
  • 10个python爬虫入门基础代码实例 + 1个简单的python爬虫完整实例

    10个python爬虫入门基础代码实例 + 1个简单的python爬虫完整实例

    这篇文章主要介绍了10个python爬虫入门基础代码实例和1个简单的python爬虫爬虫贴吧图片的实例,需要的朋友可以参考下
    2020-12-12
  • python爬虫基础教程:requests库(二)代码实例

    python爬虫基础教程:requests库(二)代码实例

    这篇文章主要介绍了python爬虫基础教程:requests库(二),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-04-04
  • python xlsxwriter库生成图表的应用示例

    python xlsxwriter库生成图表的应用示例

    这篇文章主要介绍了python xlsxwriter库生成图表的应用示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-03-03
  • Pandas缺失值2种处理方式代码实例

    Pandas缺失值2种处理方式代码实例

    这篇文章主要介绍了Pandas缺失值2种处理方式代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python使用sax模块解析XML文件示例

    Python使用sax模块解析XML文件示例

    这篇文章主要介绍了Python使用sax模块解析XML文件,结合实例形势分析了Python使用sax模块针对xml文件进行读取、解析、内容处理等相关操作技巧,需要的朋友可以参考下
    2019-04-04
  • 详解python UDP 编程

    详解python UDP 编程

    这篇文章主要介绍了python UDP 编程的相关资料,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-08-08
  • 在Python开发环境中调用ChatGPT模型详细过程

    在Python开发环境中调用ChatGPT模型详细过程

    在开发过程当中时常需要使用 ChatGPT 来完成一些任务,但总是使用网页交互模式去 Web 端访问 ChatGPT 是很麻烦的,这时候我们可以使用代码来调用 ChatGPT 模型,本文将详细介绍在 Python 开发环境中调用 ChatGPT 模型过程,,需要的朋友可以参考下
    2023-05-05

最新评论