python爬取”顶点小说网“《纯阳剑尊》的示例代码

 更新时间:2020年10月16日 09:29:39   作者:Gg、  
这篇文章主要介绍了python爬取”顶点小说网“《纯阳剑尊》的示例代码,帮助大家更好的利用python 爬虫爬取数据,感兴趣的朋友可以了解下

爬取”顶点小说网“《纯阳剑尊》

代码

import requests
from bs4 import BeautifulSoup
# 反爬
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, \
  like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}

# 获得请求
def open_url(url):
  response = requests.get(url, headers=headers)
  response.encoding = response.apparent_encoding
  html = response.text
  return html

# 提取标题
def get_title(url):
  soup = BeautifulSoup(url, 'lxml')
  title_tag = soup.find('dd')
  title = '\n' + title_tag.h1.get_text() + '\n'
  return title

# 提取文本
def get_texts(url):
  soup2 = BeautifulSoup(url, 'lxml')
  text_tags = soup2.find_all('dd', id="contents")
  return text_tags

# 保存标题
def save_title(filename, title):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(title)

# 保存文本
def save_text(filename, text):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(text)

# 主程序函数
def main():
  num = input('《纯阳剑尊》你想要下载第几章?(1-802)')
  num = int(num)
  number = 8184027 + num
  url = 'https://www.23us.so/files/article/html/15/15905/' + str(number) + '.html'
  filename = '纯阳剑尊.txt'
  r = open_url(url)
  title = get_title(r)
  tags = get_texts(r)
  save_title(filename, title)
  for text_tag in tags:
    text = text_tag.get_text() + '\n'
    save_text(filename, text)
  print('第{}章已经下载完成!'.format(num))

if __name__ == '__main__':
  main()

爬取结果:

以上就是python爬取”顶点小说网“《纯阳剑尊》的示例代码的详细内容,更多关于python 爬取顶点小说网的资料请关注脚本之家其它相关文章!

相关文章

  • 利用Python库Scapy解析pcap文件的方法

    利用Python库Scapy解析pcap文件的方法

    今天小编就为大家分享一篇利用Python库Scapy解析pcap文件的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python JMESPath库轻松操作JSON进行数据查询方法实例

    Python JMESPath库轻松操作JSON进行数据查询方法实例

    这篇文章主要为大家介绍了Python JMESPath库轻松操作JSON方法实例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • PyTorch快速搭建神经网络及其保存提取方法详解

    PyTorch快速搭建神经网络及其保存提取方法详解

    本篇文章主要介绍了PyTorch快速搭建神经网络及其保存提取方法详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-04-04
  • python在前端页面使用 MySQLdb 连接数据

    python在前端页面使用 MySQLdb 连接数据

    这篇文章主要介绍了MySQLdb 连接数据的使用,文章主要介绍的相关内容又插入数据,删除数据,更新数据,搜索数据,需要的小伙伴可以参考一下
    2022-03-03
  • Python生成器常见问题及解决方案

    Python生成器常见问题及解决方案

    这篇文章主要介绍了Python生成器常见问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03
  • python 通过字符串调用对象属性或方法的实例讲解

    python 通过字符串调用对象属性或方法的实例讲解

    下面小编就为大家分享一篇python 通过字符串调用对象属性或方法的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • pytest中文文档之编写断言

    pytest中文文档之编写断言

    这篇文章主要给大家介绍了关于pytest中文文档之编写断言的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用pytest具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-09-09
  • pytorch中的nn.Unfold()函数和fold()函数解读

    pytorch中的nn.Unfold()函数和fold()函数解读

    这篇文章主要介绍了pytorch中的nn.Unfold()函数和fold()函数用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • Python基于Tensor FLow的图像处理操作详解

    Python基于Tensor FLow的图像处理操作详解

    这篇文章主要介绍了Python基于Tensor FLow的图像处理操作,结合实例形式分析了Python基于Tensor FLow操作图像解码、缩放、剪切、翻转、调整对比度、明度、饱和度等相关操作技巧,需要的朋友可以参考下
    2020-01-01
  • Selenium中的option使用示例

    Selenium中的option使用示例

    这篇文章主要介绍了Selenium中的option用法实例,本文结合示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-12-12

最新评论