Python Requests爬虫之求取关键词页面详解

 更新时间:2022年02月16日 10:10:18   作者:那人独钓寒江雪.  
这篇文章主要为大家详细介绍了Python Requests爬虫之求取关键词页面,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助

需求:爬取搜狗首页的页面数据

import requestsif __name__=='__main__':    #step 1:搜索Url    url='https://123.sogou.com/'    #step 2:发起请求    #get方法会返回一个响应对象    response=requests.get(url=url)    #step 3:获取响应数据,text返回的是字符串形式的响应数据    page_text=response.text    print(page_text)    #step 4:持久化存储    with open('./sogou.html','w',encoding='utf-8') as fp:        fp.write(page_text)    print("爬取数据结束")import requests
if __name__=='__main__':
    #step 1:搜索Url
    url='https://123.sogou.com/'
    #step 2:发起请求
    #get方法会返回一个响应对象
    response=requests.get(url=url)
    #step 3:获取响应数据,text返回的是字符串形式的响应数据
    page_text=response.text
    print(page_text)
    #step 4:持久化存储
    with open('./sogou.html','w',encoding='utf-8') as fp:
        fp.write(page_text)
    print("爬取数据结束")

请添加图片描述

使用UA伪装 求取关键词页面

import requests
if __name__=='__main__':
    #UA伪装:将对应的User-Agent封装到一个字典中
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.9 Safari/537.36'
    }
    url='https://www.sogou.com/sie?'
    #处理url携带的参数:封装到字典中
    kw=input('enter a word:')
    param={
        'query':kw
    }
    #对指定的url发起的请求对应的url是携带参数的,并且请求过程中处理了参数
    response=requests.get(url=url,params=param,headers=headers)#headers是伪装 params输入关键词

    page_text=response.text#以文本的形式输出
    fileName=kw+'.html'#存储为网页形式
    with open(fileName,'w+',encoding='utf-8') as fp:
        fp.write(page_text)#写入fp
    print(fileName,"保存成功!!")

请添加图片描述

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!         

相关文章

  • tensorflow 分类损失函数使用小记

    tensorflow 分类损失函数使用小记

    这篇文章主要介绍了tensorflow 分类损失函数使用小记,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • Python如何利用xlrd和xlwt模块操作Excel表格

    Python如何利用xlrd和xlwt模块操作Excel表格

    这篇文章主要给大家介绍了关于Python如何利用xlrd和xlwt模块操作Excel表格的相关资料,其中xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入,需要的朋友可以参考下
    2022-03-03
  • Python+OpenCV图片去水印的多种方案实现

    Python+OpenCV图片去水印的多种方案实现

    这篇文章主要为大家总结了Python结合OpenCV的几种常见的水印去除方式,简单图片去水印效果良好,有需要的小伙伴可以跟随小编一起了解下
    2025-02-02
  • Python Pygame实战之超级炸弹人游戏的实现

    Python Pygame实战之超级炸弹人游戏的实现

    如今的玩家们在无聊的时候会玩些什么游戏呢?王者还是吃鸡是最多的选择。但在80、90年代的时候多是一些很简单的游戏:《超级玛丽》、《魂斗罗》等。本文将利用Pygame制作另一个经典游戏—炸弹人,感兴趣的可以了解一下
    2022-03-03
  • 详解如何在VS Code中安装Spire.PDF for Python

    详解如何在VS Code中安装Spire.PDF for Python

    这篇文章主要为大家详细介绍了如何在VS Code中安装Spire.PDF for Python,文中的示例代码简洁易懂,有需要的小伙伴可以跟随小编一起学习一下
    2023-10-10
  • Python数据操作方法封装类实例

    Python数据操作方法封装类实例

    这篇文章主要介绍了Python数据操作方法封装类,结合具体实例形式分析了Python针对数据库的连接、执行sql语句、删除、关闭等操作技巧,需要的朋友可以参考下
    2017-06-06
  • python实现打开手机app并点击操作

    python实现打开手机app并点击操作

    这篇文章主要介绍了python实现打开手机app并点击操作,本文分为两部分一部分是打开应用,第二部分是调式手机连接电脑,需要的朋友可以参考下
    2022-04-04
  • Python利用sched模块实现定时任务

    Python利用sched模块实现定时任务

    今天我们来介绍一下Python当中的定时任务,主要用到的模块是sched,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2023-04-04
  • python之如何实现延迟操作

    python之如何实现延迟操作

    这篇文章主要介绍了python之如何实现延迟操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-04-04
  • Python实现号码归属地查询功能

    Python实现号码归属地查询功能

    这篇文章主要为大家详细介绍了如何利用Python实现对手机号码进行地域分析并查询归属地的功能,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-12-12

最新评论