Python Requests爬虫之求取关键词页面详解

更新时间：2022年02月16日 10:10:18 作者：那人独钓寒江雪.

这篇文章主要为大家详细介绍了Python Requests爬虫之求取关键词页面，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助

需求:爬取搜狗首页的页面数据

import requestsif __name__=='__main__':    #step 1:搜索Url    url='https://123.sogou.com/'    #step 2:发起请求    #get方法会返回一个响应对象    response=requests.get(url=url)    #step 3:获取响应数据,text返回的是字符串形式的响应数据    page_text=response.text    print(page_text)    #step 4:持久化存储    with open('./sogou.html','w',encoding='utf-8') as fp:        fp.write(page_text)    print("爬取数据结束")import requests
if __name__=='__main__':
    #step 1:搜索Url
    url='https://123.sogou.com/'
    #step 2:发起请求
    #get方法会返回一个响应对象
    response=requests.get(url=url)
    #step 3:获取响应数据,text返回的是字符串形式的响应数据
    page_text=response.text
    print(page_text)
    #step 4:持久化存储
    with open('./sogou.html','w',encoding='utf-8') as fp:
        fp.write(page_text)
    print("爬取数据结束")

请添加图片描述

使用UA伪装求取关键词页面

import requests
if __name__=='__main__':
    #UA伪装:将对应的User-Agent封装到一个字典中
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.9 Safari/537.36'
    }
    url='https://www.sogou.com/sie?'
    #处理url携带的参数:封装到字典中
    kw=input('enter a word:')
    param={
        'query':kw
    }
    #对指定的url发起的请求对应的url是携带参数的,并且请求过程中处理了参数
    response=requests.get(url=url,params=param,headers=headers)#headers是伪装 params输入关键词

    page_text=response.text#以文本的形式输出
    fileName=kw+'.html'#存储为网页形式
    with open(fileName,'w+',encoding='utf-8') as fp:
        fp.write(page_text)#写入fp
    print(fileName,"保存成功！！")

请添加图片描述

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注脚本之家的更多内容!

您可能感兴趣的文章:

tensorflow 分类损失函数使用小记
这篇文章主要介绍了tensorflow 分类损失函数使用小记，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-02-02
Python如何利用xlrd和xlwt模块操作Excel表格
这篇文章主要给大家介绍了关于Python如何利用xlrd和xlwt模块操作Excel表格的相关资料,其中xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入,需要的朋友可以参考下
2022-03-03
Python+OpenCV图片去水印的多种方案实现
这篇文章主要为大家总结了Python结合OpenCV的几种常见的水印去除方式,简单图片去水印效果良好,有需要的小伙伴可以跟随小编一起了解下
2025-02-02
Python Pygame实战之超级炸弹人游戏的实现
如今的玩家们在无聊的时候会玩些什么游戏呢？王者还是吃鸡是最多的选择。但在80、90年代的时候多是一些很简单的游戏：《超级玛丽》、《魂斗罗》等。本文将利用Pygame制作另一个经典游戏—炸弹人，感兴趣的可以了解一下
2022-03-03
详解如何在VS Code中安装Spire.PDF for Python
这篇文章主要为大家详细介绍了如何在VS Code中安装Spire.PDF for Python,文中的示例代码简洁易懂,有需要的小伙伴可以跟随小编一起学习一下
2023-10-10
Python数据操作方法封装类实例
这篇文章主要介绍了Python数据操作方法封装类,结合具体实例形式分析了Python针对数据库的连接、执行sql语句、删除、关闭等操作技巧,需要的朋友可以参考下
2017-06-06
python实现打开手机app并点击操作
这篇文章主要介绍了python实现打开手机app并点击操作，本文分为两部分一部分是打开应用，第二部分是调式手机连接电脑,需要的朋友可以参考下
2022-04-04
Python利用sched模块实现定时任务
今天我们来介绍一下Python当中的定时任务，主要用到的模块是sched，文中的示例代码讲解详细，感兴趣的小伙伴可以跟随小编一起学习一下
2023-04-04
python之如何实现延迟操作
这篇文章主要介绍了python之如何实现延迟操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-04-04
Python实现号码归属地查询功能
这篇文章主要为大家详细介绍了如何利用Python实现对手机号码进行地域分析并查询归属地的功能，感兴趣的小伙伴可以跟随小编一起学习一下
2022-12-12