Python实现推送百度链接的示例代码

 更新时间:2021年12月27日 08:54:40   作者:LyShark  
有时为了提高搜索效率,也让搜索引擎更容易发现自己的文章,我们需要将文章链接推送到百度站长平台,起到快速收录的目的。本文将主要介绍如何通过Python实现这一功能,需要的可以参考一下

通过代码实现抓取个人博客中某一页指定文章链接,并批量将该链接推送到百度站长平台,起到快速收录的目的。 

import sys
import requests
from bs4 import BeautifulSoup

# 推送百度爬虫
def push_page(url):
    headers = {
        'User-Agent': 'curl/7.12.1',
        'Host': 'data.zz.baidu.com',
        'Content-Type': 'text/plain',
        'Content-Length': '83'
    }
    urls = "http://data.zz.baidu.com/urls?site=https://www.lyshark.com&token=xxxxxxx"
    try:
        html = requests.post(urls, headers=headers, data=url, timeout=5).text
        push_status = eval(html)['success']
        if push_status == 1:
            return 1
        else:
            return 0
    except:
        return 0

# 获取路径
def get_page(page):
    html = requests.get(page,timeout=5).text
    try:
        bs = BeautifulSoup(html,"html.parser")
        ret = bs.select('div[class="container"] div[class="row"] h2[class="post-title"] a')
        for item in ret:
            push_url = item.get('href')
            push_ref = push_page(push_url)
            print("推送: {} --> 状态: {}".format(push_url,push_ref))
        return 1
    except:
        return 0

if __name__ == "__main__":
    arg = sys.argv
    get_page(arg[1])

补充

在百度的站长平台上介绍了链接提交方法,目前有这四种:

主动推送:最快的提交方式,推荐将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。

自动推送:最为便捷的提交方式,将自动推送的JS代码部署在站点的每一个页面源代码中,部署代码的页面在每次被浏览时,链接会被自动推送给百度。可以与主动推送配合使用。

sitemap:将网站链接放到sitemap中,然后将sitemap的地址提交给百度。百度会周期性的抓取检查您提交的sitemap,对其中的链接进行处理,但收录速度慢于主动推送。

手动提交:操作起来麻烦。

为了让网站最新的内容更加及时的提交给百度,使用主动推送就很必要,百度给的例子中没有 Python 的。根据 Google 了一下,还真找到了不错的脚本,分享收藏一下。

以下脚本使用 Python3,未在 Python2 环境下测试过。

读取本地生成的 sitemap.txt 文件

另外,可尝试以下脚本。

到此这篇关于Python实现推送百度链接的示例代码的文章就介绍到这了,更多相关Python推送百度链接内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 关于Python的json字符串与json模块解读

    关于Python的json字符串与json模块解读

    这篇文章主要介绍了关于Python的json字符串与json模块解读,JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等),这些特性使JSON成为理想的数据交换语言,需要的朋友可以参考下
    2023-07-07
  • Python 实现进度条的六种方式

    Python 实现进度条的六种方式

    这篇文章主要介绍了Python 实现进度条的六种方式,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01
  • 把项目从Python2.x移植到Python3.x的经验总结

    把项目从Python2.x移植到Python3.x的经验总结

    这篇文章主要介绍了把项目从Python2.x移植到Python3.x的经验总结,包括作者所使用的Jinja2框架中一些需要注意的地方,需要的朋友可以参考下
    2015-04-04
  • Python实现HTML转Word的示例代码

    Python实现HTML转Word的示例代码

    这篇文章主要为大家详细介绍了使用Python实现HTML转Word的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2023-12-12
  • Python+selenium 获取浏览器窗口坐标、句柄的方法

    Python+selenium 获取浏览器窗口坐标、句柄的方法

    今天小编就为大家分享一篇Python+selenium 获取浏览器窗口坐标、句柄的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python实例详解递归算法

    Python实例详解递归算法

    递归(英语:Recursion),又译为递回,在数学与计算机科学中,是指在函数的定义中使用函数自身的方法。递归一词还较常用于描述以自相似方法重复事物的过程。本文将详细为大家介绍Python中的递归算法,需要的可以参考一下
    2022-03-03
  • 详解多线程Django程序耗尽数据库连接的问题

    详解多线程Django程序耗尽数据库连接的问题

    这篇文章主要介绍了多线程Django程序耗尽数据库连接的问题,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-10-10
  • Python 发送邮件方法总结

    Python 发送邮件方法总结

    这篇文章主要介绍了Python 发送邮件的几种方法,帮助大家更好的理解和学习Python,感兴趣的朋友可以了解下
    2020-08-08
  • Python文件操作基础及异常处理

    Python文件操作基础及异常处理

    这篇文章主要介绍了文件操作的基本方法,包括如何打开和关闭文件、使用with语句管理文件、读取和写入文件内容、处理文件异常、进行二进制文件操作以及文件路径的说明,,需要的朋友可以参考下
    2025-03-03
  • Python实现双色球号码随机生成

    Python实现双色球号码随机生成

    和体彩大乐透类似,福彩双色球也是购买次数最多的彩种之一,相比大乐透,双色球更容易中小奖。本文将介绍 Python 实习双色球彩票自由的流程,感兴趣的可以了解一下
    2022-05-05

最新评论