Shell脚本实现获取网页快照并生成缩略图

 更新时间:2015年02月09日 09:23:54   投稿:junjie  
这篇文章主要介绍了Shell脚本实现获取网页快照并生成缩略图,本文获取网页快照使用phantomjs、生成缩略图使用ImageMagick,需要的朋友可以参考下

获取网页快照并生成缩略图可分两步进行:

1、获取网页快照

2、生成缩略图

获取网页快照

这里我们用 phantomjs 来实现。关于 phantomjs 的详细用法可参考官方网站。http://phantomjs.org/

1、安装

我的环境是CentOS6.5,安装时直接下载 tarball 然后解压即可。

复制代码 代码如下:

# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-i686.tar.bz2

# tar -jxvf phantomjs-1.9.8-linux-i686.tar.bz2

# cp phantomjs-1.9.8-linux-i686/bin/phantomjs /bin/phantomjs


第二步中解压后bin目录下的 phantomjs 二进制文件即是可调用命令。

第三步是为了在以后调用命令时不必输入命令全路径。

2、调用
phantomjs的调用需要一个js脚本。这个js脚本接收两个参数,分别是网址url和快照文件名称filename,脚本snap.js内容如下:

复制代码 代码如下:

/*
 * desc: get snapshot from url
 * example: phantomjs snap.js http://www.baidu.com baidu.png
 */

var page = require('webpage').create();
var args = require('system').args;

var pageW = 1024;
var pageH = 768;

page.viewportSize = {
  width: pageW,
  height: pageH
};

var url =  args[1];
var filename = args[2];
page.open(url, function (status) {
    if (status !== 'success') {
        console.log('Unable to load ' + url + ' !');
        phantom.exit();
    } else {
        window.setTimeout(function () {
            page.clipRect = { left: 0, top: 0, width: pageW, height: pageH };
            page.render(filename);
            console.log('finish:', filename);
            phantom.exit();
        }, 1000);
    }
});

在这个脚本中还有个小小的设置,就是设置打开页面的浏览器可视区域的大小为1024*768,然后取第一屏内容。

调用命令如下:

复制代码 代码如下:

phantomjs snap.js http://www.baidu.com baidu.png

注意:这里执行命令的用户需要对目录有写权限。

3、效果

获取的截图如下:

生成缩略图

生成缩略图用的是ImageMagick工具,ImageMagick是个非常强大的图片处理工具,可对图片进行转化(格式转换、缩放、剪切、模糊、反转等)、屏幕截图、图片显示等,详细用法可参考  我的ImageMagick使用心得 一文。

1、安装

redhat系列可使用yum安装:

复制代码 代码如下:

# yum install ImageMagick ImageMagick-devel

其他平台安装请参考官方网站:http://www.imagemagick.org/script/binary-releases.php,根据你的系统选择相应的包或自己编译源码。

2、调用

我们这里只使用图片缩放工具,语法为:

复制代码 代码如下:

convert -resize 320x240 baidu.png baidu_thumbnail.png

默认是按比率缩放,如果要强制缩放,可以在尺寸后面加感叹号:
复制代码 代码如下:

convert -resize 320x240! baidu.png baidu_thumbnail.png

3、效果

生成的缩略图如下:

整合脚本
如果希望将上两步自动化,可以写一个shell脚本实现:

复制代码 代码如下:

# !/bin/bash
# desc: create snapshot from url
# example: sh createsnap.sh http://www.baidu.com baidu

URL=$1

IMAGE_NAME=$2

SNAPSHOT_NAME="${IMAGE_NAME}.png"

THUMBNAIL_NAME="${IMAGE_NAME}_thumbnail.png"

phantomjs snap.js $URL $SNAPSHOT_NAME

convert -resize 320x240 $SNAPSHOT_NAME $THUMBNAIL_NAME

exit 0

相关文章

  • Shell函数的7种用法介绍

    Shell函数的7种用法介绍

    这篇文章主要介绍了Shell函数的7种用法介绍,本文讲解了在shell文件内部定义函数并引用、返回值、函数输出、向函数传递参数、全局变量与局部变量等内容,需要的朋友可以参考下
    2014-11-11
  • Shell脚本入门之编写格式与执行方式的实现

    Shell脚本入门之编写格式与执行方式的实现

    这篇文章主要介绍了Shell脚本入门之编写格式与执行方式的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • 详解Linux中退出编辑模式的命令

    详解Linux中退出编辑模式的命令

    这篇文章主要介绍了Linux中退出编辑模式的命令,本文给大家介绍的非常详细,具有一定的参考借鉴价值 ,需要的朋友可以参考下
    2019-05-05
  • Git Tag 标签详解

    Git Tag 标签详解

    这篇文章主要介绍了Git Tag 标签以及git命令之git tag给当前分支打标签的相关知识,需要的朋友可以参考下
    2017-11-11
  • Vim 编辑器操作汇总

    Vim 编辑器操作汇总

    本文是小编给大家收藏整理的关于vim编辑器操作方法,非常不错,具有参考借鉴价值,需要的朋友参考下吧
    2018-05-05
  • shell进阶awk命令编排字段使用详解

    shell进阶awk命令编排字段使用详解

    这篇文章主要为大家介绍了shell进阶awk命令编排字段使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09
  • 使用Shell 脚本实现每隔100行插入一条记录且记录第一列包含行号其他列不变

    使用Shell 脚本实现每隔100行插入一条记录且记录第一列包含行号其他列不变

    本文通过实例代码给大家讲解了使用Shell 脚本实现每隔100行插入一条记录且记录第一列包含行号其他列不变的实现方法,非常不错,具有参考借鉴价值,需要的朋友参考下
    2016-12-12
  • linux文本分析awk基础命令介绍(8)

    linux文本分析awk基础命令介绍(8)

    这篇文章主要为大家详细介绍了linux文本分析awk基础命令,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2016-12-12
  • 一个简洁的全自动安装LNMP服务器环境的Shell脚本分享

    一个简洁的全自动安装LNMP服务器环境的Shell脚本分享

    这篇文章主要介绍了一个简洁的全自动安装LNMP服务器环境的Shell脚本分享,本文脚本在生产环境上使用了一年多,脚本代码简单唯美,需要的朋友可以参考下
    2014-12-12
  • awk中RS、ORS、FS、OFS的区别和联系小结

    awk中RS、ORS、FS、OFS的区别和联系小结

    这篇文章主要介绍了awk中RS、ORS、FS、OFS的区别和联系小结,用大量实例来说明和讲解,需要的朋友可以参考下
    2014-07-07

最新评论