使用phantomjs进行网页抓取的实现代码

更新时间：2014年09月29日 00:21:30 投稿：mdxy-dxy

这篇文章主要介绍了使用phantomjs进行网页抓取的实现代码,需要的朋友可以参考下

phantomjs因为是无头浏览器可以跑js，所以同样可以跑dom节点，用来进行网页抓取是再好不过了。

比如我们要批量抓取网页 “历史上的今天” 的内容。网站

对dom结构的观察发现，我们只需要取到 .list li a的title值即可。因此我们利用高级选择器构建dom片段

var d= ''
var c = document.querySelectorAll('.list li a')
var l = c.length;
for(var i =0;i<l;i++){
d=d+c[i].title+'\n'
}

之后只需要让js代码在phantomjs里跑起来即可~

var page = require('webpage').create();
	page.open('http://www.todayonhistory.com/', function (status) { //打开页面
		if (status !== 'success') {
			console.log('FAIL to load the address');
		} else {
			console.log(page.evaluate(function () {
					var d= ''
					var c = document.querySelectorAll('.list li a')
					var l = c.length;
					for(var i =0;i<l;i++){
					d=d+c[i].title+'\n'
					}
						return d
				}))

		}
		phantom.exit();
	});

最终我们另存为catch.js，在dos里面执行一下，输出内容到txt文件(也可以用phantomjs的文件api来写)

您可能感兴趣的文章:

原生JavaScrip实现语音识别的示例详解
语音识别转文本看似是很有难度的一个功能,但你知道吗,使用原生 JavaScript 也能实现语音识别功能,下面小编就来和大家讲讲具体的实现方法吧
2025-03-03
Express框架详解app函数使用实例
这篇文章主要为大家介绍了Express框架app函数使用实例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-03-03
基于Bootstrap实现图片轮播效果
这篇文章主要为大家详细介绍了基于bootstrap实现图片轮播效果的相关资料，具有一定的参考价值，感兴趣的朋友可以参考一下
2016-05-05
nestjs实现图形校验和单点登录的示例代码
本文主要介绍了nestjs实现图形校验和单点登录的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-05-05
微信小程序-消息提示框实例
本篇文章主要介绍了微信小程序-提示框，现在分享给大家，也给大家做个参考。感兴趣的小伙伴们可以参考一下。
2016-11-11
js实现旋转木马轮播图效果
这篇文章主要为大家详细介绍了js实现旋转木马轮播图，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-01-01
javascript操纵OGNL标签示例代码
这篇文章主要介绍了javascript 怎么操纵OGNL标签,需要的朋友可以参考下
2014-06-06
Fastest way to build an HTML string(拼装html字符串的最快方法)
Fastest way to build an HTML stringPosted in 'Code Snippets, JavaScript' by James on May 29th, 2009
2011-08-08
uni-app基本的数据绑定v-bind,v-for,v-on:click详解
这篇文章主要介绍了uni-app基本的数据绑定v-bind,v-for,v-on:click,本文通过示例代码给大家介绍的非常详细,需要的朋友可以参考下
2024-08-08
微信小程序实现文字跑马灯
这篇文章主要为大家详细介绍了微信小程序实现文字跑马灯，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-12-12

使用phantomjs进行网页抓取的实现代码

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具