nodeJs爬虫获取数据简单实现代码

 更新时间:2016年03月29日 17:27:29   作者:Jone_chen  
这篇文章主要为大家详细介绍了nodeJs爬虫获取数据简单实现代码,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了nodeJs爬虫获取数据代码,供大家参考,具体内容如下

var http=require('http');
var cheerio=require('cheerio');//页面获取到的数据模块
var url='http://www.jcpeixun.com/lesson/1512/';
function filterData(html){
  /*所要获取到的目标数组 
   var courseData=[{
    chapterTitle:"",
    videosData:{
      videoTitle:title,
      videoId:id,
      videoPrice:price
    }
  }] */
  var $=cheerio.load(html);
  var courseData=[];
  var chapters=$(".list-collapse");
  chapters.each(function(item){
    var chapterTitle=$(this).find(".collapse-head").find("label").text();
    var videos=$(this).find(".listview5").children("li");
    var chaptersData={
      chaptersTitle:chapterTitle,
      videosData:[]
    }
    videos.each(function(item){
      var videoTitle=$(this).find(".ml10").attr('data-lesson-name');
      var videoId=$(this).find(".ml10").attr('data-lesson-id');
      var vadeoPrice=$(this).find(".colblue").text();
      chaptersData.videosData.push({
        title:videoTitle,
        id:videoId,
        price:vadeoPrice
      })
    })
    courseData.push(chaptersData) 
  })
  return courseData
}
function printCourseInfo(courseData){
  courseData.forEach(function(item){
    console.log(item.chaptersTitle+'\n');
    item.videosData.forEach(function(item){
      console.log(item.title+'【'+item.id+'】'+item.price+'\n')
    })
  })
}
http.get(url,function(res){
  html="";
  res.on("data",function(data){
    html+=data
  })
  res.on('end',function(){
    var courseData=filterData(html);
    printCourseInfo(courseData)
  })
})

效果图:

以上就是nodeJs爬虫获取数据的相关代码,希望对大家的学习有所帮助。

相关文章

  • Node.js有效处理并发连接的过程

    Node.js有效处理并发连接的过程

    在现代 web 开发中,处理并发连接是一个对于构建高性能服务器至关重要的话题,Node.js 是一个使用 JavaScript 作为编程语言的服务器端环境,在这篇博客中,我们将深入探讨 Node.js 如何有效地管理并发连接,并提供一些示例代码以便于更好地理解这个过程
    2024-10-10
  • Node.js实现Excel转JSON

    Node.js实现Excel转JSON

    本文给大家记录的是个人项目中遇到的,使用node.js实现Excel转换成Json的方法和过程,十分的简单实用,也很详细,这里推荐给有需要的小伙伴参考下。
    2015-04-04
  • Node中node_modules文件夹及package.json文件的作用说明

    Node中node_modules文件夹及package.json文件的作用说明

    这篇文章主要介绍了Node中node_modules文件夹及package.json文件的作用说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-09-09
  • 详解NodeJS模块化

    详解NodeJS模块化

    简单的说Node.js就是运行在服务端的JavaScript。Node.js是一个基于Chrome JavaScript运行时建立的一个平台。Node.js是一个事件驱动I/O服务端JavaScript环境,基于Google的V8引擎,V8引擎执行Javascript的速度非常快,性能非常好
    2021-06-06
  • nodeJS代码实现计算交社保是否合适

    nodeJS代码实现计算交社保是否合适

    本文通过nodejs的一个具体示例来对比分析现阶段我们交社保合不合适,主要是对nodejs的一个小的应用,当然大家也可以改成其他语言的,程序猿们,来算算吧。
    2015-03-03
  • 前端需知nodejs express中间件使用及定义详解

    前端需知nodejs express中间件使用及定义详解

    这篇文章主要为大家介绍了前端需知nodejs express中间件使用及定义详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-10-10
  • node.js实现批量修改git项目的数据源(步骤详解)

    node.js实现批量修改git项目的数据源(步骤详解)

    文章介绍了如何使用Node.js脚本批量修改大型项目中各个项目的Git地址域名,通过引入模块、声明域名常量、定义遍历函数和修改目录等步骤,实现一次性批量修改,从而节省时间和精力
    2024-11-11
  • 快速查询nodejs版本信息的六种方法

    快速查询nodejs版本信息的六种方法

    Node.js是一款基于Chrome V8引擎的快速、轻量级的JavaScript运行时,随着应用程序规模越来越庞大,Node.js版本的更新也日益频繁,这篇文章旨在帮助开发者们快速查询Node.js版本信息,需要的朋友可以参考下
    2023-11-11
  • node.js中的fs.read方法使用说明

    node.js中的fs.read方法使用说明

    这篇文章主要介绍了node.js中的fs.read方法使用说明,本文介绍了fs.read方法说明、语法、接收参数、使用实例和实现源码,需要的朋友可以参考下
    2014-12-12
  • 浅谈NodeJS中require路径问题

    浅谈NodeJS中require路径问题

    学习Nodejs也是出于对这个新产物的好奇,而且有两个重要项目也需要他的支持,所以要好好学学这个新语种。在nodejs中,模块大概可以分为核心模块和文件模块。核心模块是被编译成二进制代码,引用的时候只需require表示符即可
    2015-05-05

最新评论