nodeJs爬虫获取数据简单实现代码

 更新时间:2016年03月29日 17:27:29   作者:Jone_chen  
这篇文章主要为大家详细介绍了nodeJs爬虫获取数据简单实现代码,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了nodeJs爬虫获取数据代码,供大家参考,具体内容如下

var http=require('http');
var cheerio=require('cheerio');//页面获取到的数据模块
var url='http://www.jcpeixun.com/lesson/1512/';
function filterData(html){
  /*所要获取到的目标数组 
   var courseData=[{
    chapterTitle:"",
    videosData:{
      videoTitle:title,
      videoId:id,
      videoPrice:price
    }
  }] */
  var $=cheerio.load(html);
  var courseData=[];
  var chapters=$(".list-collapse");
  chapters.each(function(item){
    var chapterTitle=$(this).find(".collapse-head").find("label").text();
    var videos=$(this).find(".listview5").children("li");
    var chaptersData={
      chaptersTitle:chapterTitle,
      videosData:[]
    }
    videos.each(function(item){
      var videoTitle=$(this).find(".ml10").attr('data-lesson-name');
      var videoId=$(this).find(".ml10").attr('data-lesson-id');
      var vadeoPrice=$(this).find(".colblue").text();
      chaptersData.videosData.push({
        title:videoTitle,
        id:videoId,
        price:vadeoPrice
      })
    })
    courseData.push(chaptersData) 
  })
  return courseData
}
function printCourseInfo(courseData){
  courseData.forEach(function(item){
    console.log(item.chaptersTitle+'\n');
    item.videosData.forEach(function(item){
      console.log(item.title+'【'+item.id+'】'+item.price+'\n')
    })
  })
}
http.get(url,function(res){
  html="";
  res.on("data",function(data){
    html+=data
  })
  res.on('end',function(){
    var courseData=filterData(html);
    printCourseInfo(courseData)
  })
})

效果图:

以上就是nodeJs爬虫获取数据的相关代码,希望对大家的学习有所帮助。

相关文章

  • Node中的util.promisify()方法的基本使用和实现

    Node中的util.promisify()方法的基本使用和实现

    众所周知,在JS中实现异步编程主要是通过以下几种方案,回调函数,观察者模式,Generator,Promise,async / await ,今天就和大家一起聊一下在node中的一个util.promisify()这个API的基本使用和基本实现
    2023-07-07
  • 详解一个基于套接字实现长连接的express

    详解一个基于套接字实现长连接的express

    这篇文章主要介绍了详解一个基于套接字实现长连接的express,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-03-03
  • 使用nvm管理不同版本的node与npm的方法

    使用nvm管理不同版本的node与npm的方法

    本篇文章主要介绍了使用 nvm 管理不同版本的 node 与 npm的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-10-10
  • node.js对应npm安装和使用方法教程

    node.js对应npm安装和使用方法教程

    这篇文章主要给大家介绍了关于node.js对应npm安装和使用方法的相关资料,文中通过代码介绍的非常详细,对大家学习或者使用node.js具有一定的参考借鉴价值,需要的朋友可以参考下
    2024-01-01
  • Node.js文件写入教程逐步深入探讨

    Node.js文件写入教程逐步深入探讨

    这篇文章主要为大家介绍了Node.js文件写入教程逐步深入探讨,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11
  • 使用node打造自己的命令行工具方法教程

    使用node打造自己的命令行工具方法教程

    这篇文章主要介绍了使用node打造自己的命令行工具方法教程,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-03-03
  • NodeJs crypto加密制作token的实现代码

    NodeJs crypto加密制作token的实现代码

    这篇文章主要介绍了NodeJs crypto加密制作token的实现代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • Node.js中的events事件模块知识点总结

    Node.js中的events事件模块知识点总结

    在本篇文章里小编给大家整理的是一篇关于Node.js中的events事件模块知识点总结内容,有兴趣的朋友们可以跟着学习下。
    2021-12-12
  • import与export在node.js中的使用详解

    import与export在node.js中的使用详解

    本篇文章主要介绍了import与export在node.js中的使用详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09
  • 使用npm命令提示: ''npm'' 不是内部或外部命令,也不是可运行的程序的处理方法

    使用npm命令提示: ''npm'' 不是内部或外部命令,也不是可运行的程序的处理方法

    这篇文章主要介绍了使用npm命令提示: 'npm' 不是内部或外部命令,也不是可运行的程序,本文通过图文并茂的形式给大家分享解决方案,需要的朋友可以参考下
    2020-05-05

最新评论