node.js学习笔记之koa框架和简单爬虫练习

 更新时间:2018年12月13日 14:58:03   作者:liangsheng0111  
这篇文章主要介绍了node.js学习笔记之koa框架和简单爬虫练习,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

Koa -- 基于 Node.js 平台的下一代 web 开发框架

koa是由 Express 原班人马打造的,致力于成为一个更小、更富有表现力、更健壮的 Web 框架。 使用 koa 编写 web 应用,可以免除重复繁琐的回调函数嵌套, 并极大地提升错误处理的效率。koa 不在内核方法中绑定任何中间件, 它仅仅提供了一个轻量优雅的函数库,使得编写 Web 应用变得得心应手。开发思路和express差不多,最大的特点就是可以避免异步嵌套。koa2利用ES7的async/await特性,极大的解决了我们在做nodejs开发的时候异步给我们带来的烦恼。

英文官网:http://koajs.com

中文官网:http://koajs.cn

1.koa

安装koa包: npm i -S koa@latest
引入: const koa = require("koa");
实例化对象: const app = new koa;

通过实例操作,专门用于客户端请求的函数叫做中间件,使用use()注册

use()函数中必须使用异步 async; use可是调用无数次;

其中有两个参数:

a)ctx: 上下文环境,node的请求和响应对象,其中不建议使用node原生的req和res属性,使用koa封装的requset和response属性

b)next: next(),将本次控制权交给下一个中间件。

最后一个中间件使用next()无意义,执行完控制权返回上一层,直至第一个。

1. next参数的使用demo

const Koa = require("koa");
const koa = new Koa();
//中间件1
koa.use(async (ctx, next) => {
console.log("1 , 接收请求控制权");
await next(); //将控制权传给下一个中间件
console.log("1 , 返回请求控制权");
});    //将中间件注册到koa的实例上

//中间件2
koa.use(async (ctx, next) => {
 console.log("2 , 接收请求控制权");
await next();
console.log("2 , 返回请求控制权");
}); 

//中间件3
koa.use(async (ctx, next) => {
console.log("3 , 接收请求控制权");
 console.log("3 ,返回请求控制权");
});
koa.listen(3000, ()=>{
 console.log("开始监听3000端口");
});

注:当中间件中没有next(),不会执行下面的中间件

访问localhost:3000的效果图;

注:会有两次操作是因为图标icon也会请求一次

2.ctx参数的使用demo

const Koa = require("koa");
const koa = new Koa(); 
koa.use(async (ctx, next)=>{
 ctx.body = "body可以返回数据,";
 ctx.body += "可以多次调用,";
 ctx.body += "不需要end()";
});
koa.listen(3000, ()=>{
 console.log("监听开始");
});

效果:

ctx.url ,ctx.path ,ctx.query ,ctx.querystring ,ctx.state ,ctx.type

const Koa = require("koa");
const koa = new Koa(); 
koa.use(async (ctx, next)=>{
 ctx.body = ctx.url;
 ctx.body = ctx.path;
 ctx.body = ctx.query;
 ctx.body = ctx.querystring;
});
koa.listen(3000, ()=>{
 console.log("监听开始");
});

访问http://localhost:3000/path?name=sjl&age=18为例,效果图:

1. url: 整个路径

2. path: 非查询部分

3. query: 将查询部分转为JSON对象

4. querystring: 将查询部分转为字符串

5. ctx.state ,ctx.type 表示状态吗和类型

2.简单爬虫练习

安装request,cheerio模块

npm i -S request: 请求模块
npm i -S cheerio: 抓取页面模块(JQ核心)

抓取网页数据案例(随机网页)

//导入模块
const request = require("superagent"); //导入请求模块
const cheerio = require("cheerio");
const {join} = require("path");
const fs = require("fs");

let arr = [], //存放数据
 reg = /\n|\s+/g, //replace中使用
 url = "https://www.shiguangkey.com/course/search?key=%E5%89%8D%E7%AB%AF/";
request
 .get(url)
 .end((err, res) => {
  const $ = cheerio.load(res.text); //把字符串内的标签当成dom来使用
  $(".course-item").each((i, v) => {
   // v当前进来的dom,根据网页的布局结构来找到准确的dom节点
   const obj = {
    imgSrc : $(v).find("img").prop("src"),
    price : $(v).find(".fr span").text().replace(reg, ""),
    total : $(v).find(".item-txt").text().replace(reg, ""),
    href : join(url + $(v).find(".cimg").prop("href"))
   };
   console.log(join(url + $(v).find(".cimg").prop("href"))); //拼接
   arr.push(obj); //把对象放进数组里
  });
  
  fs.writeFile("./sjl.json", JSON.stringify(arr)); //将爬到的数据写入文档中
 });

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 浅析Node.js中的内存泄漏问题

    浅析Node.js中的内存泄漏问题

    这篇文章主要介绍了浅析Node.js中的内存泄漏问题,Node.js是使JavaScript应用在服务器端运行的一款框架,需要的朋友可以参考下
    2015-06-06
  • 深入探究node之Transform

    深入探究node之Transform

    这篇文章主要介绍了深入探究node之Transform,本文深入内部阐述Transform的运行机理及使用技巧,有兴趣的可以了解一下
    2017-07-07
  • 究竟什么是Node.js?Node.js有什么好处?

    究竟什么是Node.js?Node.js有什么好处?

    这篇文章主要介绍了究竟什么是Node.js?Node.js有什么好处?,为试图解释什么是 Node.js,本文将简要介绍一些背景信息:它要解决的问题,它如何工作,如何运行一个简单应用程序,最后,Node 在什么情况下是一个好的解决方案,需要的朋友可以参考下
    2015-05-05
  • 从零开始学习Node.js

    从零开始学习Node.js

    这篇文章主要介绍了从零开始学习Node.js结合具体实例形式分析了使用方法与相关注意事项,需要的朋友可以参考下,希望能够给你带来帮助
    2021-09-09
  • Nodejs-child_process模块详细介绍

    Nodejs-child_process模块详细介绍

    Node.js的child进程模块允许创建并行任务,提高应用性能,介绍了exec、execFile、spawn、fork等方法,解释了它们的使用场景和优势,通过子进程模块,可以执行外部命令、脚本或创建新的Node.js实例,感兴趣的朋友跟随小编一起看看吧
    2024-09-09
  • 一文教会你从Windows中完全删除node.js

    一文教会你从Windows中完全删除node.js

    作为新手nodejs卸载后安装就总出错,下面这篇文章主要给大家介绍了关于如何从Windows中完全删除node.js的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-08-08
  • 爬虫利器Puppeteer实战

    爬虫利器Puppeteer实战

    本文详细的介绍了什么是Puppeteer以及使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-01-01
  • npm install安装失败报错:The operation was rejected by your operating system

    npm install安装失败报错:The operation was rejected by your 

    这篇文章主要给大家介绍了关于npm install安装失败报错:The operation was rejected by your operating system的相关资料,文中给出了多种解决方法供大家参考学习,需要的朋友可以参考下
    2023-04-04
  • 深入理解Node.js回调函数

    深入理解Node.js回调函数

    这篇文章主要介绍了Node.js回调函数,为了解决回调函数的缺点,出现了一些替代方案,如Promise、async/await等,这些方案提供了更简洁、可读性更高的代码结构,使异步编程更加容易和可维护,需要的朋友可以参考下
    2023-11-11
  • node.js配置Token验证的2种方式总结

    node.js配置Token验证的2种方式总结

    token验证,在设计登录注册和一些权限接口时发挥作用,下面这篇文章主要给大家介绍了关于node.js配置Token验证的2种方式,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2023-02-02

最新评论