NodeJs超长字符串问题处理的详细分析

 更新时间:2023年02月20日 11:39:16   作者:地铁程序员  
这篇文章主要给大家介绍了关于NodeJs超长字符串问题处理的详细分析,文中通过实例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

问题:对于超大的 string V8不能支持

问题背景

在 Nodejs 计算服务中,对端上上报的内存信息二进制数据进行预处理+缓存时,遇到了一个奇怪的报错:RangeError: Invalid string length 。根据该报错信息,查找得知是字符串长度超过了 node.js 的限制,即 2^29-1 (约 5 亿+)个字符。整体流程如图所示。

关于 node.js string 的长度上限,主要和 V8 引擎「压缩指针」技术有关。按个人理解,其通过压缩指向变量的地址(64 位)中固定的 32 位的方式,从而减少引擎的内存占用。

代码细节

由于需要快速访问某地址,因此缓存的数据结构必须是个对象,即 INodeGraph。具体结构如下:

  type IAddr = string;
// 内存图谱
  declare interface INodeGraph {
    [addr: IAddr]: IParsedNode;
  }
// 内存节点信息
  declare interface IParsedNode {
    addr: IAddr;
    // size, nodeType 等辅助信息
    parentNodeAddr: IAddr[]; // addr
    childNodeAddr: string[]; // addr
    edgeMap: {
      [addr: IAddr]: {
        // 当前节点与父子节点之间的边(关系)的信息
      };
    };
  }

我们目的很明确,就是实现这样一个 js 大对象的持久化存储,并且能够方便快速的转回 js object。为解决此问题,首先想到的能否利用 protobuf 替代 JSON 实现持久化。可惜的是 protobuf 并不适用于动态 key 的场景,它适用于处理数组中存储多个相似结构对象的数据结构。

随后尝试了减少对象中不必要的信息,即缩短对象的固定 key,例如用「pNode」取代冗长的「parentNodeAddr」。对于一个百万个键值对的 object 而言,虽然牺牲了代码的可读性,但在实际的 case 中,能承载的键值对数量大约多了 20%。
事实上回过头来看,更好的处理方式或许是用另外的 Map 存储对象的 key。例如 : 将nodeGraph.parentNodeAddr这个 key 最大程度缩短为nodeGraph.p

声明 const GraphKey = { parentNodeAddr: 'p' } 保存一个 key 的映射,需要访问某属性时,使用nodeGraph[GraphKey.parentNodeAddr]

更进一步

上述手段只是治标不治本,对于 key 更多的大对象并不能彻底解决问题。因此在不改变项目整体架构的前提下(如使用图数据库/改用 go 开发等),提出以下两个最终方案:

方案 1:借助 Node.js C++ Addons 的能力,绕开 js string 的限制,将相关序列化逻辑交给 C++ 处理,并直接将处理好的引用树 js object 进行后续处理。

  • 优势:如果能实现,性能会获得优先提升;扩展了 Node.js 的能力
  • 劣势:实现难度大;维护可能是个问题

方案 2:生成引用树缓存时,拆分为多个较小的对象,分别进行序列化和存储,使用时再合并为一个大对象。

  • 优势:无需 C++ 侧开发,难度更小;维护方便
  • 劣势:合并对象需要额外的时间,这一步骤可能会让未命中缓存时的首次请求更慢

总结

到此这篇关于NodeJs超长字符串问题处理的文章就介绍到这了,更多相关NodeJs字符串问题处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • node.js使用stream模块实现自定义流示例

    node.js使用stream模块实现自定义流示例

    这篇文章主要介绍了node.js使用stream模块实现自定义流,结合实例形式详细分析了node.js基于stream模块实现自定义的可读流、可写流、可读写流等相关操作技巧,需要的朋友可以参考下
    2020-02-02
  • mongoose中利用populate处理嵌套的方法

    mongoose中利用populate处理嵌套的方法

    这篇文章主要给大家介绍了关于mongoose中利用populate处理嵌套的方法,文中通过示例代码介绍的非常详细,对大家具有一的参考学习价值,需要的朋友们下面来一起看看吧。
    2017-05-05
  • nodejs express配置自签名https服务器的方法

    nodejs express配置自签名https服务器的方法

    这篇文章主要介绍了nodejs express配置自签名https服务器的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-05-05
  • 详解nodejs 配置文件处理方案

    详解nodejs 配置文件处理方案

    这篇文章主要介绍了详解nodejs 配置文件处理方案,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-01-01
  • 详解Node.js包的工程目录与NPM包管理器的使用

    详解Node.js包的工程目录与NPM包管理器的使用

    这篇文章主要介绍了Node.js包的工程目录与NPM包管理器的使用,可以帮助编程者更好地组织Node.js代码文件,需要的朋友可以参考下
    2016-02-02
  • Node.js连接mongo数据库上传文件的方法步骤

    Node.js连接mongo数据库上传文件的方法步骤

    本文主要介绍了Node.js连接mongo数据库上传文件的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-05-05
  • Yarn的安装与使用详细介绍

    Yarn的安装与使用详细介绍

    不知道大家有没有觉察到Facebook近年大招频出。Yarn是Facebook最近发布的一款依赖包安装工具。Yarn是一个新的快速安全可信赖的可以替代NPM的依赖管理工具,Yarn正式发布没几天已经迅速达到了数万赞,就可以知道大家苦NPM久已。这篇文章将详细介绍Yarn的安装与使用。
    2016-10-10
  • Node.js 使用AngularJS的方法示例

    Node.js 使用AngularJS的方法示例

    这篇文章主要介绍了Node.js 使用AngularJS的方法示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-05-05
  • Node.js服务器环境下使用Mock.js拦截AJAX请求的教程

    Node.js服务器环境下使用Mock.js拦截AJAX请求的教程

    Mock.js这个JavaScript库最常见的用法便是被用来拦截AJAX请求,well,这里我们就来看一下Node.js服务器环境下使用Mock.js拦截AJAX请求的教程:
    2016-05-05
  • Node koa服务器实现获取客户端ip

    Node koa服务器实现获取客户端ip

    这篇文章主要为大家详细介绍了Node koa服务器实现获取客户端ip的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起了解下
    2025-02-02

最新评论