详解C++ 存储二进制数据容器的几种方法

 更新时间:2025年12月03日 11:13:10   作者:永不落幕的物语  
本文主要介绍了详解C++ 存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::vector,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

1.std::vector<uint8_t>(最常用)

std::vector 是动态数组容器,搭配 uint8_t(无符号8位整数,即1字节)是存储二进制数据的首选方案,尤其适合长度不确定的二进制流(如文件内容、网络数据包)。

特点:

  • 动态大小:可随数据量自动扩容,支持 push_backresize 等操作,灵活处理变长二进制数据。
  • 连续内存:元素在内存中连续存储,可通过 data() 方法获取原始字节指针(uint8_t*),方便与 C 风格接口(如系统调用、网络函数)交互。
  • C++11 增强:支持移动语义(std::move),避免大二进制数据的拷贝开销;支持初始化列表({0x01, 0x02, 0x03})快速初始化。

适用场景:

  • 读取文件二进制内容(如图片、音频)。
  • 网络通信中的缓冲区(发送/接收字节流)。
  • 动态生成的二进制数据(如加密后的字节序列)。

示例:

#include <vector>
#include <cstdint>  // 包含uint8_t

int main() {
    // 存储二进制数据(例如一个简单的协议包)
    std::vector<uint8_t> binary_data = {0x01, 0x02, 0xFF, 0x00};
    
    // 动态添加数据
    binary_data.push_back(0x03);
    
    // 获取原始字节指针,用于C风格接口
    uint8_t* raw_ptr = binary_data.data();
    size_t size = binary_data.size();  // 字节数:5
    return 0;
}

2.std::array<uint8_t, N>(固定大小二进制数据)

std::array 是 C++11 新增的固定大小数组容器,适合存储长度已知且固定的二进制数据(如协议头、固定大小的校验码)。

特点:

  • 编译期固定大小:声明时需指定长度(如 std::array<uint8_t, 16> 表示16字节),内存分配在栈上(或静态区),无需动态内存管理。
  • 连续内存:同 vector,支持 data() 获取原始指针,性能优于动态数组。
  • 无额外开销:相比 vector 没有动态扩容的额外内存(如容量管理的指针),空间效率更高。

适用场景:

  • 固定格式的二进制协议头(如16字节的TCP头部部分字段)。
  • 哈希值、UUID等固定长度的二进制数据(如16字节的MD5结果)。
  • 嵌入式系统中对内存分配有严格限制的场景。

示例:

#include <array>
#include <cstdint>

int main() {
    // 存储16字节的固定二进制数据(如UUID)
    std::array<uint8_t, 16> uuid = {
        0x00, 0x11, 0x22, 0x33, 0x44, 0x55, 0x66, 0x77,
        0x88, 0x99, 0xAA, 0xBB, 0xCC, 0xDD, 0xEE, 0xFF
    };
    
    // 访问单个字节
    uint8_t first_byte = uuid[0];  // 0x00
    return 0;
}

3.std::string(兼容字符串操作的二进制数据)

std::string 本质是“字节序列容器”(C++标准未限制必须是字符串),可存储包含空字符(\0)的二进制数据,适合需要同时支持字符串操作和二进制存储的场景。

特点:

  • 兼容字符串API:可使用 substrfind 等方法处理二进制数据中的片段,方便解析包含文本标识的二进制流(如HTTP协议中的二进制附件)。
  • 连续内存:支持 data()c_str() 获取字节指针(注意 c_str() 会在末尾附加 \0,但 data() 在C++11中与 c_str() 等效,需谨慎处理)。
  • 注意事项:二进制数据中的 \0 不会被视为“结束符”,size() 方法会返回真实字节数(包含 \0)。

适用场景:

  • 存储包含文本和二进制混合的数据(如邮件中的MIME附件)。
  • 需要对二进制数据进行子串查找、拼接等操作的场景。

示例:

#include <string>
#include <cstdint>

int main() {
    // 存储包含空字符的二进制数据
    std::string binary_str;
    binary_str += static_cast<char>(0x01);
    binary_str += static_cast<char>(0x00);  // 空字符,仍会被计入长度
    binary_str += static_cast<char>(0x02);
    
    std::cout << "长度:" << binary_str.size();  // 输出3(包含空字符)
    return 0;
}

4.std::bitset<N>(固定大小比特序列)

std::bitset 用于存储固定长度的比特(bit)序列(而非字节),适合需要精确控制每一个比特的场景(如标志位、压缩存储布尔值)。

特点:

  • 比特级操作:支持单个比特的设置(set)、清空(reset)、翻转(flip),以及批量逻辑运算(与、或、异或)。
  • 编译期固定大小:长度 N 必须是编译期常量(如 std::bitset<32> 表示32个比特)。
  • 空间高效:每个比特仅占1/8字节,比 vector<bool> 更高效(无额外指针开销)。

适用场景:

  • 存储大量布尔标志(如32个状态标志仅需4字节)。
  • 协议中的比特位字段(如TCP头部的控制位:SYN、ACK等)。
  • 比特级算法(如位掩码、压缩算法)。

示例:

#include <bitset>

int main() {
    // 32位比特序列,存储标志位
    std::bitset<32> flags;
    
    // 设置第0位和第2位(从0开始)
    flags.set(0);
    flags.set(2);
    
    // 检查第0位是否为1
    bool is_set = flags.test(0);  // true
    
    // 整体转换为整数(获取比特序列的数值)
    uint32_t value = flags.to_ulong();  // 二进制101 → 十进制5
    return 0;
}

5.std::vector<bool>(动态比特序列)

std::vector<bool>vector 的特化版本,用于存储动态长度的比特序列,本质是“比特容器”(每个元素占1比特)。

特点:

  • 动态大小:长度可在运行时调整(如 push_back 添加比特),适合比特数不确定的场景。
  • 空间优化:比 vector<uint8_t> 节省空间(存储1000个布尔值仅需约125字节)。
  • 注意事项:迭代器行为特殊(返回代理对象而非直接引用),部分操作效率可能低于 std::bitsetvector<uint8_t>

适用场景:

  • 动态生成的比特流(如编码算法输出的可变长度比特序列)。
  • 存储数量不确定的布尔状态(如动态筛选结果的标志)。

示例:

#include <vector>

int main() {
    // 动态比特序列
    std::vector<bool> bits;
    
    // 添加比特
    bits.push_back(true);   // 第0位:1
    bits.push_back(false);  // 第1位:0
    bits.push_back(true);   // 第2位:1
    
    // 访问第2位
    bool bit2 = bits[2];  // true
    return 0;
}

总结

C++ 中存储二进制数据的核心选择及适用场景:

数据结构存储单位大小特性核心优势适用场景
std::vector<uint8_t>字节动态大小灵活、连续内存、适合变长数据网络缓冲区、文件内容、动态字节流
std::array<uint8_t, N>字节固定大小(编译期)无动态开销、栈上分配协议头、固定长度哈希/UUID
std::string字节动态大小兼容字符串操作,支持混合数据文本+二进制混合数据、带标识的字节流
std::bitset<N>比特固定大小(编译期)高效比特操作、空间紧凑标志位、固定长度比特字段
std::vector<bool>比特动态大小动态调整比特数,空间优化变长比特流、动态布尔状态集合

根据需求选择:动态字节流优先用 vector<uint8_t>,固定字节用 array,比特级操作选 bitsetvector<bool>,混合文本和二进制用 std::string

到此这篇关于详解C++ 存储二进制数据容器的几种方法的文章就介绍到这了,更多相关C++ 存储二进制内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 一文读懂C++中Protobuf

    一文读懂C++中Protobuf

    Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化、或者说序列化,本文详解了Protobuf的使用,具有一定的参考价值,感兴趣的可以了解一下
    2023-05-05
  • 浅析C/C++中sort函数的用法

    浅析C/C++中sort函数的用法

    做项目的时候,排序是一种经常要用到的操作。如果每次都自己写个冒泡之类的O(n^2)排序,不但程序容易超时,而且浪费宝贵的时间,还很有可能写错。STL里面有个sort函数,可以直接对数组排序,复杂度为n*log2(n)。
    2014-09-09
  • C++实现贪吃蛇游戏

    C++实现贪吃蛇游戏

    这篇文章主要为大家详细介绍了C++实现贪吃蛇游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-12-12
  • C语言单链表实现图书管理系统

    C语言单链表实现图书管理系统

    这篇文章主要为大家详细介绍了C语言单链表实现图书管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-03-03
  • c++中移动语义和完美转发及易错点

    c++中移动语义和完美转发及易错点

    C++ 中的移动语义和完美转发是 C++11 引入的两个重要特性,它们分别用于提高性能和灵活性,这篇文章主要介绍了c++中移动语义和完美转发,需要的朋友可以参考下
    2023-09-09
  • C语言数据结构之满二叉树、完全二叉树的节点数计算详解

    C语言数据结构之满二叉树、完全二叉树的节点数计算详解

    这篇文章主要介绍了C语言数据结构之满二叉树、完全二叉树节点数计算的相关资料,通过代码示例详细展示了如何计算这两种二叉树的节点数量,包括总节点数、叶子数、度为1和度为2的节点数,需要的朋友可以参考下
    2026-01-01
  • C++ Boost Spirit精通教程

    C++ Boost Spirit精通教程

    Boost是为C++语言标准库提供扩展的一些C++程序库的总称。Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一,是为C++语言标准库提供扩展的一些C++程序库的总称
    2022-11-11
  • 详解如何用alpine镜像做一个最小的镜像并运行c++程序

    详解如何用alpine镜像做一个最小的镜像并运行c++程序

    这篇文章主要介绍了详解如何用alpine镜像做一个最小的镜像并运行c++程序,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • C语言动态内存管理的原理及实现方法

    C语言动态内存管理的原理及实现方法

    C语言动态内存管理的原理是通过 malloc() 函数申请一块连续的内存空间,并返回其地址,通过 free() 函数释放该内存空间。实现方法是通过在程序运行时动态地管理内存,即在需要内存时申请,不需要时释放,避免了静态内存分配的浪费和不足
    2023-04-04
  • C语言用数组实现反弹球消砖块

    C语言用数组实现反弹球消砖块

    这篇文章主要为大家详细介绍了C语言用数组实现反弹球消砖块,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-05-05

最新评论