详解C++ 存储二进制数据容器的几种方法

 更新时间:2025年12月03日 11:13:10   作者:永不落幕的物语  
本文主要介绍了详解C++ 存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::vector,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

1.std::vector<uint8_t>(最常用)

std::vector 是动态数组容器,搭配 uint8_t(无符号8位整数,即1字节)是存储二进制数据的首选方案,尤其适合长度不确定的二进制流(如文件内容、网络数据包)。

特点:

  • 动态大小:可随数据量自动扩容,支持 push_backresize 等操作,灵活处理变长二进制数据。
  • 连续内存:元素在内存中连续存储,可通过 data() 方法获取原始字节指针(uint8_t*),方便与 C 风格接口(如系统调用、网络函数)交互。
  • C++11 增强:支持移动语义(std::move),避免大二进制数据的拷贝开销;支持初始化列表({0x01, 0x02, 0x03})快速初始化。

适用场景:

  • 读取文件二进制内容(如图片、音频)。
  • 网络通信中的缓冲区(发送/接收字节流)。
  • 动态生成的二进制数据(如加密后的字节序列)。

示例:

#include <vector>
#include <cstdint>  // 包含uint8_t

int main() {
    // 存储二进制数据(例如一个简单的协议包)
    std::vector<uint8_t> binary_data = {0x01, 0x02, 0xFF, 0x00};
    
    // 动态添加数据
    binary_data.push_back(0x03);
    
    // 获取原始字节指针,用于C风格接口
    uint8_t* raw_ptr = binary_data.data();
    size_t size = binary_data.size();  // 字节数:5
    return 0;
}

2.std::array<uint8_t, N>(固定大小二进制数据)

std::array 是 C++11 新增的固定大小数组容器,适合存储长度已知且固定的二进制数据(如协议头、固定大小的校验码)。

特点:

  • 编译期固定大小:声明时需指定长度(如 std::array<uint8_t, 16> 表示16字节),内存分配在栈上(或静态区),无需动态内存管理。
  • 连续内存:同 vector,支持 data() 获取原始指针,性能优于动态数组。
  • 无额外开销:相比 vector 没有动态扩容的额外内存(如容量管理的指针),空间效率更高。

适用场景:

  • 固定格式的二进制协议头(如16字节的TCP头部部分字段)。
  • 哈希值、UUID等固定长度的二进制数据(如16字节的MD5结果)。
  • 嵌入式系统中对内存分配有严格限制的场景。

示例:

#include <array>
#include <cstdint>

int main() {
    // 存储16字节的固定二进制数据(如UUID)
    std::array<uint8_t, 16> uuid = {
        0x00, 0x11, 0x22, 0x33, 0x44, 0x55, 0x66, 0x77,
        0x88, 0x99, 0xAA, 0xBB, 0xCC, 0xDD, 0xEE, 0xFF
    };
    
    // 访问单个字节
    uint8_t first_byte = uuid[0];  // 0x00
    return 0;
}

3.std::string(兼容字符串操作的二进制数据)

std::string 本质是“字节序列容器”(C++标准未限制必须是字符串),可存储包含空字符(\0)的二进制数据,适合需要同时支持字符串操作和二进制存储的场景。

特点:

  • 兼容字符串API:可使用 substrfind 等方法处理二进制数据中的片段,方便解析包含文本标识的二进制流(如HTTP协议中的二进制附件)。
  • 连续内存:支持 data()c_str() 获取字节指针(注意 c_str() 会在末尾附加 \0,但 data() 在C++11中与 c_str() 等效,需谨慎处理)。
  • 注意事项:二进制数据中的 \0 不会被视为“结束符”,size() 方法会返回真实字节数(包含 \0)。

适用场景:

  • 存储包含文本和二进制混合的数据(如邮件中的MIME附件)。
  • 需要对二进制数据进行子串查找、拼接等操作的场景。

示例:

#include <string>
#include <cstdint>

int main() {
    // 存储包含空字符的二进制数据
    std::string binary_str;
    binary_str += static_cast<char>(0x01);
    binary_str += static_cast<char>(0x00);  // 空字符,仍会被计入长度
    binary_str += static_cast<char>(0x02);
    
    std::cout << "长度:" << binary_str.size();  // 输出3(包含空字符)
    return 0;
}

4.std::bitset<N>(固定大小比特序列)

std::bitset 用于存储固定长度的比特(bit)序列(而非字节),适合需要精确控制每一个比特的场景(如标志位、压缩存储布尔值)。

特点:

  • 比特级操作:支持单个比特的设置(set)、清空(reset)、翻转(flip),以及批量逻辑运算(与、或、异或)。
  • 编译期固定大小:长度 N 必须是编译期常量(如 std::bitset<32> 表示32个比特)。
  • 空间高效:每个比特仅占1/8字节,比 vector<bool> 更高效(无额外指针开销)。

适用场景:

  • 存储大量布尔标志(如32个状态标志仅需4字节)。
  • 协议中的比特位字段(如TCP头部的控制位:SYN、ACK等)。
  • 比特级算法(如位掩码、压缩算法)。

示例:

#include <bitset>

int main() {
    // 32位比特序列,存储标志位
    std::bitset<32> flags;
    
    // 设置第0位和第2位(从0开始)
    flags.set(0);
    flags.set(2);
    
    // 检查第0位是否为1
    bool is_set = flags.test(0);  // true
    
    // 整体转换为整数(获取比特序列的数值)
    uint32_t value = flags.to_ulong();  // 二进制101 → 十进制5
    return 0;
}

5.std::vector<bool>(动态比特序列)

std::vector<bool>vector 的特化版本,用于存储动态长度的比特序列,本质是“比特容器”(每个元素占1比特)。

特点:

  • 动态大小:长度可在运行时调整(如 push_back 添加比特),适合比特数不确定的场景。
  • 空间优化:比 vector<uint8_t> 节省空间(存储1000个布尔值仅需约125字节)。
  • 注意事项:迭代器行为特殊(返回代理对象而非直接引用),部分操作效率可能低于 std::bitsetvector<uint8_t>

适用场景:

  • 动态生成的比特流(如编码算法输出的可变长度比特序列)。
  • 存储数量不确定的布尔状态(如动态筛选结果的标志)。

示例:

#include <vector>

int main() {
    // 动态比特序列
    std::vector<bool> bits;
    
    // 添加比特
    bits.push_back(true);   // 第0位:1
    bits.push_back(false);  // 第1位:0
    bits.push_back(true);   // 第2位:1
    
    // 访问第2位
    bool bit2 = bits[2];  // true
    return 0;
}

总结

C++ 中存储二进制数据的核心选择及适用场景:

数据结构存储单位大小特性核心优势适用场景
std::vector<uint8_t>字节动态大小灵活、连续内存、适合变长数据网络缓冲区、文件内容、动态字节流
std::array<uint8_t, N>字节固定大小(编译期)无动态开销、栈上分配协议头、固定长度哈希/UUID
std::string字节动态大小兼容字符串操作,支持混合数据文本+二进制混合数据、带标识的字节流
std::bitset<N>比特固定大小(编译期)高效比特操作、空间紧凑标志位、固定长度比特字段
std::vector<bool>比特动态大小动态调整比特数,空间优化变长比特流、动态布尔状态集合

根据需求选择:动态字节流优先用 vector<uint8_t>,固定字节用 array,比特级操作选 bitsetvector<bool>,混合文本和二进制用 std::string

到此这篇关于详解C++ 存储二进制数据容器的几种方法的文章就介绍到这了,更多相关C++ 存储二进制内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • c语言链表操作示例分享

    c语言链表操作示例分享

    这篇文章主要介绍了c语言链表操作示例,代码中有注释,需要的朋友可以参考下
    2014-03-03
  • C++简单实现shared_ptr的代码

    C++简单实现shared_ptr的代码

    智能指针用于资源管理,为了保证资源的操作得到顺利的执行防止资源泄露,因此大多数实现都以noexcept在参数列表后声明为不抛出异常,这篇文章主要介绍了C++简单实现shared_ptr的代码,需要的朋友可以参考下
    2022-09-09
  • 非常漂亮的新年祝福!C语言实现漂亮的烟花效果

    非常漂亮的新年祝福!C语言实现漂亮的烟花效果

    非常漂亮的新年祝福!这篇文章主要介绍了C语言实现漂亮的烟花效果,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02
  • C++实现线性表有序表的合并方式(顺序表实现and链表实现)

    C++实现线性表有序表的合并方式(顺序表实现and链表实现)

    这篇文章主要介绍了C++实现线性表有序表的合并方式(顺序表实现and链表实现),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-04-04
  • C++线程间的互斥和通信场景分析

    C++线程间的互斥和通信场景分析

    很多朋友对C++线程间的互斥和通信知识掌握不是多牢靠,今天小编通过模拟车站卖票应用场景给大家详细解析C++线程间的互斥和通信知识,感兴趣的朋友跟随小编一起看看吧
    2021-05-05
  • C++基于CMD命令行实现扫雷小游戏

    C++基于CMD命令行实现扫雷小游戏

    这篇文章主要为大家详细介绍了C++基于CMD命令行实现扫雷小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-05-05
  • C语言算法练习之佩奇借书

    C语言算法练习之佩奇借书

    这篇文章主要该大家分享C语言佩奇借书的练习,文章主要通过描述佩奇借书的问题然后确定程序框架将结果运算出来,下面来看详细内容吧,需要的朋友可以参考一下
    2022-03-03
  • 嵌入式C语言查表法在项目中的应用

    嵌入式C语言查表法在项目中的应用

    今天小编就为大家分享一篇关于嵌入式C语言查表法在项目中的应用,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-12-12
  • C语言实现简单翻译功能

    C语言实现简单翻译功能

    这篇文章主要为大家详细介绍了C语言实现简单翻译功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • C语言超详细讲解函数指针的运用

    C语言超详细讲解函数指针的运用

    函数指针是一个指针变量,它可以存储函数的地址,然后使用函数指针,下面这篇文章主要给大家介绍了关于C语言进阶教程之函数指针的相关资料,需要的朋友可以参考下
    2022-06-06

最新评论