C++实现高性能转换大小写算法示例

更新时间：2018年01月03日 11:38:31 投稿：daisy

大小写转换是我们作为一名程序员经常会遇到，也必须要会的一个功能，下面这篇文章主要给大家介绍了关于C++实现高性能转换大小写算法的相关资料，文中通过示例代码介绍的非常详细，需要的朋友可以参考借鉴，下面来一起看看吧。

简述

最近工作中遇到一个需求，是需要将URL中的 query 参数的key全部转换为小写或者大写，键值对的数量有点多，但全部都是英文字母，无需考虑非字母的情况。

实现比较快的做法是使用STL或C标准库中的转换接口，如下：

#include <string> 
#include <cctype> 
#include <algorithm>
// 字符串中的大写字符转小写
std::string strtolower(std::string s)
{
 transform(s.begin(), s.end(), s.begin(), ::tolower);
 return s;
}
// 字符串中的小写字符转大写
std::string strtoupper(std::string s)
{
 transform(s.begin(), s.end(), s.begin(), ::toupper);
 return s;
}

这个方法虽然很好，但是效率不是很高。

分析了一下ascii码的码值，发现大小写字母的ascii码之间是有规律的。

原理

英文字母的ASCII码值表示如下

对比一下其二进制形式

从对比的结果可以看出， 大写字母与小写字母的差别 仅是 一个比特位的不同 。

因为它们的这个规律，可以写出下面的转换函数（如果输入不是字母，转出的结果会有错误）

可以查看数字 0-9 的ascii码值，可以看出它们的第6位都是0，所以转为小写的算法不会影响数字的值。

转小写算法中受到影响的，只有ascii码二进制表示中第六位为0的部分。其中非字母部分如下表

#include <iostream>
#include <string>
#include <stdint.h>
// 更优化
std::string strtoupper(std::string s)
{
 if(s.empty()){return s;}
 size_t len = s.size() + 1;
 size_t alignlen = len + 8 - (len % 8);
 s.resize(alignlen);
 size_t ec = alignlen / 8;
 uint64_t* p8 = (uint64_t*)s.data();
 for(size_t i=0;i<ec;++i){
 p8[i] &= 0xDFDFDFDFDFDFDFDF;
 }
 s.resize(len-1);
 return s;
}
// 未做进一步优化
std::string strtolower(std::string s)
{
 size_t len = s.size();
 size_t ec = len /8;
 uint64_t* p8 = (uint64_t*)s.data();
 for(size_t i=0;i<ec;++i){
 p8[i] |= 0x2020202020202020;
 }
 uint8_t* p1 = (uint8_t*)(p8 + ec);
 len %= 8;
 for(size_t i=0;i<len;++i){
 p1[i] |= 0x20;
 }
 return s;
}

性能测试

测试代码如下：

int main()
{
 //std::cout << "Hello, world!\n";
 for(size_t i=0;i<1000000;++i){
 std::string s = strtoupper("qwertyuiopasdfghjklzxcvbnm````````QWERTYUIOPASDFGHJKLZXCVBNM");
 //std::cout<<s<<std::endl;
 s = strtolower("qwertyuiopasdfghjklzxcvbnm\t\t\t\t\t\t\t\tQWERTYUIOPASDFGHJKLZXCVBNM");
 //std::cout<<s<<std::endl;
 }
 return 0;
}

-- 编译时候请勿优化，否则可能被优化掉！ --

测试结果如下：

使用STL算法

STL算法部分主要由头文件<algorithm>,<numeric>,<functional>组成。要使用 STL中的算法函数必须包含头文件<algorithm>，对于数值算法须包含<numeric>，<functional>中则定义了一些模板类，用来声明函数对象。

STL中算法大致分为四类：

1、非可变序列算法：指不直接修改其所操作的容器内容的算法。

2、可变序列算法：指可以修改它们所操作的容器内容的算法。

3、排序算法：包括对序列进行排序和合并的算法、搜索算法以及有序序列上的集合操作。

4、数值算法：对容器内容进行数值计算。

结果如下

time ./teststl
./teststl 7.88s user 0.03s system 100% cpu 7.904 total

自写代码测试结果如下

time ./test
./test 0.93s user 0.00s system 99% cpu 0.928 total

可以看到，其性能有差异。（应用场景有限）

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

C语言关系运算符实例详解
本文主要介绍C语言的关系运算符的知识,这里提供实例代码以便参考,希望能帮助有需要的小伙伴
2016-07-07
C语言中条件判断的正确使用姿势
在C语言中，有三种条件判断结构：if语句、if-else语句和switch语句，这篇文章主要来和大家讲解一下它们的正确使用姿势，需要的可以参考一下
2023-05-05
Qt基于QRencode实现生成二维码
QRencode是一个开源的库,专门用于生成二维码（QR Code）,这篇文章主要为大家详细介绍了Qt如何使用QRencode实现生成二维码功能,需要的可以参考下
2025-02-02
C++文件的操作及小实验示例代码详解
这篇文章主要介绍了C++文件的操作及小实验，对于文件，它是一个流对象，对文件的操作无非是读和写，通过本文的学习大家将会理解文件的具体操作
2022-05-05
C++ 哈夫曼树对文件压缩、加密实现代码
这篇文章主要介绍了C++ 哈夫曼树对文件压缩、加密实现代码,具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-08-08
C++ OpenCV实战之制作九宫格图像
本文将为大家介绍如何使用OpenCV C++ 制作九宫格图像，即将一张图像均等分成九份，然后将这九个小块按一定间隔拷贝到新画布上就可以啦。感兴趣的可以动手试一试
2022-01-01
用C语言实现排雷游戏
大家好，本篇文章主要讲的是用C语言实现排雷游戏，感兴趣的同学赶快来看一看吧，对你有帮助的话记得收藏一下
2022-01-01
C++编程模板匹配超详细的识别手写数字实现示例
大家好！本篇文章是关于手写数字识别的，接下来我将在这里记录我的手写数字识别的从零到有，我在这里把我自己的写代码过程发出来，希望能帮到和我一样努力求知的人
2021-10-10
Qt实现小功能之圆形进度条的方法详解
在Qt自带的控件中，只有垂直进度条、水平进度条两种。在平时做页面开发时，有些时候会用到圆形进度条，比如说：下载某个文件的下载进度。本文就来实现一个圆形进度条，需要的可以参考一下
2022-10-10
C++判断一个点是否在圆内的方法
这篇文章主要为大家详细介绍了C++判断一个点是否在圆内的方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-05-05

C++实现高性能转换大小写算法示例

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具