MySQL中如何正确存储IP地址

 更新时间:2023年05月24日 09:47:27   作者:_陈哈哈  
在MySQL中,当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址,而不是使用字符串,下面就来详细的介绍一下具体原因,感兴趣的可以了解一下

数据库中IP地址数据该怎么存?或许你已经不止一次遇到过这类问题,怎么存?varchar(255)不就完事儿了?坦白说,在我经历的几个项目中,几乎都遇到过存储IP地址(V4、V6)的数据字段,都用的变长字符串varchar(15)来存储,嗯,感觉还挺香的…

其实很早以前我就在《高性能MySQL第三版》中看过IP地址属于特殊类型数据,应转为整数存储。

《高性能MySQL第三版》
4.1.7 特殊类型数据
-某些类型的数据并不直接与内置类型一致。低于秒级精度的时间戳就是一个例子;
-本意的前面部分也演示过存储此类数据的一些选项。

-另一个例子是一个IPv4地址。人们经常使用VARCHAR(15)列来存储IP地址。
-然而,它们实际上是 32位无符号整数,不是字符串。用小数点将地址分成四段的表示方法只是为了让人们阅读容易。
-所以应该用无符号整数存储IP地址。MySQL提供INET ATON()和 INET NTOA()函数在这两种表示方法之间转换。

但项目中并未涉及到对IP地址的高频查询业务需求;所以嘛,你知道的,我们程序员的三不准则:跟自己没关系的代码不要看,自己模块用不到的技术不要学,遗留代码只要能跑的就不要动!
直到老大看我们项目数据表时问道:“你们存IP地址都是用字符串吗?这可不兴啊!应该用整数来存啊。”

“老大,我明白你的优化思路,你看咱们这表,就几十条数据(狗头)…”

直到上周有位同学问我IP地址在数据库中该怎么存,他在面试中被问到了,我突然意识到了这玩意儿是时候记录一下了。

一、IP地址应该怎么存

在MySQL中,当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址,而不是使用字符串,用UNSIGNED INT类型存储IP 地址是一个4字节长的整数。

如果是字符串存储IP 地址,在正常格式下,最小长度为 7 个字符 (0.0.0.0),最大长度为 15 个 (255.255.255.255),因此,我们通常会使用varchar(15)来存储。同时为了让数据库准确跟踪列中有多少数据,数据库会添加额外的1字节来存储字符串的长度。这使得以字符串表示的 IP 的实际数据存储成本需要16字节。

这意味着如果将每个 IP 地址存储为字符串的话,每行需要多耗费大约 10 个字节的额外资源。

如果你说磁盘够使不是事儿,那我得告诉你,这个不仅会使数据文件消耗更多的磁盘,如果该字段加了索引,也会同比例扩大索引文件的大小,缓存数据需要使用更多内存来缓存数据或索引,从而可能将其他更有价值的内容推出缓存区。执行SQL对该字段进行CRUD时,也会消耗更多的CPU资源。

在早先使用Oracle10g时,是没有相关函数来进行IP整数和字符串的,但在MySQL中有内置的函数,来对IP和数值进行相互转换。

  • INET_ATON()

将IP转换成整数。

算法:第一位乘256三次方+第二位乘256二次方+第三位乘256一次方 + 第四位乘256零次方

  • INET_NTOA()

将数字反向转换成IP

SELECT INET_ATON('127.0.0.1');
+------------------------+
| INET_ATON('127.0.0.1') |
+------------------------+
|             2130706433 | 
+------------------------+
1 row in set (0.00 sec)
SELECT INET_NTOA('2130706433');
+-------------------------+
| INET_NTOA('2130706433') |
+-------------------------+
| 127.0.0.1               | 
+-------------------------+
1 row in set (0.02 sec)

如果是 IPv6地址的话,可以使用函数 INET6_ATON() 和 INET6_NTOA() 来转化:

mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')); 
+----------------------------------------------+
| HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')) |
+----------------------------------------------+
| 1030000000000000C9B4FF1248AA1A2B             |
+----------------------------------------------+
1 row in set
mysql> SELECT INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')); 
+-------------------------------------------------------+
| INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')) |
+-------------------------------------------------------+
| 1030::c9b4:ff12:48aa:1a2b                             |
+-------------------------------------------------------+
1 row in set

然后将数据库定义为 varbinary类型,分配 128bits空间(因为 ipv6采用的是128bits,16个字节);或者定义为 char 类型,分配 32bits 空间。

二、整数存储 IP 地址的查询性能实验

测试数据,用存储过程生成了 100 万个随机 IP 地址;

1、测试范围查询:

IP转成Int,查询:耗时0.60s

select ip_int from T where ip_int > INET_ATON('192.0.0.0') and ip_int <=INET_ATON('192.255.255.255');
1726 row in set, 1 warning (0.60 sec)

IP为字符串,查询:耗时0.63s

select ip_varchar from T where ip_varchar like '192.%';
1726 row in set, 1 warning (0.63 sec)

2、IP精确查询:

select ip_int from T where ip_int = INET_ATON('192.168.0.0');
1 row in set, 1 warning (0.00 sec)
select ip_varchar from T where ip_varchar='192.168.0.0';
1 row in set, 1 warning (0.00 sec)

都是0s出结果。可认为常量索引查询,性能上无明显差异。

3、整理一下结果发现:

范围查询和精确查询:

数据量少的情况下的差距不明显,如果数据量扩大到约1千万行或1亿行,1亿行时预计范围查询差距能拉开到0.5s。

存储空间节省:

按1亿行算,理论上 varchar 最大15字节存储,数值4个字节,大约节省10字节 *1亿 约1G空间。

加上索文件引所占的空间,一个索引也是能节省1G。约能节省2G空间。

总结

IP地址数据采用整数(UNSIGNED INT)存储,在存储和CPU资源使用上都少于字符串存储形式;在歧义较大的范围查询中,存储整数方式无需关系范围中的位数问题,查询更加直观方便。

但整数存储需要使用INET_ATON、INET_NTOA等特定函数处理,可读性查,函数也会消耗额外CPU,经检验发现CPU开支微乎其微。

因此,需要范围查询,且数据量很大(如亿级以上),采用数值存储IP地址的方式更优。如果均是唯一IP精确查询,或数据量不大,那么使用字符串操作更为简单。

到此这篇关于MySQL中如何正确存储IP地址的文章就介绍到这了,更多相关MySQL 存储IP地址内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • MySQL优化之分区表

    MySQL优化之分区表

    这篇文章主要介绍了MySQL优化之分区表,需要的朋友可以参考下
    2016-06-06
  • 解决启动MySQL服务时出现"mysql本地计算机上的MySQL服务启动后停止"的问题

    解决启动MySQL服务时出现"mysql本地计算机上的MySQL服务启动后停止"的问题

    某一天我的MySQL启动突然出现了异常:“mysql本地计算机上的MySQL服务启动后停止,某些在未由其他服务或程序使用时将自动停止,” ,小编在网络上面找了很多方法,MySQL启动成功了,但是第二天开启MySQL时还是出现了这个问题,现把两种方法总结一下,需要的朋友可以参考下
    2023-11-11
  • SQL中row_number() over(partition by)的用法说明

    SQL中row_number() over(partition by)的用法说明

    这篇文章主要介绍了SQL中row_number() over(partition by)的用法说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • Mysql官方性能测试工具mysqlslap的使用简介

    Mysql官方性能测试工具mysqlslap的使用简介

    mysqlslap随着MySQL安装的时候就自动安装好了,而且 mysqlslap 把很多的自定义测试的功能封装到了外部,使用者只需要在外部提供 SQL 语句的脚本就可以自定义测试语句,本文将简单介绍该工具的使用
    2021-05-05
  • mysql xtrabackup 备份恢复实现分享

    mysql xtrabackup 备份恢复实现分享

    Xtrabackup是由percona提供的mysql数据库备份工具,据官方介绍,这也是世界上惟一一款开源的能够对innodb和xtradb数据库进行热备的工具
    2012-11-11
  • MYSQL如何自动为查询数据的结果编上序号详解

    MYSQL如何自动为查询数据的结果编上序号详解

    这篇文章主要给大家介绍了关于MYSQL如何自动为查询数据的结果编上序号的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用mysql具有一定的参考学习价值,需要的朋友们下面随着小编来一起看看吧。
    2017-11-11
  • mysql、oracle默认事务隔离级别的说明

    mysql、oracle默认事务隔离级别的说明

    这篇文章主要介绍了mysql、oracle默认事务隔离级别的说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • 一篇文章学会MySQL基本查询和运算符

    一篇文章学会MySQL基本查询和运算符

    在MySQL数据库操作中,运算符扮演着较为重要的角色,连接表达式中的各个操作数,其作用是用来指明对操作数所进行的运算,下面这篇文章主要给大家介绍了关于MySQL基本查询和运算符的相关资料,需要的朋友可以参考下
    2022-08-08
  • Mysql多表操作方法讲解教程

    Mysql多表操作方法讲解教程

    这篇文章主要介绍了MySQL数据库的多表操作,文章围绕主题展开详细的内容介绍,具有一定的参考价值,感兴趣的小伙伴可以参考一下,希望对你的学习有所帮助
    2022-12-12
  • mysql 报错 incompatible with sql_mode=only_full_group_by解决

    mysql 报错 incompatible with sql_mode=only

    这篇文章主要为大家介绍了mysql 报错 incompatible with sql_mode=only_full_group_by解决方法,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-10-10

最新评论