mysql获取随机数据的方法
更新时间:2013年11月07日 11:16:13 作者:
在mysql中获取随机数据方法很简单只要使用order by rand()即可了,但是如果你是百万级数据量,使用order by rand()获取随机数据你会等死去,下面我来介绍具体的解决办法
1.order by rand()
数据多了极慢,随机性非常好,适合非常小数据量的情况。
复制代码 代码如下:
SELECT * FROM table_name AS r1 JOIN (SELECT (ROUND(RAND() * (SELECT ABS(MAX(id)-MIN(id)-$limit) FROM table_name))+(SELECT MIN(id) from table_name)) AS id) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT $limit;
速度非常快,但是得到的数据是id连续的,没办法解决。
子查询产生一个随机数。
rand()是0到1的随机数,可以等于0到1。
MAX(id)-MIN(id)还要要减去$limit以免结果数量不够$limit条
因为主表id可能不连续,所以r1.id要>=r2.id
还要注意的是有时候最小id不是从1开始的,可能从一个很大的数开始,所以必须加上M(id)的值
手册相关内容:若要在i ≤ R ≤ j 这个范围得到一个随机整数R ,需要用到表达式 FLOOR(i + RAND() * (j – i + 1))。
例如, 若要在7 到 12 的范围(包括7和12)内得到一个随机整数, 可使用以下语句:
复制代码 代码如下:
SELECT FLOOR(7 + (RAND() * 6));
select * from test where rand()>0.0005 limit 10;
0.0005是一个计算出的比例直接关系到随机的质量,比如数据表10000条数据,需要随机取300条,那么0.0005就需要改成(300/10000=0.03)。
这种方法不能保证每次能取到多少,需要取多次。
2和3速度一样的快,主要区别是2总能返回limit条数据,3就没准了(符合正太分布)。2是连续数据,3是随机行。
相关文章
MySQL三大日志(binlog、redo log和undo log)图文详解
日志是MySQL数据库的重要组成部分,记录着数据库运行期间各种状态信息,下面这篇文章主要给大家介绍了关于MySQL三大日志(binlog、redo log和undo log)的相关资料,需要的朋友可以参考下2023-01-01
MySQL学习第四天 Windows 64位系统下使用MySQL
MySQL学习第四天教大家如何在Windows 64位下使用MySQL,即使用命令行方式完成操作MySQL服务,感兴趣的小伙伴们可以参考一下2016-05-05
在Ubuntu或Debian系统的服务器上卸载MySQL的方法
这篇文章主要介绍了在Ubuntu或Debian系统的服务器上卸载MySQL的方法,适用于Debian系的Linux系统,需要的朋友可以参考下2015-06-06
在同一台服务器中实现同时安装mysql5.7和mysql8两个数据库
本文指导您在已安装并运行的MySQL 5.7版本基础上,配置并安装MySQL 8.0版本,主要步骤包括关闭MySQL 5.7服务、修改配置文件路径、解压缩安装包、更改文件权限、初始化MySQL 8.0等,安装完成后,通过启动服务和本地连接数据库来验证安装2024-12-12


最新评论