关于关系数据库如何快速查询表的记录数详解

更新时间：2019年04月13日 09:31:29 作者：潇湘隐者

这篇文章主要给大家介绍了关于关系数据库如何快速查询表的记录数的相关资料，文中通过示例代码介绍的非常详细，对大家学习或者使用关系数据库具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧

前言

在数据库中，很多人员习惯使用SELECT COUNT（*） 、SELECT COUNT（1) 、SELECT COUNT(COL)来查询一个表有多少记录，对于小表，这种SQL的开销倒不是很大，但是对于大表，这种查询表记录数的做法就是一个非常消耗资源了，而且效率很差。下面介绍一下SQL Server、 Oracle、MySQL中如何快速获取表的记录数。

SQL SERVER 数据库

在SQL Server数据库中, 对象目录视图sys.partitions中有一个字段rows会记录表的记录数。我们以AdventureWorks2014为测试数据库。

SELECT OBJECT_NAME(object_id) AS Object_Name, 
 i.name   AS Index_Name,
 p.rows   AS Table_Rows
FROM sys.partitions p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND p.index_id = i.indid 
WHERE
 object_id = OBJECT_ID('TableName')

那么我们还有一些疑问，我们先来看看这些问题吧！

1：没有索引的表是否也可以使用上面脚本？

2：只有非聚集索引的堆表是否可以使用上面脚本？

3：有多个索引的表，是否记录数会存在不一致的情况？

4：统计信息不准确的表，是否rows也会不准确

5: 分区表的情况又是怎么样？

6：对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。

如下所示，我们先构造测试案例：

IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
 DROP TABLE TEST_TAB_ROW;
END
 
IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
 CREATE TABLE TEST_TAB_ROW
 (
  ID INT,
  NAME CHAR(200)
 )
END
GO
 
SET NOCOUNT ON;
BEGIN TRAN
DECLARE @Index INT =1;
 
WHILE @Index <= 100000
BEGIN
 
 INSERT INTO TEST_TAB_ROW
 VALUES(@Index, NEWID());
 
 SET @Index+=1;
 
 IF (@Index % 5000) = 0 
 BEGIN
 IF @@TRANCOUNT > 0 
  BEGIN 
  COMMIT;
  BEGIN TRAN
  END
 END
END
 
IF @@TRANCOUNT > 0 
BEGIN 
 COMMIT;
END
GO

关于问题1、问题2，都可以使用上面脚本，如下测试所示：

SELECT OBJECT_NAME(object_id) AS Object_Name, 
 i.name   AS Index_Name,
 p.rows   AS Table_Rows
FROM sys.partitions p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND p.index_id = i.indid 
WHERE
 object_id = OBJECT_ID('dbo.TEST_TAB_ROW')

在表dbo.TEST_TAB_ROW 上创建非聚集索引后，查询结果如下所示：

CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

我们插入500条记录，此时，这个数据量不足以触发统计信息更新，如下所示， Rows Sampled还是1000000

DECLARE @Index INT =1;
 
WHILE @Index <= 500
BEGIN
 
 INSERT INTO TEST_TAB_ROW
 VALUES(100000 +@Index, NEWID());
 
 SET @Index+=1;
 
END

如下所示，发现sys.partitions中的记录变成了100500了，可见rows这个值的计算不依赖统计信息。

当然，如果你用sp_spaceused，发现这里面的记录也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

关于问题3：有多个索引的表，是否记录数会存在不一致的情况？

答案：个人测试以及统计来看，暂时发现多个索引的情况下，sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的情况，当然也不排除有特殊情况。

关于问题5: 分区表的情况又是怎么样？

答案：分区表和普通表没有任何区别。

关于问题6：对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确？

答案：对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。

ORACLE 数据库

在ORACLE数据库中，可以通过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数，不过这个值（NUM_ROWS）跟统计信息有很大的关系，有时候统计信息没有更新或采样比例会导致这个值不是很准确。

SELECT OWNER  , 
  TABLE_NAME, 
  NUM_ROWS ,
  LAST_ANALYZED
FROM DBA_TABLES 
WHERE OWNER = '&OWNER' 
  AND TABLE_NAME = '&TABLE_NAME'; 
 
 
SELECT OWNER,
  TABLE_NAME,
  NUM_ROWS ,
  LAST_ANALYZED
FROM ALL_TABLES
WHERE OWNER ='&OWNER'
AND TABLE_NAME='&TABLE_NAME';
 
 
SELECT TABLE_NAME,
  NUM_ROWS ,
  LAST_ANALYZED
FROM USER_TABLES
WHERE TABLE_NAME='&TABLE_NAME'

更新统计信息后，就能得到准确的行数。所以如果需要得到正确的数据，最好更新目标表的统计信息，进行100%采样分析。对于分区表，那么就需要从dba_tab_partitions里面查询相关数据了。

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

MySQL数据库

在MySQL中比较特殊，虽然INFORMATION_SCHEMA.TABLES也可以查到表的记录数，但是非常不准确。如下所示，即使使用ANALYZE TABLE更新了统计信息，从INFORMATION_SCHEMA.TABLES中获取的记录依然不准确

SELECT TABLE_ROWS 
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME='table_name'

mysql> SELECT TABLE_ROWS 
 -> FROM INFORMATION_SCHEMA.TABLES
 -> WHERE TABLE_NAME='jiraissue'
 -> ;
+------------+
| TABLE_ROWS |
+------------+
|  36487 |
+------------+
1 row in set (0.01 sec)
 
mysql> select count(*) from jiraissue;
+----------+
| count(*) |
+----------+
| 36973 |
+----------+
1 row in set (0.05 sec)
 
mysql> analyze table jiraissue;
+----------------+---------+----------+----------+
| Table   | Op  | Msg_type | Msg_text |
+----------------+---------+----------+----------+
| jira.jiraissue | analyze | status | OK  |
+----------------+---------+----------+----------+
1 row in set (1.41 sec)
 
mysql> SELECT TABLE_ROWS 
 -> FROM INFORMATION_SCHEMA.TABLES
 -> WHERE TABLE_NAME='jiraissue';
+------------+
| TABLE_ROWS |
+------------+
|  34193 |
+------------+
1 row in set (0.00 sec)
 
mysql>

如上所示，MySQL这种查询表记录数的方法看来还是有缺陷的。当然如果不是要求非常精确的值，这个方法也是不错的。

当然，上面介绍的SQL Server、Oracle、MySQL数据库中的方法，还是有一些局限性的。例如，只能查询整张表的记录数，对于那些查询记录数带有查询条件（WHERE）这类SQL。还是必须使用SELECT COUNT(*）这种方法。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

海量数据库的查询优化及分页算法方案集合1/2
海量数据库的查询优化及分页算法方案集合1/2...
2007-03-03
数据库设计经验谈
这篇文章主要介绍了数据库设计经验谈的相关资料,需要的朋友可以参考下
2007-03-03
深入解析NoSQL数据库的分布式算法(图文详解)
这篇文章主要介绍了深入解析NoSQL数据库的分布式算法,需要的朋友可以参考下
2015-12-12
redis安装、配置、使用和redis php扩展安装教程
这篇文章主要介绍了redis安装、配置、使用和redis php扩展安装教程,其中redis使用的是编译安装,同时介绍了redis常用配置说明、常用命令,要的朋友可以参考下
2014-05-05
8种主流NoSQL数据库系统特性对比和最佳应用场景
这篇文章主要介绍了8种主流NoSQL数据库系统特性对比和最佳应用场景,对选择一个NoSQL数据库来说是一个不错的参考文章,需要的朋友可以参考下
2014-06-06
几种常用DB驱动和DB连接串小结
几种常用DB驱动和DB连接串，方便大家用各种程序，连接数据库。
2009-12-12
一篇文章教会你使用gs_restore导入数据
gs_restore是GaussDB(DWS)提供的针对gs_dump导出数据的导入工具,下面这篇文章主要给大家介绍了关于如何通过一篇文章教会你使用gs_restore导入数据的相关资料,需要的朋友可以参考下
2022-09-09
如何找回存储在DBeaver连接中数据库密码
DBeaver数据库连接工具是我用了这么久最好用的一个数据库连接工具,拥有的优点,支持的数据库多、快捷键很赞、导入导出数据非常方便,这篇文章主要给大家介绍了关于如何找回存储在DBeaver连接中数据库密码的相关资料,需要的朋友可以参考下
2024-03-03
PostgreSQL8.3.3安装方法
非安装版的PostgreSQL8.3.3的首次使用经历第一次用Postgre，已经是好多年以前了，隐约记得是在linux下边，build半天，然后手动配置库文件之类。
2008-09-09
navicat如何执行.sql文件
这篇文章主要介绍了navicat如何执行.sql文件问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-01-01

关于关系数据库如何快速查询表的记录数详解

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具