如何用分表存储来提高性能 推荐

 更新时间:2011年09月22日 00:39:55   作者:  
如何用分表存储来提高性能 ,需要的朋友可以参考下。

首先,童家旺介绍了他认为的什么是优化:第一、做任何事情最快的方法就是什么也不做。

童家旺:数据存储性能优化的一点想法
▲支付宝资深数据库架构师童家旺

  第二、不访问不必要的数据:使用B*Tree/hash等方法定位必要的数据。使用column Store或分表的方式将数据分开存储。使用Bloom filter算法排除空值查询。

  第三、合理的利用硬件来提升访问效率:使用缓存消除对数据的重复访问。使用批量处理来减少磁盘的Seek操作。使用批量处理来减少网络的Round Trip。使用SSD来提升磁盘访问效率。

  响应时间和吞吐量之间的关系

  1、性能。衡量完成特定任务的速度或效率。

  2、响应时间。衡量系统与用户交互式多久能够发出响应。

  3、吞吐量。衡量系统在单位时间里可以完成的任务量。

  

  ▲反应时间

  童家旺:数据存储性能优化的一点想法

  ▲传统磁盘的访问特性

  B*Tree优化数据访问介绍

  童家旺:数据存储性能优化的一点想法

  ▲B*Tree优化数据访问

  B*Tree优化数据访问模拟场景

  童家旺:数据存储性能优化的一点想法

  ▲B*Tree优化数据访问模拟场景

  童家旺通过阿里巴巴的真实应用场景介绍了如何用分表存储来提高性能。

  一、场景介绍:

  1、表VeryBigTable含有30个列

  2、表的记录数为50,000,000条

  3、平均每个用户为300条左右

  4、其中有2个列属于详细描述字段,平均长度为2k

  5、其它的列的总长度平均为250个字节

  6、此表上的查询有两种模式

  7、列出表中的主要信息(每次20条,不包含详细信息,90%的查询)

  8、查看记录的详细信息(10%的查询)

  9、保存与Oracle数据库,默认block_size(8k)

  二、要求:

  1、对此业务进行优化

  2、分析数据,说服开发部门实施此优化

  三、性能分析

  1、每块记录数

  8192 * 0.80(1) / 250 = 25.5 (主表)

  8192 * 0.80 / 2000 = 3.27(详情表)

  8192 * 0.80 / ( 2000 + 250 ) = 2.91

  2、访问的逻辑IO(内存块访问)

  List的查询代价

  改进后=( 300/25.5 ) * y + 4 + x = 4 + x + 11.8y = 4(2) + 7(3) + 11.8 * 1.5(4) = 28.7

  改进前=( 300/2.91 ) * y + 4 + x = 4 + x + 103.y = 4 + 7 + 103 * 1.5 = 165.5

  3、访问涉及到的物理读(磁盘块访问)

  List的查询代价(逻辑IO * ( 1 – 命中率 ))

  改进后=28.7 * ( 1 – 0.85(5)) = 4.305

  改进前=165.5 * ( 1 – 0.85 ) = 24.825

  4、访问时间(ms)

  改进前=逻辑IO时间+物理IO时间= 28.7 * 0.01(6) + 4.305 * 7(7) = 30.422ms
  改进后=逻辑IO时间+物理IO时间= 165.5 * 0.01 + 24.825 * 7 = 175.43ms

相关文章

  • SQL关系模型的知识梳理总结

    SQL关系模型的知识梳理总结

    这篇文章主要为大家介绍了SQL关系模型,文中对SQL关系模型的知识作了详细的梳理总结,有需要的朋友可以借鉴参考下希望能够有所帮助
    2021-10-10
  • 如何利用分析函数改写范围判断自关联查询详解

    如何利用分析函数改写范围判断自关联查询详解

    这篇文章主要给大家介绍了关于如何利用分析函数改写范围判断自关联查询的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用sql具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-10-10
  • SQL Update多表联合更新的方法

    SQL Update多表联合更新的方法

    这篇文章主要介绍了SQL Update多表联合更新的方法,需要的朋友可以参考下
    2014-08-08
  • MSSQL转MySQL数据库的实际操作记录

    MSSQL转MySQL数据库的实际操作记录

    今天把一个MSSQL的数据库转成MySQL,在没有转换工具的情况下,对于字段不多的数据表我用了如下手功转换的方法,还算方便。MSSQL使用企业管理器操作,MySQL用phpmyadmin操作。
    2010-06-06
  • 数据库 关系连接

    数据库 关系连接

    数据库 关系连接,多表查询时需要用到的一些东西。
    2009-09-09
  • 使用 Navicat 创建数据库并用JDBC连接的操作方法

    使用 Navicat 创建数据库并用JDBC连接的操作方法

    这篇文章主要介绍了使用 Navicat 创建数据库并用JDBC连接的操作方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • 在数据库中如何高效的实现订座功能

    在数据库中如何高效的实现订座功能

    这篇文章主要给大家介绍了关于在数据库中如何高效的实现订座功能的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-11-11
  • GBase与梧桐数据库窗口函数使用的方法比较

    GBase与梧桐数据库窗口函数使用的方法比较

    这篇文章主要给大家介绍了关于GBase与梧桐数据库窗口函数使用的比较,文中包括排序类和统计类窗口函数的定义、语法和示例,窗口函数可以进行复杂的数据分析,提高查询性能,并适应不同的数据分析需求,需要的朋友可以参考下
    2024-11-11
  • SQL注入技巧之显注与盲注中过滤逗号绕过详析

    SQL注入技巧之显注与盲注中过滤逗号绕过详析

    SQL注入的绕过技巧有很多,下面这篇文章主要给大家介绍了关于SQL注入技巧之显注与盲注中过滤逗号绕过的相关资料,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧
    2018-08-08
  • 数据库建立索引的一般依据小结

    数据库建立索引的一般依据小结

    以下是一些普遍的建立索引时的判断依据。一言以蔽之,索引的建立必须慎重,对每个索引的必要性都应该经过仔细分析,要有建立的依据
    2012-05-05

最新评论