Transactional replication(事务复制)详解之如何跳过一个事务

 更新时间:2014年08月11日 11:50:48   投稿:hebedich  
事务复制由 SQL Server 快照代理、日志读取器代理和分发代理实现。 快照代理准备快照文件(其中包含了已发布表和数据库对象的架构和数据),然后将这些文件存储在快照文件夹中,并在分发服务器中的分发数据库中记录同步作业。

在transactional replication, 经常会遇到数据同步延迟的情况。有时候这些延迟是由于在publication中执行了一个更新,例如update ta set col=? Where ?,这个更新包含巨大的数据量。在subscription端,这个更新会分解成多条命令(默认情况下每个数据行一个命令),应用到subscription上。 不得已的情况下,我们需要跳过这个大的事务,让replication继续运行下去。

现在介绍一下transactional replication的一些原理和具体的方法

当publication database的article发生更新时, 会产生相应的日志,Log reader会读取这些日志信息,将他们写入到Distribution 数据库的msrepl_transactions和msrepl_commands中。 

Msrepl_transactions中的每一条记录都有一个唯一标识xact_seqno,xact_seqno对应日志中的LSN。 所以可以通过xact_seqno推断出他们在publication database中的生成顺序,编号大的生成时间就晚,编号小的生成时间就早。

Distributionagent包含两个子进程,reader和writer。 Reader负责从Distribution 数据库中读取数据,Writer负责将reader读取的数据写入到订阅数据库.

reader是通过sp_MSget_repl_commands来读取Distribution数据库中(读取Msrepl_transactions表和Msrepl_Commands表)的数据

下面是sp_MSget_repl_commands的参数定义

CREATE PROCEDURE sys.sp_MSget_repl_commands 

( 

@agent_id int, 

@last_xact_seqno varbinary(16), 

@get_count tinyint = 0, -- 0 = no count, 1 = cmd and tran (legacy), 2 = cmd only 

@compatibility_level int = 7000000, 

@subdb_version int = 0, 

@read_query_size int = -1 

) 

这个存储过程有6个参数,在Transactional replication 中,只会使用前4个(并且第三个参数和第四个参数的值是固定不变的.分别为0和10000000)。下面是一个例子:

execsp_MSget_repl_commands 46,0x0010630F000002A900EA00000000,0,10000000

@agent_id表示Distributionagentid,每个订阅都会有一个单独的Distributionagent来处理数据。 带入@agent_id后,就可以找到订阅对应的publication 和所有的article。

@last_xact_seqno 表示上一次传递到订阅的LSN。

大致逻辑是:Reader读取subscription database的MSreplication_subscriptions表的transaction_timestamp列,获得更新的上一次LSN编号,然后读取分发数据库中LSN大于这个编号的数据。 Writer将读取到的数据写入订阅,并更新MSreplication_subscriptions表的transaction_timestamp列。然后Reader会继续用新的LSN来读取后续的数据,再传递给Writer,如此往复。

如果我们手工更新transaction_timestamp列,将这个值设置为当前正在执行的大事务的LSN,那么distribution agent就会不读取这个大事务,而是将其跳过了。

下面以一个实例演示一下

环境如下

Publisher: SQL108W2K8R21

Distributor: SQL108W2K8R22

Subscriber: SQL108W2K8R23

图中高亮的publication中包含3个aritcles,ta,tb,tc

其中ta包含18,218,200万数据,然后我们进行了一下操作

在11:00进行了更新语句,

update ta set c=-11

后续陆续对表ta,tb,tc执行一些插入操作

insert tb values(0,0)

insert tc values(0,0)

之后我们启动replication monitor ,发现有很大的延迟,distribution agent一直在传递a)操作产生的数据

在subscription database中执行下面的语句,得到当前最新记录的事务编号

declare @publisher sysname 

declare @publicationDB sysname 

declare @publication sysname 

set @publisher='SQL108W2K8R22' 

set @publicationDB='pubdb' 

set @publication='pubdbtest2'

select transaction_timestamp From MSreplication_subscriptions 

where 

publisher=@publisher and 

publisher_db=@publicationDB and 

publication=@publication 

在我的环境中,事务编号为0x0000014900004E9A0004000000000000

返回到distribution database,执行下面的语句,得到紧跟在大事务后面的事务编号. 请将参数替换成您实际环境中的数据。(请注意,如果执行下列语句遇到性能问题,请将参数直接替换成值)

declare @publisher sysname 

declare @publicationDB sysname 

declare @publication sysname 

declare @transaction_timestamp [varbinary](16) 

set @publisher='SQL108W2K8R21' 

set @publicationDB='publicationdb2' 

set @publication='pubtest' 

set @transaction_timestamp= 0x0000014900004E9A0004000000000000

select top 1 xact_seqno from MSrepl_commands with (nolock) where xact_seqno>@transaction_timestamp and 

article_id in ( 

  select article_id From MSarticles a inner join MSpublications p on a.publication_id=p.publication_id and a.publisher_id=p.publisher_id and a.publisher_db=p.publisher_db 

  inner join sys.servers s on s.server_id=p.publisher_id 

  where p.publication=@publication and p.publisher_db=@publicationDB and s.name=@publisher 

) 

and publisher_database_id =( 

    select id From MSpublisher_databases pd inner join MSpublications p on pd.publisher_id=p.publisher_id 

    inner join sys.servers s on pd.publisher_id=s.server_id and pd.publisher_db=p.publisher_db 

    where s.name=@publisher and p.publication=@publication and pd.publisher_db=@publicationDB 

) 

Order by xact_seqno

在我的环境中,事务编号为0x0000018C000001000171

在subscription database中执行下面的语句,跳过大的事务。请将参数替换成您实际环境中的数据

declare @publisher sysname

declare @publicationDB sysname 

declare @publication sysname 

declare @transaction_timestamp [varbinary](16) 

set @publisher='SQL108W2K8R22' 

set @publicationDB='pubdb' 

set @publication='pubdbtest2' 

set @transaction_timestamp= 0x0000018C000001000171

update MSreplication_subscriptions set transaction_timestamp=@transaction_timestamp 

where publisher=@publisher and publisher_db=@publicationDB and publication=@publication 

执行完成后开启distribution agent job即可。

接下来您就会发现,事务已经成功跳过,ta在订阅端不会被更新,后续的更新会逐步传递到订阅,延迟消失。

相关文章

  • SQL 中 COUNT 的用法示例详解

    SQL 中 COUNT 的用法示例详解

    本文给大家介绍了SQL中的COUNT函数及其各种用法,包括统计总行数、特定列的非NULL值数量、不重复值数量,以及如何与GROUPBY、HAVING和JOIN结合使用,感兴趣的朋友一起看看吧
    2024-12-12
  • SQL Server重置IDENTITY属性种子值操作

    SQL Server重置IDENTITY属性种子值操作

    这篇文章主要介绍了SQL Server重置IDENTITY属性种子值操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • SQLSERVER2022创建用户的图文教程

    SQLSERVER2022创建用户的图文教程

    用户是数据库中的实体,用于控制对数据库对象的访问权限,本文主要介绍了SQLSERVER2022创建用户的图文教程,具有一定的参考价值,感兴趣的可以了解一下
    2024-04-04
  • sql中设置联合主键的具体方法

    sql中设置联合主键的具体方法

    联合主键的设置想必有很多的朋友都不会吧,在本文为大家介绍下具体的设置方法,感兴趣的朋友可以了解下
    2013-09-09
  • SqlServer创建自动收缩事务日志任务的图文教程

    SqlServer创建自动收缩事务日志任务的图文教程

    SQL Server数据库存在一个问题,如果你限制了它的日志文件的大小,那么当数据库日志达到这个大小的时候,数据库就会停止写入日志,下面这篇文章主要给大家介绍了关于SqlServer创建自动收缩事务日志任务的相关资料,需要的朋友可以参考下
    2022-09-09
  • SQL Server 查询处理中的各个阶段(SQL执行顺序)示例

    SQL Server 查询处理中的各个阶段(SQL执行顺序)示例

    SQL不同于与其他编程语言的最明显特征是处理代码的顺序,以下就为大家详细的介绍一下,需要的朋友可以参考下
    2013-07-07
  • 详解SQL Server 2016快照代理过程

    详解SQL Server 2016快照代理过程

    给大家详细分析了SQL Server 2016 快照代理过程,并实例分析了其中需要注意的地方,跟着小编一下学习下吧。
    2017-12-12
  • sql server中的触发器用法实例详解

    sql server中的触发器用法实例详解

    这篇文章主要给大家介绍了关于sql server中触发器用法的相关资料,SQL Server触发器是一种特殊类型的存储过程,它们在数据库中的表上自动执行,需要的朋友可以参考下
    2024-03-03
  • 必须会的SQL语句(八) 数据库的完整性约束

    必须会的SQL语句(八) 数据库的完整性约束

    这篇文章主要介绍了sqlserver中数据库的完整性约束使用方法,需要的朋友可以参考下
    2015-01-01
  • SqlServer 表单查询问题及解决方法

    SqlServer 表单查询问题及解决方法

    这篇文章主要介绍了SqlServer 表单查询问题及解决方法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-11-11

最新评论