C#高效比较两个DataTable数据差异化的方法实现

 更新时间:2022年05月18日 15:11:07   作者:涛神-DevExpress资深开发者  
本文主要介绍了C#高效比较两个DataTable数据差异化的方法实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

假如有两个DataTable表格分别是dt1,dt2,dt2中有些数据跟dt1一样,现在想找出dt2的数据在dt1中不存在的数据集(换句话也可以说dt2删除已经存在于dt1中的数据),传统思想可能直接用循环找差异,这种是非常低效的做法,数据量少无所谓,数据量大,简直要了程序猿老命,既然直接循环查找不可取,那么有没有高效一点的做法呢(废话,凑数字用,当然是有了),C# linq 中IEnumerable 提供了Expect(差集)的方法,众所周知,DataTable提供了AsEnumerable()的转换方法,能把DataTable转成IEnumerable<DataRow>,这样我们就能linq 来处理DataTable了,如果dt1和dt2的结构相同,则可以直接dt2.AsEnumerable().Expect(dt1.AsEnumerable())来获得两个表格的差异,当然这个结果的返回是一个IEnumerable<DataRow>,如果想要一个DataTable结果,可以直接调用方法CopyToDataTable()(该方法调用之前需要判断结果集是否没有数据,没有数据会报错)

var list=dt2.AsEnumerable().Except(dt1.AsEnumerable());
DataTable resultDt;
if(list.Count()>0)
    resultDt=list.CopyToDataTable();
else
    resultDt=dt2.Clone();//克隆个结构;

如果dt1,dt2的结构不一样,那么就不能直接用Except方法来处理了,这里我的建议是用linq中的join方法,先把dt1,dt2两个表做一个内连接的关联处理,找出dt2跟dt1相同的部分,然后再利用dt2跟dt2于dt1相同的部分做一次差集处理,就能得出dt2和dt1的差集,直接上代码,代码演示用的是linqpad工具,其中的Dump方法是用来输出打印的,vs调试的话,请自行修改成Console,测试数据用了50w,60w如果单靠差集处理,是秒级别

void Main()
{
	Stopwatch sw = new Stopwatch();
	sw.Start();
	var dt1 = CreateDt(500000, 3);
	var dt2 = CreateDt(600000, 5);
	sw.Stop();
	sw.Elapsed.Dump("生成两个表的时间");
	
	sw.Restart();
	//dt2.AsEnumerable().Except(dt1.AsEnumerable());//如果表格表的结构相同,则直接差集处理得出结果
	var dt = dt2.AsEnumerable().Join(dt1.AsEnumerable(), p => p[0], p => p[0], (p, q) => p);//内连接,查询两个表格相同部分,再利用相同部分做差集处理得出结果就是dt2在dt1中的差集
	var result = dt2.AsEnumerable().Except(dt).ToList();
	sw.Stop();
	result.Count.Dump("差集结果条数");
	sw.Elapsed.Dump("查询差异的时间");
	sw.Restart();
	DataTable resultDt;
	if (result.Count() > 0)
	resultDt = result.CopyToDataTable();
	else
		resultDt = dt2.Clone();
	
	sw.Stop();
	sw.Elapsed.Dump("转成DataTable耗时:");
 
}
DataTable CreateDt(int row, int count)
{
	var dt = new DataTable();
	for (int i = 0; i < count; i++)
		dt.Columns.Add("col" + i);
	var rnd = new Random();
	for (int i = 0; i < row; i++)
	{
		var num = rnd.Next(0, row);
		dt.Rows.Add(dt.Columns.Cast<DataColumn>().Select(p => p.ColumnName + num).ToArray());
	}
	return dt;
}

 结果图:

从结果上看,关联和差异处理共耗时1秒左右,这个速度还是能接受的

到此这篇关于C#高效比较两个DataTable数据差异化的方法实现的文章就介绍到这了,更多相关C# 两个DataTable数据差异化内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C# App.config和Web.config加密的实现步骤

    C# App.config和Web.config加密的实现步骤

    本文介绍了如何使用C#对App.config和Web.config文件进行加密,通过使用ConfigurationSection类和SymmetricAlgorithm类,我们可以保护配置文件中的敏感数据,确保只有授权人员可以访问
    2023-08-08
  • C#使用MVC框架创建WebApi服务接口的流程步骤

    C#使用MVC框架创建WebApi服务接口的流程步骤

    WebAPI是一种基于HTTP协议的网络应用程序接口,它使用JSON或XML格式来传输数据,本文通过图文和代码示例给大家介绍了C#使用MVC框架创建WebApi服务接口的流程步骤,需要的朋友可以参考下
    2025-01-01
  • .net 一些无法catch的异常

    .net 一些无法catch的异常

    .net 一些无法catch的异常,需要的朋友可以参考一下
    2013-04-04
  • C#锁住文件的操作步骤

    C#锁住文件的操作步骤

    在本篇文章里小编给大家整理的是关于C#锁住文件的操作步骤以及相关知识点,需要的朋友们参考下。
    2019-08-08
  • C#实现斐波那契数列的几种方法整理

    C#实现斐波那契数列的几种方法整理

    这篇文章主要介绍了C#实现斐波那契数列的几种方法整理,主要介绍了递归,循环,公式和矩阵法等,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-09-09
  • c#中winform根据邮箱地址和密码一键发送email的实现

    c#中winform根据邮箱地址和密码一键发送email的实现

    本文主要介绍了c#winform根据邮箱地址和密码一键发送email的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-07-07
  • C#调用C++dll方法步骤

    C#调用C++dll方法步骤

    在本篇文章中小编给读者们整理了关于C#调用C++dll方法和步骤,需要的朋友们跟着操作下。
    2019-02-02
  • C#中new的用法及与override的区别分析

    C#中new的用法及与override的区别分析

    这篇文章主要介绍了C#中new的用法,及与override的区别,需要的朋友可以参考下
    2017-05-05
  • C#使用timer实现的简单闹钟程序

    C#使用timer实现的简单闹钟程序

    这篇文章主要介绍了C#使用timer实现的简单闹钟程序,涉及timer控件的使用及音频文件的操作技巧,非常具有实用价值,需要的朋友可以参考下
    2015-03-03
  • C#使用LibUsbDotNet实现USB设备检测

    C#使用LibUsbDotNet实现USB设备检测

    C# LibUsbDotNet是一个.NET平台上的库,用于访问USB设备,它封装了Linux下的libusb库,LibUsbDotNet提供了一个简单的API,开发者可以利用这个库在C#中操作USB设备,本文介绍了C#使用LibUsbDotNet实现USB设备检测,需要的朋友可以参考下
    2024-07-07

最新评论