利用C++实现⾃然连接操作算法

 更新时间:2022年08月01日 15:46:49   作者:biyezuopinvip  
这篇文章主要介绍了利用C++实现⾃然连接操作算法,文章围绕主题展开详细的内容介绍,具有一定参考价值,需要的小伙伴可以参考一下

1. 实验目的

本次实验三需要完成的内容为实现然连接(natural join)操作算法,对两个关系进然连接,具体实现基于块的嵌套循环连接(Block-based Nested Loop Join)算法。

我们要实现的函数在 executer.cpp 文件中。

bool NestedLoopJoinOperator::execute(int numAvailableBufPages,
                                     File &resultFile)

2. 实验内容

首先,我们读取两个表头的信息

TableId leftTableId = catalog->getTableId("r");
TableId rightTableId = catalog->getTableId("s");
badgerdb::File left = File::open(catalog->getTableFilename(leftTableId));
badgerdb::File right = File::open(catalog->getTableFilename(rightTableId));

运用两层循环寻找两个表中名称与类型完全相同的属性,将他们全部标记出来,用于之后的自然连接操作。

vector<int> leftForeignKeyId;
vector<int> rightForeignKeyId;
for (int i = 0; i < leftTableSchema.getAttrCount(); i++)
{
    for (int j = 0; j < rightTableSchema.getAttrCount(); j++)
    {
        if ((leftTableSchema.getAttrName(i) == rightTableSchema.getAttrName(j)) && (leftTableSchema.getAttrType(i) == rightTableSchema.getAttrType(j)))
        {
            leftForeignKeyId.push_back(i);
            rightForeignKeyId.push_back(j);
            break;
        }
    }
}

准备操作做完后,开始进行自然连接操作。

用循环从磁盘中读取两个页面的信息,记录 io 操作次数

for (badgerdb::FileIterator leftPage = left.begin(); leftPage != left.end(); leftPage++)
{
    badgerdb::Page *bufferedLeftPage;
    bufMgr->readPage(&left, (*leftPage).page_number(), bufferedLeftPage);
    numIOs += 1;

    for (badgerdb::FileIterator rightPage = right.begin(); rightPage != right.end(); rightPage++)
    {
        badgerdb::Page *bufferedRightPage;
        bufMgr->readPage(&right, (*rightPage).page_number(), bufferedRightPage);
        numIOs += 1;

之后,从表中读取全部的元组的信息,进行对比。

读取的元组信息有特殊的格式,并不能直接利用,所以需要先了解元组在表中储存的格式,然后进行解读。元组的存储方式可以从 storage.cpp 中的 createTupleFromSQLStatement 函数中得知。

switch (dataType) {  // (int) 56 (0011 1000) -> (char) '\0''\0''\0''8'
case INT: {        // convert int value into 4 byte representation
    case CHAR: {  // (char(5) ) 'abc' -> 'abc00'
        case VARCHAR: {  // (varchar(8) ) 'abc' -> '3''abc'  (3 refer to the ascii
            // code number correspond alpha)

于是,我们根据注释的存储方式编写解析函数,该函数输入为文件中存储的元组,输出为数组表示的直观的元组内容。

vector<string> analyze(string record, badgerdb::TableSchema schema)

先读取其中一个表的元组,用块来存储。

for (badgerdb::PageIterator leftRecord = bufferedLeftPage->begin(); leftRecord != bufferedLeftPage->end(); leftRecord++)
{
    vector<string> leftInfo = analyze(*leftRecord, leftTableSchema);
    numUsedBufPages += 1;
    block.push_back(leftInfo);
    if (block.size() < BLOCK_SIZE)
    {
        continue;
    }

然后读取另一个表的元组信息,

for (badgerdb::PageIterator rightRecord = bufferedRightPage->begin(); rightRecord != bufferedRightPage->end(); rightRecord++)
{
    numUsedBufPages += 1;

将两个元组当中的属性名相同的属性列信息进行对比,

bool f = true;
for(int i = 0; i < leftForeignKeyId.size(); i++)
{
    if(leftInfo[leftForeignKeyId[i]] != rightInfo[rightForeignKeyId[i]])
    {
        f = false;
        break;
    }
}

如果全部相同,则代表需要进行自然连接操作。

if(f)
{
    string current_line = "INSERT INTO TEMP_TABLE VALUES (" + leftInfo[0];
    for (int i = 1; i < leftTableSchema.getAttrCount(); i++)
    {
        current_line = current_line + ", " + leftInfo[i];
    }
    for (int i = 0; i < rightTableSchema.getAttrCount(); i++)
    {
        current_line = current_line + ", " + rightInfo[i];
    }
    current_line = current_line + ");";

    string tuple = HeapFileManager::createTupleFromSQLStatement(current_line, catalog);
    numResultTuples += 1;
    HeapFileManager::insertTuple(tuple, resultFile, bufMgr);
}

否则不进行任何操作。

在全部循环都结束之后,块中可能还会有剩余的信息没有进行处理,此时再单独对剩余信息进行处理,代码基本相同。

3. 实验结果

代码运行结果如下:

到此这篇关于利用C++实现⾃然连接操作算法的文章就介绍到这了,更多相关C++连接操作算法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 浅析C/C++中sort函数的用法

    浅析C/C++中sort函数的用法

    做项目的时候,排序是一种经常要用到的操作。如果每次都自己写个冒泡之类的O(n^2)排序,不但程序容易超时,而且浪费宝贵的时间,还很有可能写错。STL里面有个sort函数,可以直接对数组排序,复杂度为n*log2(n)。
    2014-09-09
  • 探讨:将两个链表非降序合并为一个链表并依然有序的实现方法

    探讨:将两个链表非降序合并为一个链表并依然有序的实现方法

    本篇文章是对将两个链表非降序合并为一个链表并依然有序的实现方法进行了详细的分析介绍,需要的朋友参考下
    2013-05-05
  • C++ QT实现获取本机网卡信息

    C++ QT实现获取本机网卡信息

    这篇文章主要为大家详细介绍了如何利用qt自带的QNetworkInterface接口以及c++Iphlpapi库,获取当前windows电脑下的网卡信息,需要的可以参考下
    2024-01-01
  • Matlab实现绘制高阶版本韦恩图(upset图)

    Matlab实现绘制高阶版本韦恩图(upset图)

    韦恩图随着阶数升高会越来越复杂,当阶数达到7或者以上时几乎没办法绘制,但是使用upset图却可以比较轻易的绘制。本文就来用Matlab实现绘制upset图,需要的可以参考一下
    2023-01-01
  • linux c模拟ls命令详解

    linux c模拟ls命令详解

    本篇文章是对linux中基于c模拟ls命令的实现方法进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • C语言静态链表和动态链表

    C语言静态链表和动态链表

    静态链表和动态链表是线性表链式存储结构的两种不同的表示方式。静态链表的初始长度一般是固定的,在做插入和删除操作时不需要移动元素,仅需修改指针。动态链表是相对于静态链表而言的,一般地,在描述线性表的链式存储结构时如果没有特别说明即默认描述的是动态链表。
    2016-05-05
  • 基于C语言实现简单的扫雷游戏

    基于C语言实现简单的扫雷游戏

    这篇文章主要为大家详细介绍了基于C语言实现简单的扫雷游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-10-10
  • C语言实现扫雷游戏(可展开)

    C语言实现扫雷游戏(可展开)

    这篇文章主要为大家详细介绍了C语言实现扫雷游戏,实现扫雷展开和提醒,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-03-03
  • QSS样式表实现界面换肤功能

    QSS样式表实现界面换肤功能

    这篇文章主要介绍了QSS样式表实现界面换肤功能,对QSS样式表进行简单介绍,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-10-10
  • C++ 在堆上开辟与释放二维、三维指针详细解析

    C++ 在堆上开辟与释放二维、三维指针详细解析

    一维指针其实就相当于一维数组,不用去看书上所说的数组在内存中的首地址这些晦涩的话,以此类推 二维指针就相当于二维数组,新手对一维数组的开辟与释放比较容易熟悉
    2013-09-09

最新评论