Python查询oracle数据库速度慢的解决方案

 更新时间:2021年04月15日 10:44:44   作者:qianya1013  
这篇文章主要介绍了Python查询oracle数据库速度慢的解决方案,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

如下所示:

conn = cx_Oracle.connect('username/password@ip:port/servername')
cur = conn.cursor()
cur.execute('SELECT * FROM "db"."table"')

cur是一个迭代器,不要用fetchall一次性取完数据

直接 for row in cur 即可取数据

使用:sqlalchemy

MySQL-Python
    mysql+mysqldb://<user>:<password>@<host>[:<port>]/<dbname>
 
pymysql
    mysql+pymysql://<username>:<password>@<host>/<dbname>[?<options>]
 
MySQL-Connector
    mysql+mysqlconnector://<user>:<password>@<host>[:<port>]/<dbname>
 
cx_Oracle
    oracle+cx_oracle://user:pass@host:port/dbname[?key=value&key=value...]
create_engine('oracle+cx_oracle://{a}:{b}@{c}:{d}/?service_name={e}'.format(a,b,c,d,e))
create_engine('mysql+pymysql://%(user)s:%(password)s@%(host)s/%(database)s?charset=utf8' % laoshifu_info)
 
df = pd.read_sql_table(table_name="table_name", con=engine)  
(the function to_sql is case-sensitive,Found the root cause from DBMS (mysql) autoconvert the table name to lowercase.)
df = pd.read_sql_query(sql=sql,con=engine)  # 很慢
ordf = pd.read_sql("SELECT * FROM db.table ",engine,chunksize=50000)
dflist = []
for chunk in ordf:
    dflist.append(chunk)
df = pd.concat(dflist)

补充:Python3 Cx_oracle 的一些使用技巧

Cx_oracle的一些使用技巧

工作中的数据库采用oracle。访问oracle数据库一般都采用cx_oracle包来完成,API很清晰,操作效率也比较高,而且oracle官方好像对cx_oracle也非常支持,提供了丰富的文档。这里讨论一些使用技巧,作为记录,可能对你也有用。

我最近用python写了一个小工具,这个工具根据客户端的请求查询数据库,并将结果集以json的方式返回。请求的格式如下:

    {
        fields : [
            {name : "project_id", type : "string"},
            {name : "project_name", type : "string"}
        ],
        
        sql : "select t.project_id, t.project_name from dp_project t"
    }

即,客户端描述自己想要的元数据信息(字段名称,字段类型),以及SQL语句,服务器端根据此信息查询数据库,并将返回组织成客户端在fields中描述的那样。

cx_oracle默认从cursor中fetch出来的数据是一个元组,按照SQL中的顺序组织,但是我希望返回的是一个字典结构,这个可以通过设置cursor的rowfactory属性来实现,定义一个rowfactory的回调函数:

    def makedict(self, cursor):
        cols = [d[0] for d in cursor.description]     
        def createrow(*args):
            return dict(zip(cols, args))     
        return createrow

这个函数返回一个函数:createrow。可能有点绕口,仔细想想就清晰了。cursor中带有足够的信息来生成这个字典,如cursor的description的值为:

   [
   ('PROJECT_ID', <;type 'cx_Oracle.STRING'>, 40, 40, 0, 0, 0), 
   ('PROJECT_NAME', <;type 'cx_Oracle.STRING'>, 50, 50, 0, 0, 1)
   ]

我们需要的是cursor.description的第一列,zip函数将cols和默认的那个元组合成为一个新的元组,再用dict转换为一个新的字典对象返回。

然后将这个返回函数的函数注册给cursor的rowfactory即可:

 cursor.rowfactory = self.makedict(cursor)

这样,我们使用cursor.fetchall/fetchone的时候,取出来的就成为一个字典对象,很方便将其序列化为json格式返回。

另一个技巧是关于将查询到的结果中,字符串类型的字段转换为unicode,数值类型的不做处理:

    def outtypehandler(self, cursor, name, dtype, size, p, s):
        if dtype in (oracle.STRING, oracle.FIXED_CHAR):
            return cursor.var(unicode, size, cursor.arraysize)

将connection对象的outputtypehandler注册为此函数即可:

   connection = oracle.connect(self.constr)
   connection.outputtypehandler = self.outtypehandler

通用查询的这个小工具还在开发中,等完成了再整理一下。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • Python人工智能之sg2im文字转图像

    Python人工智能之sg2im文字转图像

    这篇文章主要介绍了Python人工智能中使用sg2im把文字转成图像的方法,sg2im是一个由Google开发的开源项目,它专注于将场景图形转换为图像,借助sg2im就可以把文字转换成图像,需要的朋友可以参考下
    2021-11-11
  • python实现得到一个给定类的虚函数

    python实现得到一个给定类的虚函数

    这篇文章主要介绍了python实现得到一个给定类的虚函数的方法,以wx的PyPanel类为例讲述了打印以base_开头的方法的实例,需要的朋友可以参考下
    2014-09-09
  • Python使用VIF实现检测多重共线性

    Python使用VIF实现检测多重共线性

    多重共线性是指多元回归模型中有两个或两个以上的自变量,它们之间具有高度的相关性,本文主要介绍了如何使用VIF实现检测多重共线性,需要的可以参考下
    2023-12-12
  • python聊天程序实例代码分享

    python聊天程序实例代码分享

    这篇文章主要介绍了用python写的聊天程序,开两个线程,即是客户端,也是服务器,大家可以参考使用
    2013-11-11
  • Python爬虫之解析HTML页面详解

    Python爬虫之解析HTML页面详解

    本文介绍了Python中用于解析HTML页面的重要工具之一——BeautifulSoup库,详细讲解了BeautifulSoup库的基本使用方法、标签选择器、CSS选择器、正则表达式、遍历文档树等内容,并结合实例代码展示了BeautifulSoup库的应用场景
    2023-04-04
  • Python使用正则表达式过滤或替换HTML标签的方法详解

    Python使用正则表达式过滤或替换HTML标签的方法详解

    这篇文章主要介绍了Python使用正则表达式过滤或替换HTML标签的方法,简单介绍了Python正则相关语法并结合具体实例形式分析了Python基于正则表达式的HTML标签过滤与替换相关操作技巧,需要的朋友可以参考下
    2017-09-09
  • Python的Requests库示例讲解

    Python的Requests库示例讲解

    requests模块是python基于urllib,采用Apache2 Licensed开源协议的 HTTP库,它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP测试需求,需要的朋友可以参考下
    2023-05-05
  • 如何使用pytorch实现LocallyConnected1D

    如何使用pytorch实现LocallyConnected1D

    由于LocallyConnected1D是Keras中的函数,为了用pytorch实现LocallyConnected1D并在960×33的数据集上进行训练和验证,本文分步骤给大家介绍如何使用pytorch实现LocallyConnected1D,感兴趣的朋友一起看看吧
    2023-09-09
  • Django集成百度富文本编辑器uEditor攻略

    Django集成百度富文本编辑器uEditor攻略

    UEditor是由百度web前端研发部开发所见即所得富文本web编辑器,具有轻量,可定制,注重用户体验等特点,开源基于MIT协议,允许自由使用和修改代码。
    2014-07-07
  • 如何安装并使用conda指令管理python环境

    如何安装并使用conda指令管理python环境

    这篇文章主要介绍了如何使用conda指令管理python环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07

最新评论