MLSQL编译时权限控制示例详解

 更新时间:2019年03月22日 08:27:32   作者:祝威廉  
这篇文章主要给大家介绍了关于MLSQL编译时权限控制的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用mysql具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧

前言

关于mysql的权限简单的理解就是mysql允许你做你全力以内的事情,不可以越界。

权限控制,对于MLSQL而言的重要程度可以说是生命线。 MLSQL需要面对各式各样的资源访问,比如MySQL, Oracle,HDFS,Hive,Kafka,Sorl,ElasticSearch,Redis,API,Web等等,不同用户对这些数据源(以及表,列)的权限是不一样的。

传统模式是,每个用户都需要有个proxy user,然后到每个数据源里面给这个proxy user进行授权。 这看起来似乎就是麻烦点,但是在实际操作中,基本是很难执行的,不同的数据源在不同的团队里面,那么整个申请流程可能要天甚至周计了。
如果上面的问题已经让人气馁,那么对于采用Hive做数仓的公司,可能对HIve权限访问更让人绝望。Hive的授权模式是跟着Linux用户走的,也就是Spark启动用户是谁,谁就有权限访问,这个对于多租户的MLSQL应用来说,则是完全不可行了,比如启动Spark的是sparkUser,但是真正执行的人,其实可能是张三,李四等等。Hive就无法知道是具体哪个人完成的,只知道是sparkUser。

还有一个大家可能感慨的点:

我们好不容易写了个脚本,跑了一个小时,突然脚本失败,一看,第350行那里访问的数据源权限不足。 这可真是让人恼火。

问题来了

那么,怎么才能在脚本运行前,就知道脚本里涉及到的资源是不是都被授权了?

答案是:有

题外话:标题不严谨,因为MLSQL本质是个解释性执行语言,不需要编译,更好的标题是 【解析时权限控制】。

MLSQL如果开启了权限验证,他会先扫描整个脚本,然后提取必要的信息,这些信息就包含了各种数据源的详细信息,从而在运行前就可以知道你是不是访问了未经授权的库表。那么MLSQL是怎么做到的呢?我们来看下面的信息:

connect jdbc where
driver="com.mysql.jdbc.Driver"
and url="jdbc:mysql://${ip}:${host}/db1?${MYSQL_URL_PARAMS}"
and user="${user}"
and password="${password}"
as db1_ref;

load jdbc.`db1_ref .people`
as people;

save append people as jdbc.`db1_ref.spam` ;

因为MLSQL要求任何数据源,都需要使用load语句进行加载,在解析load语句时,MLSQL知道,用户现在要访问的是基于JDBC协议的数据源访问,他通过url拿到了这些信息:

db: db1
table: people
operateType: load
sourceType: mysql
tableType: JDBC

当然,这个脚本用户还会写入一张spam表,也一样会被提取信息:

db: db1
table: people
operateType: save
sourceType: mysql
tableType: JDBC

然后还有一张临时表people,所以这个脚本总共有三张表信息,之后这些信息会被发送到AuthCenter里进行判断,AuthCenter会告诉MLSQL那张表是没有对当前用户授权的,如果发现未经授权的表,MLSQL会直接抛出异常。整个过程中,完全不会执行任何物理计划,只是对脚本的信息抽取。

在MLSQL中,我们不能在select语句里访问hive表,只能通过load语句加载,比如下面的句子会报错:

select * from public.abc as table1;

我们无权在select语句中访问public.abc库,如果需要使用,你可以通过如下方式完成:

load hive.`public.abc ` as abc;
select * from abc as table1;

如何实现列级别控制

MLSQL在解析load语句的时候,会询问当前用户访问的表,有哪些列是被授权的,然后会改写最后load的语句,提供一个新的视图,该视图只有用户被授权的列。

总结

MLSQL通过一些有效的限制,可以在语法解析层面直接提取了所有数据源相关信息,并且将其发送给到配套的权限中心进行判断,避免在运行时发现授权拒绝问题。MLSQL此举意义重大,使得MLSQL系统不再完全依赖于底层系统的权限控制,从而让问题得到了极大的简化。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。

相关文章

  • SQL多个字段拼接组合成新字段的常用方法

    SQL多个字段拼接组合成新字段的常用方法

    在sql语句中,有时候我们可能需要将两个字段的值放在一起显示,因为他们通常是一起出现的,比如客户名称和客户编号,那我们就要将这两个字段拼接成一个字段,本文给大家介绍了几种常见的方法,需要的朋友可以参考下
    2024-02-02
  • MySQL多表联合查询、连接查询、子查询的实现

    MySQL多表联合查询、连接查询、子查询的实现

    本文主要介绍了MySQL多表联合查询、连接查询、子查询的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-07-07
  • MySQL 中 FIELD() 自定义排序示例详解

    MySQL 中 FIELD() 自定义排序示例详解

    MySQL中的field()函数,可以用来对SQL中查询结果集进行指定顺序排序,这篇文章主要介绍了MySQL 中 FIELD() 自定义排序,需要的朋友可以参考下
    2024-05-05
  • MySQL分页分析原理及提高效率

    MySQL分页分析原理及提高效率

    这篇文章主要介绍了MySQL分页分析原理及提高效率的相关资料,需要的朋友可以参考下
    2017-05-05
  • MySQL主从延迟问题解决

    MySQL主从延迟问题解决

    这篇文章主要介绍了MySQL主从延迟问题解决的方法,帮助大家更好的理解和使用MySQL数据库,感兴趣的朋友可以了解下
    2021-01-01
  • 学习mysql之后的一点总结(基础)

    学习mysql之后的一点总结(基础)

    学习mysql之后的一点总结,比较适合新手朋友
    2012-05-05
  • MySQL中DATEDIFF()函数用法及返回周、月、年

    MySQL中DATEDIFF()函数用法及返回周、月、年

    这篇文章主要给大家介绍了关于MySQL中DATEDIFF()函数用法及返回周、月、年的相关资料,datediff()函数返回两个日期之间的时间,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-11-11
  • MySQL连接池DataSource的使用及实践

    MySQL连接池DataSource的使用及实践

    DruidDataSource作为一款优秀的数据库连接池组件,不仅提供了高效的连接管理,还包含了丰富的监控和诊断功能,本文主要介绍了MySQL连接池DataSource的使用及实践,具有一定的参考价值,感兴趣的可以了解一下
    2024-07-07
  • 通过mysqladmin远程管理mysql的方法

    通过mysqladmin远程管理mysql的方法

    在一些特殊场景下,想要远程重启mysql,以便让某些修改能及时的生效,但是mysql并没有提供远程重启的功能,唯一能做的就是远程关闭mysql服务
    2013-03-03
  • MySQL中like模糊查询的优化方法小结

    MySQL中like模糊查询的优化方法小结

    本文介绍了五种优化MySQL中like模糊查询的方法,主要包含后缀匹配走索引、反向索引、缩小搜索范围、使用缓存和借助全文搜索引擎这几种,感兴趣的可以了解一下
    2024-11-11

最新评论