MLSQL Stack如何让流调试更加简单详解

更新时间：2019年06月04日 10:05:33 作者：祝威廉

这篇文章主要给大家介绍了关于MLSQL Stack如何让流调试更加简单的相关资料，文中通过示例代码介绍的非常详细，对大家学习或者使用MLSQL具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧

前言

有一位同学正在调研MLSQL Stack对流的支持。然后说了流调试其实挺困难的。经过实践，希望实现如下三点：

能随时查看最新固定条数的Kafka数据
调试结果（sink）能打印在web控制台
流程序能自动推测json schema(现在spark是不行的)

实现这三个点之后，我发现调试确实就变得简单很多了。

流程

首先我新建了一个kaf_write.mlsql,里面方便我往Kafka里写数据：

set abc='''
{ "x": 100, "y": 200, "z": 200 ,"dataType":"A group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B group"}
''';
load jsonStr.`abc` as table1;

select to_json(struct(*)) as value from table1 as table2;
save append table2 as kafka.`wow` where 
kafka.bootstrap.servers="127.0.0.1:9092";

这样我每次运行，数据就能写入到Kafka.

接着，我写完后，需要看看数据是不是真的都写进去了，写成了什么样子：

!kafkaTool sampleData 10 records from "127.0.0.1:9092" wow;

这句话表示，我要采样Kafka 10条Kafka数据，该Kafka的地址为127.0.0.1:9092,主题为wow.运行结果如下：

没有什么问题。接着我写一个非常简单的流式程序：

-- the stream name, should be uniq.
set streamName="streamExample";

-- use kafkaTool to infer schema from kafka
!kafkaTool registerSchema 2 records from "127.0.0.1:9092" wow;


load kafka.`wow` options 
kafka.bootstrap.servers="127.0.0.1:9092"
as newkafkatable1;


select * from newkafkatable1
as table21;


-- print in webConsole instead of terminal console.
save append table21 
as webConsole.`` 
options mode="Append"
and duration="15"
and checkpointLocation="/tmp/s-cpl4";

运行结果如下：

在终端我们也可以看到实时效果了。

补充

当然，MLSQL Stack 还有对流还有两个特别好地方，第一个是你可以对流的事件设置http协议的callback，以及对流的处理结果再使用批SQL进行处理，最后入库。参看如下脚本：

-- the stream name, should be uniq.
set streamName="streamExample";


-- mock some data.
set data='''
{"key":"yes","value":"no","topic":"test","partition":0,"offset":0,"timestamp":"2008-01-24 18:01:01.001","timestampType":0}
{"key":"yes","value":"no","topic":"test","partition":0,"offset":1,"timestamp":"2008-01-24 18:01:01.002","timestampType":0}
{"key":"yes","value":"no","topic":"test","partition":0,"offset":2,"timestamp":"2008-01-24 18:01:01.003","timestampType":0}
{"key":"yes","value":"no","topic":"test","partition":0,"offset":3,"timestamp":"2008-01-24 18:01:01.003","timestampType":0}
{"key":"yes","value":"no","topic":"test","partition":0,"offset":4,"timestamp":"2008-01-24 18:01:01.003","timestampType":0}
{"key":"yes","value":"no","topic":"test","partition":0,"offset":5,"timestamp":"2008-01-24 18:01:01.003","timestampType":0}
''';

-- load data as table
load jsonStr.`data` as datasource;

-- convert table as stream source
load mockStream.`datasource` options 
stepSizeRange="0-3"
as newkafkatable1;

-- aggregation 
select cast(value as string) as k from newkafkatable1
as table21;


!callback post "http://127.0.0.1:9002/api_v1/test" when "started,progress,terminated";
-- output the the result to console.


save append table21 
as custom.`` 
options mode="append"
and duration="15"
and sourceTable="jack"
and code='''
select count(*) as c from jack as newjack;
save append newjack as parquet.`/tmp/jack`; 
'''
and checkpointLocation="/tmp/cpl15";

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

MySQL数据库中表的操作详解
这篇文章主要为大家详细介绍了MySQL数据库中表常用的一些操作方法，文中的示例代码讲解详细，对我们学习MySQL有一定帮助，需要的可以参考一下
2022-08-08
Mysql脏页flush及收缩表空间原理解析
这篇文章主要介绍了Mysql脏页flush及收缩表空间原理解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-09-09
mysql大表复制的具体实现
MySQL大表复制是指将一个数据库中的大表复制到另一个数据库中,以实现数据的备份或数据迁移的目的,具有一定的参考价值,感兴趣的可以了解一下
2023-10-10
连接MySql速度慢的解决方法(skip-name-resolve)
这篇文章主要介绍了连接MySql速度慢的解决方法(skip-name-resolve),需要的朋友可以参考下
2015-09-09
mysql日期函数用法大全
日期函数在实际应用中可以帮助你轻松处理和操作日期时间数据,使得数据库操作更为灵活和便捷,本文主要介绍了mysql日期函数用法大全,感兴趣的可以了解一下
2024-05-05
MySQL读写分离原理详细解析
这篇文章主要介绍了MySQL读写分离原理详细解析，读写分离是基于主从复制来实现的，文章围绕主题展开详细的内容介绍，具有一定的参考价值，需要的小伙伴可以参考一下
2022-07-07
MySQL运维实战使用RPM进行安装部署
这篇文章主要为大家介绍了MySQL运维实战使用RPM进行安装部署实现示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-12-12
SQL实现LeetCode(175.联合两表)
这篇文章主要介绍了SQL实现LeetCode(175.联合两表),本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
2021-08-08
用MySQL创建数据库和数据库表代码
了解了一些最基本的操作命令后，我们再来学习如何创建一个数据库和数据库表。
2008-10-10
linux mysql5.6版本的安装配置过程
mysql官网开始发布相关的5.6系列的各个版本，对于mysql5.6系列的版本对一起的版本进行了全局性的细节性加强
2013-06-06

MLSQL Stack如何让流调试更加简单详解

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具