项目说明
    项目说明
    • 通用FlinkSQL数据开发平台

    通用FlinkSQL数据开发平台

    Gientech-FlinkSQL开发平台平台#

    目的意义#

    (1) 降低流式作业开发门槛高#

    业务开发人员和程序人员对流任务的开发在技能上有不重叠的情况。业务开发人员对业务熟悉,但对流式任务开发中涉及到保证容错的checkpoint,savepoint,保证准确的watermark,状态编程,各种connecter组件等领域知识有所欠缺。#

    (2) 应对业务变化多样#

    尤其是面对甲方复杂多变的业务需求,如果都是程序开发人员和我公司业务人员配合共同完成的话,不仅效率低,而且知识技能也会有局限#
    所以这块任务适宜独立整合出来,作为通用的功能存在。#

    互联网公司目前现状#

    当前在中大型的互联网公司内部,像字节跳动,网易云音乐,Bigo等都有类似功能的处理平台的建设实践。功能开发重点各有所侧重,有的是在FlinkSQL的基础上进行的上层封装,聚焦在好用,有的是在FlinkSQL本身进行功能的扩展和优化,并建立上层封装。但整体而言,都会开放sql的编写本身个业务人员,程序开发人员专注与flink的封装和底层优化工作,做到合理的协作。#

    阿里内部平台的样例截图#

    image.png

    gientech-flinksql的样例截图#

    image.png

    主要内容#

    我们的FlinkSQL开发平台的主要功能有:#
    1. 任务支持单流,双流,单流和维表join#
    2. 支持sql在线开发,语法提示,sql语句校验。#
    3. 支持本地,yarn,standalone任务提交。#
    4. 连接器兼容官方连接器。#
    5. 支持任务的启停。#
    6. 支持日志的在线展示。#

    创新点#

    整合当前主流的前后端和大数据计算技术,包括前端vue+elementUI+coremirror,后端springboot+hibernate-jpa,以及主流的流处理框架flink。#

    推广应用前景#

    业务开发人员对sql的掌握以及对自身业务的理解很到位,FlinkSQL开发处理平台,可以帮助业务开发人员很好的把业务往流处理上进行提升。降低了流任务的开发门槛。并且该平台本身也可以在sql开发的核心功能点的基础上,进行衍生开发,包括实时ETL开发,OLAP在线实时查询,血缘管理,数据治理管理等。#
    修改于 2025-03-29 10:07:30
    Built with