开源技术社区 - Apache Kylin

时间:2021.08.07 点击量:2302

 Apache Kylin社区

WX20210816-104706@2x.png


社区简介:  开源大数据 OLAP 引擎


2014 10 月开源,Apache Kylin 已经成为领先的开源大数据 OLAP 引擎Kylin 为万亿数据提供亚秒级查询,并可以和现有的 Hadoop/Spark BI 无缝集成。Kylin 是大数据版图中一个强有力的框架,也已被全球上千家组织所采用。 Kyligence 智能数据云为企业实现自动化的数据服务和管理。借助机器学习和 AI 技术,Kyligence 从多云的数据存储中识别和管理最有价值数据,并提供高性能、高并发的数据服务支撑数据分析与应用,同时不断为企业节省成本。

 

技术概要:


Apache Kylin™是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。Kylin 基础框架,包括元数据(Metadata)引擎,查询引擎,Job引擎及存储引擎等,同时包括REST服务器以响应客户端请求

Apache Kylin™即可实现超大数据集上的亚秒级查询。

1.   定义数据集上的一个星形或雪花形模型

2.   在定义的数据表上构建cube

3.   使用标准 SQL 通过 ODBCJDBC RESTFUL API 进行查询,仅需亚秒级响应时间即可获得查询结果

4.   Kylin 提供与多种数据可视化工具的整合能力,如 TableauPowerBI 等,令用户可以使用 BI 工具对 Hadoop 数据进行分析。

5.   扩展: 支持额外功能和特性的插件

6.   整合: 与调度系统,ETL,监控等生命周期管理系统的整合

7.   用户界面: Kylin核心之上扩展的第三方用户界面

8.   驱动:  ODBC JDBC 驱动以支持不同的工具和产品,比如Tableau