旗下微信矩阵:

Apache Doris 1.0 版本发布在即,百度致力打造全球*开源数据仓库

2022-01-27 17:08 · 互联网     

近日, Apache Doris(incubating) 宣布即将发布1.0版本,该版本也是 Apache Doris 加入 Apache 孵化器后的* 1 位版本,搭载了完整的向量化执行引擎和可视化运维监控平台-Manager,新增了诸多新功能,并在易用性、稳定性及大数据生态兼容方面进行了全面的升级优化。

据悉,Apache Doris 1.0已经进入发版前最后的筹备阶段,同时在全面推进 Doris 从 Apache孵化器毕业的相关工作。百度集团副总裁侯震宇表示,“ 百度将持续加大投入,把 Doris 打造成全球*开源数据仓库,持续为全球开源社区贡献力量,相信Doris将为企业数字化转型提供关键助力。”

十四年发展,从支持百度内部业务到成为明星开源项目

Apache Doris 是基于大规模并行处理技术的高性能分析型数据库,主要定位为面向数据分析场景的OLAP系统,支持包括多维分析、实时分析、联邦分析、交互式分析等在内的多种数据分析场景。

自 2008 年诞生至今,Doris 已经正式进入发展的第十四年。Doris 最早是由百度基础架构部开发,用于解决百度凤巢广告统计报表的专用系统。伴随着百度业务的飞速发展,Doris 实现了通用化改造,并基于技术演进进行了诸多版本的优化和升级。截至 2022 年初,Doris 依靠其简单易用、*性能、稳定可靠、易于拓展等技术特点,服务了百度内部数百个业务线、上千个集群,成为百度内部数据分析体系的基石。

为了帮助更多人高效、便捷地解决数据分析难题,2017 年百度将 Doris 进行开源,并在 2018 年将其捐献给 Apache 基金会进行孵化。如今,Apache Doris 已成长为大数据领域冉冉升起的明星开源项目,拥有高度活跃的开发者社区,并获得用户的广泛认可。

目前,Apache Doris 的开源用户已接近 300 家,包括美团、小米、腾讯、京东、字节、网易等众多一线互联网公司,覆盖了互联网、金融、教育、电信等十余个行业。在海量数据和复杂业务的考验下,Apache Doris 提交出了一份*的答卷。

搭载向量化执行引擎,Apache Doris 1.0 版本性能大幅提升

自开源以来,Apache Doris 保持了稳定的版本迭代节奏,持续优化产品服务的性能、易用性和稳定性。此次即将发布的 1.0 版本,将作为 Doris 加入 Apache 孵化器后的*个1位版本,搭载了完整的向量化执行引擎和Manager可视化运维分析平台,并增加 Z-order Indexing、Lateral View、Hive外表、Apache SeaTunnel Connector 等多项全新功能,进一步提升Doris的数据分析性能、并大幅扩展了业务应用场景。

尤其是完整的向量化执行引擎的加入,改变了计算引擎对数据的组织方式、引入新的列式存储格式,并重新设计了向量化执行函数框架和向量化算子。通过整体向量化工程的实现,Apache Doris 的查询性能在原有优势表现下更进一步,实现 3-5 倍的大幅提升。

在用户需求不断进化和云计算技术广泛推进的背景下,接下来,Apache Doris 将在离线在线一体化、存算分离、实时更新、半结构化数据分析支持等方向持续发力,不断保持 Apache Doris 的*优势。

相关机构预测,未来几年,中国的数据库市场将呈高增长态势。其中,数据分析是企业“数据驱动业务”的核心环节,用数据“洞察过去”为业务发展和关键决策提供重要依据已经成为企业数字化转型过程中首要面对的问题。在这样的大趋势下,Apache Doris 团队将持续关注云原生、流批一体和国际化等数据库行业的最新动态,将 Apache Doris 打造成全球*的开源分析型数据库。

(免责声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。请读者仅做参考,并请自行承担全部责任。)