阿里云再发力云原生数据库,打造一站式在线数据处理平台

近年来,大数据和人工智能成为了不可分割的两个名词。数智化已经成为了当今时代的标签。那么,在数智化时代,云原生到底意味着什么?和传统数据库相比,云原生数据库的核心优势是什么?是否把数据库搬上云就是云原生? 这些问题都在近日举办的”数聚云端,智驭未来” 为主题的阿里云数据库创新上云峰会上得到了答案。

在数据爆炸性持续增长的时代,应用对数据处理实时化的需求越来越强烈,智能化技术无处不在。除了传统的结构化数据之外,还要增强对非结构化数据处理的能力。权威数据显示,在未来的一两年时间内,75%以上的数据库实例会以云化的方式部署和运营。

云数据库显然会变成一个最重要的发展方向,云数据库厂商在快速的崛起和前进。据 Gartner 发布《2020 年度全球数据库魔力象限报告》显示,阿里云进入全球数据库领导者象限,这是中国数据库 40 年来首次进入全球顶级数据库行列。

云原生数据库时代已来

纵观数据库的发展史,基础设施和应用场景都在发生变化,催生了数据库技术的不断演进。基础设施从大型机到小型机,再到PC服务器、互联网,再到今天的云+端,AIOT,应用则从早期科学研究到国防,到大型商业处理,到企业信息化,再到互联网时代的移动化、智能化、计算无处不在,这催生了数据库系统从早期关系型数据库到开源数据库,发展到云原生数据库。技术的演进、商业的需求、业务的需求推动了数据库技术不断发展。

数据库在早期单节点的数据库架构中,系统应用都需要主备架构来确保高可用的能力。后来为了解决主备切换带来的可扩展性不强,维护性复杂等痛点,设计了云原生架构和可扩展性的架构,来解决分布式处理的查询挑战。云原生的数据库将资源池化,资源解耦,做分布式共享存储,之上是计算层和应用接入层,使得应用享受到了分布式技术,云原生技术的红利。同时,云原生的数据库部署和使用起来非常简单易用,可以百分之百兼容现有的生态。

至今,阿里云已经打造出了丰富的企业级云原生数据库产品组合,包括云原生关系型数据库 PolarDB、云原生分布式数据库 PolarDB-X、云原生数据仓库 AnalyticDB(ADB)、一站式数据管理平台 DMS、云原生多模数据库 Lindorm 和企业级云数据库服务 RDS 等。 

数据库五大发展趋势

说到未来数据库的发展趋势,阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞将其总结为五点。

首先,在未来,数据库云原生+分布式是标配,用云原生的方式构建数据库系统,资源池化,资源持有。在此基础上,分布式是必然发生的,所有数据库系统都将向这个方向演进。

第二,AI for DB和DB for AI。用AI将数据库运维管控智能化,尤其是在云原生+分布式的前提下更重要,因为数据库不仅是内核的能力弹性高可用、可拓展性,更重要的是部署后应用和运维的复杂度要大大降低。DB for AI则表示,面对越来越多非结构化的数据,分析能力十分重要。

第三,数据的安全可信。如何确保数据库系统处理数据全链路过程中提供加密能力,和多方安全计算能力,提供隐私保护的能力,是很重要的趋势。

第四,多模数据处理。当今,爆发性增长的数据包括结构化数据、非结构化数据、面向互联网的数据等,还有新能源汽车这种新场景下产生的数据。这些数据和信息场景对新型数据库多模态的处理AIOT场景非常重要。

第五,一站式在线数据处理平台,库仓一体,库仓联动,库仓打通。用户无需关心具体在使用哪种类型的数据库,一站式的在线数据管理平台可以管理一份数据,多个引擎,数据之间打通,无缝流转,对应实现无感知。

首个一站式敏捷数据仓库解决方案

峰会上,阿里云重磅发布了首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS和云原生数据仓库AnalyticDB(ADB),真正实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,令企业在线数据释放最大价值。

相较于传统方案,阿里云一站式敏捷数据仓库解决方案对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%;事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内;支持复杂实时数据加工、计算逻辑;低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景。

除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。

针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。

李飞飞在采访中总结了阿里云数据库系列产品的优势:一是来源于客户需求,以市场为导向,以产品为核心,以技术为基础。阿里云有庞大的客户群体,可以不断地贴近客户的需求,深入理解客户需求,这是技术演进的最大驱动力。二是人才。阿里云数据库聚集了国内外一流的数据库人才和团队,会吸引越来越多更优秀的人才加入。三是历史积累。阿里巴巴集团有非常丰富的、复杂的业务积累,是阿里云数据库产品最好的练兵场。