近年来,随着企业数字化转型的不断深入和发展,数据逐渐成为企业最重要的资产。对于每一个企业来说,都需要关注数据从产生、存储、分析到利用,并发挥其巨大价值的整个过程。此外,随着企业之间竞争的不断加剧,对数据的产生到发挥其价值的时间延迟要求越来越短。
作为存储和处理数据最重要的基础软件——数据库系统,一般可以按照负载类型分成 OLTP 型数据库和 OLAP 数据库。在一个企业中,这两种类型的数据库通常是并存的,分别支撑这两种负载类型的应用系统。目前,很多企业的这两种类型的系统之间是通过较为复杂的 ETL 过程“打通的”,数据在时效性上具有比较大的 T+N 延时,这越来越难以满足企业在数据处理和分析方面对时效性的要求。
近几年,HTAP 是比较热的一个概念,它是最有希望解决目前问题的方法。顾名思义, HTAP 是混合 OLTP 和 OLAP 业务,具备同时解决这种两种问题能力的系统。2014 年 Garnter 公司给出了严格的定义:混合事务/分析处理 (HTAP) 是一种新兴的应用体系结构,它打破了事务处理和分析之间的 “墙” 。它支持更多的”信息分析“和 “实时业务” 的决策。
TiDB 是一个具有优异交易处理能力的分布式 NewSQL 产品,同时也具备了良好的分析能力,又是一款优秀的 HTAP 数据数据库产品。在这部分内容中,首先向大家介绍 TiDB HTAP 的主要特点,然后介绍其实现 HTAP 能力的关键技术之一的 TiFlash 列式存储引擎的架构和基本原理,最后向大家介绍 TiFlash 如何使用。