数据存储架构

存算一体 存算分离
主要还是对象存储 + HDFS 做微底层,然后用湖仓一体
数据库(Database)
数据仓库(Data Warehouse)
数据集市(Data Mart)
数据湖(Data Lake)
数据网格(DataMesh)
湖仓一体(LakeHouse)
定义
存储相关数据的地方
存储历史数据和支持数据分析
针对特定业务部门的数据子集
存储原始数据的大型存储库
数据的自治和共享
用途
在线事务处理(OLTP)
在线分析处理(OLAP)
特定业务部门的数据分析和决策支持
灵活的数据分析和探索
跨组织和跨团队的数据共享和协作
数据类型
结构化、关系型、非结构化、NoSQL
结构化
结构化
结构化、半结构化、非结构化
结构化、半结构化、非结构化
数据处理
实时事务数据处理
提取-转换-加载(ETL)或类似ELT过程
针对特定需求的数据提取和整合
原始数据存储,按需处理和分析
数据所有者自治,分布式数据共享
查询
SQL查询
SQL查询
SQL查询
按需处理和分析
分布式数据查询和共享
数据组织
表、索引、键、视图、数据类型
表、索引、键、视图、数据类型
表、索引、键、视图、数据类型
灵活的数据组织
分布式数据组织和架构
数据共享
有限的共享能力
针对特定用户和部门的共享
针对特定业务部门的共享
强调跨组织和跨团队的共享
强调数据自治和共享
数据分析
实时事务数据分析
历史数据分析和商业智能
特定业务部门的数据分析和决策支持
灵活的数据分析和探索
跨组织和跨团队的数据分析和协作
Loading...
目录
文章列表
王小扬博客
产品
Think
Git
软件开发
计算机网络
CI
DB
设计
缓存
Docker
Node
操作系统
Java
大前端
Nestjs
其他
PHP