导语:随着大数据产生在列和行怎么区分的发展现在出现的列式存储和列式数据产生在列和行怎么区分库,如Hbase。它与传统的行式数据产生在列和行怎么区分库有很大区别嘚
行式数据产生在列和行怎么区分库是按照行存储的,行式数据产生在列和行怎么区分库擅长随机读操作不适合用于大数据产生在列和荇怎么区分像SQL server,Oracle,mysql等传统的是属于行式数据产生在列和行怎么区分库范畴
列式数据产生在列和行怎么区分库从一开始就是面向大数据产苼在列和行怎么区分环境下数据产生在列和行怎么区分仓库的数据产生在列和行怎么区分分析而产生。
一图理解行式数据产生在列和行怎麼区分库和列式数据产生在列和行怎么区分库的区别
- 行式数据产生在列和行怎么区分库把一行中的数据产生在列和行怎么区分值串在一起存储起来然后再存储下一行的数据产生在列和行怎么区分,以此类推
- 列式数据产生在列和行怎么区分库把一列中的数据产生在列和行怎么区分值串在一起存储起来,然后再存储下一列的数据产生在列和行怎么区分以此类推。
-
极高的装载速度 (最高可以等于所有硬盘IO 的總和基本是极限了)
-
适合大量的数据产生在列和行怎么区分而不是小数据产生在列和行怎么区分
-
实时加载数据产生在列和行怎么区分仅限于增加(删除和更新需要解压缩Block 然后计算然后重新压缩储存)
-
高效的压缩率,不仅节省储存空间也节省计算内存和CPU
-
批量更新情况各异,有的优化的比较好的列式数据产生在列和行怎么区分库(比如Vertica)表现比较好有些没有针对更新的数据产生在列和行怎么区分库表现比較差。
-
不适合做含有删除和更新的实时操作