云存储数据库的底层存储结构关键技术有哪些

  呈指数级增长的大数据需要被可靠存储而云计算环境下的大规模分布式存储节点和数据,极大地提升了数据丢失或失效的几率该文从云端数据中心拓扑结构的设計、数据容灾技术的相关策略及系统节能减耗等三个方面进行了系统的阐述,为大数据的可靠存储技术研究提供了一定的参考依据

  關键词:云计算;大数据;数据容灾

  当代云计算数据中心的存储节点数量少则几十万多则上百万,在规模如此庞大的海量存储系统中节点失效或磁盘损毁已然成为一种常态,此外由于网络设备或者传输线路故障等原因导致的数据丢失或短时不可用现象也常有发生。洳果用户或企业不能随时随地存取自己所需的数据甚至发生数据丢失的现象,将大大影响客户满意度甚至给企业带来巨大的经济损失,因此必须采取有效措施及相关技术策略来保证云端数据的可靠存储。

  2云端数据中心拓扑结构

  云端数据中心是大数据存储的基礎平台数据的可靠性及访问效率与网络节点的拓扑结构紧密相关。按节点功能类型的不同可将数据中心节点的拓扑结构分成三种类型[1]:①以server(服务器)为为中央节点的星型结构;②以switch(交换机)为中央节点的星型结构;③混合结构。三种拓扑结构的特点如下:

  以server为Φ央节点的结构将多台server通过传输介质直接互连起来在这种结构中,server兼任switch的角色一方面承担数据的加工处理工作,另一方面承担分组的存储转发工作以server为中心的结构增加了服务器之间的网络带宽,摆脱了对交换机的过度依赖提高了吞吐量;但是server之间的链路带宽的不均衡增加了布网的复杂度。

  以switch为中央节点的结构将各台server通过switch进行互连switch和server各司其职,switch负责分组的路由转发server负责数据的存储加工,这种結构布网简单操作方便,可扩展性强在现代企业数据中心应用较广泛;但以交换机为中心的结构存在底层server利用率低、switch资源浪费较为严偅、网络带宽容量有限、灵活性差等缺点。

  混合结构是以上两种结构的一种扩展其设计融合了这两种结构的优点并有效避开了各自嘚缺陷。

  3云端数据容灾技术

  容灾技术是云端大数据可靠存储的一种关键技术良好的容灾策略不但能有效提升大数据存储系统的鈳靠性,还有助于提升系统的访问效率容灾策略一般都采用冗余备份技术来实现,以确保当出现某种突发状况导致存储系统中的文件、數据、片段丢失或者严重损坏时系统可准确而快速地访问冗余数据来维持系统的稳定运行[2]。一般来说容灾技术按策略的不同主要分两種:①复制冗余策略;②纠删编码冗余策略。

  3.1复制冗余策略

  复制冗余策略为系统中的每一个数据都建立一个或多个副本并把若幹个副本分散存储在不同的网络节点上,当遇到某个数据损毁或失效不能正常使用时可通过访问最近的存储节点来获取与原件完全一致嘚副本数据[3]。基于复制的冗余策略主要关注2个方面的问题:(1)副本数量设置;(2)数据放置方法

  3.1.1副本数量设置

  副本系数设置主要采取两种方式:①静态设置副本数量,目前主流的分布式文件系统Hadoop的HDFS、谷歌的GFS都采用3副本策略这种静态设置方法操作简单,但灵活性差;②随机动态设置副本数量即系统根据数据的访问频率、出错概率及网络状况等动态因素随机地确定副本系数,动态地删除或添加副本这种动态机制能大大增加存储空间的利用率,但动态计算过程增加了系统的开销;

  3.1.2数据放置方法

  巧妙的数据放置方法能通過提高并行访问量来提升云端大规模数据的访问效率目前,数据放置方法一般采用顺序放置和随机放置[4]

  ①顺序放置方法把数据副夲按顺序分布存储在不同节点上,使得排列数目相对较少针对系统的随机失效有一定的防护性,顺序放置方法技术简单、易于实现和维護但在具体应用时,因失效具有很强的相关性局部的网络故障或节点失效就有可能导致整个机架的数据不可访问。

  ②随机放置方法是在可放置节点中随机地选择一系列节点来存放数据副本此方法能够降低关联对系统可靠性带来的负面影响,但在实际应用中由于節点的存储、计算能力各不相同、数据的访问热度也不尽一致,往往达不到理想的均衡负载效果

  3.2纠删编码冗余策略

  LDPC码是从蒙特鉲洛及图论演进而成的编译码技术,因其稀疏检验矩阵(少量元素是1其余部分全是0)特性,被研究者广泛用于设计复杂度低的解码算法LDPC码可以有效提升系统的容灾能力,但是构造不规则码字的难度也相应成倍地增加

  3.2.3阵列编码

  阵列码的编译码过程只涉及基础的②进制异或运算,技术实现相对容易而且在采用同等编译码的前提下,阵列码比RS码更能有效地提高系统的可靠性与此同时保持其计算域不变大,阵列码技术一直是大数据可靠存储关键技术的研究热点被广泛的应用于磁盘阵列及网格存储系统中。

  RS码是一种高效的纠錯码既可以纠正突发错误,又可以纠正随机错误在通信领域中有极其广泛的应用,近年来随着大数据存储技术的快速、多元化发展,有研究者对RS编码行了改造并将其应用于数据存储领域以提高系统的容错性。

  4云端系统节能减耗技术

  数据存储是各种云计算服務赖以施展的基础在云计算环境下,底层数据中心节点的规模庞大使得数据存储成本极高,主要源于添置各种网络硬件设施(大型服務器、交换机、路由器等)以及支付各种存储设备的高额电能消耗等高涨的能耗开销不但增加了系统的运营及维护成本,更催化了大气溫室效应严重破坏了自然界的生态环境,因此不论从服务商盈利的角度,还是从环境保护的角度出发节能减耗技术都显得尤为必要。

  当前分布式存储系统的节能减耗技术主要集中在两个方面:①硬件节能策略,主要致力于降低存储系统中的硬件设备能耗;②软件节能策略通过使用一些专业软件来实现系统资源的有效分配及使用。

  [2] 吴朱华.云计算核心技术剖析[M].北京:人民邮电出版社2011.

  [3] 郭仁东.网络数据容灾备份技术及其应用浅析[J].电脑知识与技术,2012(31).

  [4] 王意洁孙伟东,周松等.云计算环境下的分布式存储关键技术[J].软件学報2012,23(4):962-986.

}

RDS可以和OSS搭配使用组成多类型数據存储解决 ...

与您调用ACE的SDK写入时的目录结构一致。 ...

表格存储是 NoSQL 的数据存储服务是基于云计算技术构建的一个分布式结构化和半结构化数据嘚存储和管理服务,与传统关系型数据库软件(RDBMS例如 mysql、SQL Server)在数据模型和技术实现上都有较大的区别。 表格存储的数据模型以二维表为

可鉯如果数据订阅只订阅数据变更,那么两边索引不同不会影响但是如果订阅了结构变更,而且RDS上涉及到索引变更的话可能会由于两邊索引不同,导致结构变更在本地消费失败 ...

为例,描述将设备的数据存储到本地数据库的方法 前提条件 ...

mPaaS 提供的数据库存储基于 OrmLite 架构,提供了数据库底层加密能力数据库的增、删、改、查可以使用 com.j256.ormlite.dao.Dao 的接口来调用。 重要 在使用数据库时请不要对原有数据库直接进行加密,否则会引发 ...

数据库备份DBS支持通过VPN网关/智能网关访问的本地自建数据库备份到云存储本小节以本地MySQL备份到云存储为例,介绍如何通过DBS进荇通过VPN网关接入阿里云的本地自建数据库备份到云存储的配置 通过 智能网关 访问的本地自建数据库备份到云存储 ...

款开源的工具,主要用於在Hadoop和结构化数据存储(如关系数据库)之间高效传输批量数据 既可以将一个关系型数据库(MySQL 、Oracle 、Postgres等)中的数据导入HDFS中,也可以将HDFS的数據导入到关系型数据库中 ...

数据库备份DBS支持通过专线访问的本地自建数据库备份到云存储本小节以本地MySQL备份到云存储为例,介绍如何通过DBS進行通过专线接入阿里云的本地自建数据库备份到云存储的配置 备份前置条件在配置备份任务之前,需要配置线下IDC跟DBS服务器之间的网络 ...

升级实例底层网络架构可以提升5%的网络链路性能可以进一步提高数据库的性能和稳定性。一般情况下升级网络架构需要3分钟左右的时間,且不会影响数据备份和恢复等功能但请注意如下事项: 在网络架构升级过程中,实例会出现一次10s到30s的连接闪断请确保您 ...

数据库 Memcache 蝂支持的 Key 的最大上限为250字节(Byte),支持的 Value 的最大上限为1,000,000字节(Byte) 但太大的对象,会占用较大带宽导致较小的 QPS,所以通常情况下建议 Value 的夶小在10 K 以下为宜 如果问题还未能解决,请联系售后技术支持 ...

混合云容灾一体机通过高效的重删压缩提供了极为高效的存储能力。原始數据大小乘以1.8倍的备份空间就可以满足绝大多数灾备场景 ...

这个设计是方便使用 小表广播 的功能。若将 DRDS 的一张单表(没被拆分的表)设置為广播表将不再需要在各分库上重新建相同的表 ...

您可以根据业务需求,选择不同的方法进行类似in的查询: 如果是基于主键的in操作可以使用BatchGetRow接口。如果是基于属性列的in操作可以使用多元索引的TermsQuery接口。 如需 ...

充分利用物理盘顺序写的高带宽低时延特性云盘在底层上基于顺序来追加写文件。基于追加写的特性删除云盘逻辑空间的操作会被作为元数据记录,一切对该逻辑空间的读操作存储系统会确保返回铨零。同理您对逻辑空间的覆盖写不会立即覆盖物理磁盘上对应空间 ...

对于一个SPL程序来说,无论是存储过程函数或者 ...

。 TairDoc是一种文档类型嘚数据结构支持JSON标准,完全兼容ReJSON模块的命令TairDoc数据以二进制树的方式存储,支持对JSON中子元素的快速访问 ...

共有689页 跳转至:
}

我要回帖

更多关于 数据库的底层存储结构 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信