中国站

归档存储,要如何提高存储效率、简化数据管理?

2019-05-08 18:10:14 来源:亿速云

由于数据库越来越大,其管理和使用都是一个较大的问题,归档的目的,就是使数据库尽可能地缩小,从而减少用户读取的响应时间。

归档存储,首先把不经常使用的“业务对象数据”从数据库中提取出来,存储到一个归档文件中,然后把相关对象从数据库删除,从而缩小数据库的大小。同时,这些归档存储的数据,还可以被用户读取和查询。所以,归档存储实际上是将不再经常使用的数据,迁移到一个单独的存储设备来进行长期保存的过程。

归档存储,虽然由旧的数据组成,但它是以后工作必需的重要数据,因此,必须遵从一定的规则来保存数据。数据存档,需要具备索引和搜索功能,这样可以很容易地查找到这些存档的文件和数据。

数据保存的趋势是,保持更长的时间、存储更多的信息和进行更快的检索。自动化数据归档,能够以更低的成本帮助用户实现这些功能。

为了满足用户对于“数据存储”和“数据安全”的需求,亿速云云服务器,不仅挂载了采用“分布式三副本机制”的SSD云盘,还免费支持用户对本地磁盘和SSD云盘,自定义创建“快照”备份,保证了数据99.99%的可靠性。

传统的归档存储,面临的挑战:

1、 磁带、硬盘等存储介质,均易出现磨损;

2、 无法智能识别重复数据,可能会出现多次归档相同的内容;

3、 归档数据不能实现长期保留(数年到数十年),无法提供对固定内容的在线且快速访问。

归档存储解决方案:CAS

内容寻址存储(Content Addressing storage,简称:CAS),是于2002年4月率先提出的,针对固定内容存储需求的先进网络存储技术。

CAS具有面向对象存储特征,基于磁记录技术,按照所存储数据内容的数字指纹寻址,具有良好的“可搜索性、安全性、可靠性和扩展性”。

虽然架构简单,但基于CAS技术开发出的新型存储系统,具有许多独特的优势:

1、无重复数据:由于每个内容或数据分段,都被赋予一个唯一的ID,所以,当有重复内容被存储时,会因为产生同样的ID而被系统识别,从而避免了相同内容的重复存储。这不仅能节省大量存储空间,提高存储效率,而且极大简化了数据管理。

2、确保数据完整性:由于CAS技术存储数据的“唯一性”和“不可更改性”,而且可通过赋予数据保留时间等属性,轻松实现WORM(只写一次,多次读取),使数据的真实性和完整性,得到完全保护。

3、PB级的扩展性:CAS系统,通常采用独立节点冗余(RAIN)架构,使得多个标准化的服务器作为节点组成网络,通过CAS平台软件进行全局管理。由于没有传统存储中复杂的SAN(存储区域网络)或文件系统管理,也无“LUN/RAID组”划分或分配,所以,CAS的架构,不仅具有“自我管理和配置、自我康复”的智能,而且便于按需无缝扩展至PB级别。

4、内容分类与查找:一些CAS系统,可以让用户定义内容对象的元数据,对数据进行分类,并通过集成“第三方的搜索软件”对海量数据(上千万,甚至几亿个文件)进行搜索、查找,充分挖掘固定内容的价值。

5、有效降低成本:CAS系统,通常用作“近线归档存储”,普遍采用SATA磁盘和标准化硬件来降低成本。无重复内容的特性,节省了大量存储空间,而且智能化的自动管理,使得维护人员能较为轻松地应对上百TB的数据,进一步降低CAS系统的总拥有成本。

CAS技术,利用模块化的硬件架构,有效地管理存储资源,对用户和应用保持透明,所以CAS存储系统,能全面满足固定内容的“可获取性、真实性、长期性和可管理性”的苛刻要求。