• 提示:您的电脑还没有安装阿里旺旺。免费安装阿里旺旺,与百万商人在线谈生意!
  • 关闭
您现在的位置:阿里巴巴博客 > 张教授X的博客 > 文章
我的文章
谈论重复数据删除(Data deduplication)技术 (2008/10/15 14:12)
大多数备份、存储商的最新产品都包含了重复数据删除。所以,你应该考虑考虑产品更新,以便能利用这些功能,尤其是删除结构混乱的数据卷。数据越小,执行灾难恢复时所需恢复时间就越短。

存储分级

  存储分级(storage tiering)也可以缓解数据增长。旧的数据被放到第二级存储(secondary storage tier)。有些产品能分离第二级存储,帮助实现RTO。这个过程涉及到数据分类,这意味着一级存储(primary storage tier)中的信息是最重要的,也是RTO需要的信息。二级存储的信息不如一级存储的信息重要,可以晚些再对其进行恢复。旧数据不是日常业务所需的必要信息,但也是必须要的信息,可以推迟一点再恢复。让我们看一个例子。一个结构混乱的数据卷通常只有20%的数据是经常要使用的,80%的数据是6个月甚至更长时间之前被访问过的。利用存储分级可以使主要raid数据恢复速度提高5倍,轻松实现业务RTO。然而,不要忘了还有二级存储数据,它最终还是需要恢复的,只是可以晚一些而已。

  很遗憾的是,允许分别恢复一级和二级数据的数据存储分级解决方案的数量很有限。因此,一定要与分级存储商核实好,确保一级数据可以在没有二级数据的情况下单独恢复。在不久的将来,会有更多的存储分级解决方案出现。

数据管理策略

  公司的对讲机数据管理策略(Data management policies)也可以帮助实现RTO。在理念上,数据管理策略与存储分级比较相似,它包括公司旧数据的删除策略——有些旧数据存储到磁带、DVD等媒介后,可以从数据库删除。这样的策略通过移除旧数据以控制有效数据卷(Active Data Volume)的大小。超过一定时长的旧数据和数据库记录会被自动删除。依据数据类型和重要性,策略在处理数据时需要坚决果断。尽管很多财务记录是必须永久保留的,但大多数记录是不需保留在活性存储器(Active Storage)上超过3年的。一个数据文档就足够了。通常,终端用户办公生产数据在活性存储器的保留时间不需超过18个月。这些策略很大程度上取决于业务范围和其它制度要求,因此这些方法可能不会在所有情况下都适用。

  数据管理策略的缺点是它需要一定的管理和审计。删除已存档的数据可能导致一些制度问题。如果是合法的保留,联邦民事诉讼规则保安公司(Federal Rules of Civil Procedure)会拒绝删除。另外,搜索引擎技术可能使所有的数据看起来都是最近被访问过的。搜索引擎必须打开并读取整个文件,创建索引。所以,一定要确保你的搜索技术会记录下已建立索引的文件。否则,自动删除系统将永远也找不到最近没被访问过的文件。

  如果数据增长速率太快,以至于这些措施只能赢得少量时间,你将需要执行其它可选技术,以确保满足RTO。

文章来源:http://www.raid.net.cn/



张教授X的相关文章 >>更多
张教授X的相关标签
文章评论以下评论只代表个人观点,不代表阿里巴巴网商博客的观点或立场
暂时无网友评论
欢迎您加入阿里巴巴商人博客!在这里您将会结交更多商友,分享更多经验!得到更多推荐与展示的机会!博客宝贝先教您几招——《扩大知名度,巧用博客三板斧!》详情查看:http://blog.china.alibaba.com/html/static1/subject/first.html
发表评论请严格遵守相关法律,严禁恶意评论和垃圾评论

登录名:    密 码:    没有帐号?马上注册
内 容:
验证码:
无显示 无显示
博主信息
山不在高,有仙则名。水不在深,有龙则灵。斯是陋室,唯吾德馨。
加为好友
打个招呼
定制此作者文章
我的商铺
  • 访问量:2358
  • 文章数:62
  • 评论数:41
RSS订阅
订阅博主的博客: 不知道如何订阅?
个人资料
最新博文
最新评论
最近访客
我的文章分类
日历
<<    2009年07月    >>
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
好友列表
最近更新博客
友情链接
编辑推荐
创建信息
阿里创建号:ALI-002123842
创建日期:
2008-05-12 15:51:15
修改日期:
2008-10-24 14:59:40
版权所有,未经作者许可,不得抄袭或转载,如有需要,可以与本人联系。