时代变了
十年前,对于数据中央和它们支撑的报表与应用,很少需要建立灾害恢复计划。在当时,绝大多数的数据中央每月从半打左右的源系统被批量装载。大多数负载相称小,甚至最大的数据中央小于几百GB的规模。绝不希奇,大多数数据中央团队没有灾害恢复计划,更不用说备份策略。共同的想法主意是,假如数据中央崩溃,可以简朴地从源系统刷新整个数据中央,一切将恢复在线。
今天,大多数数据中央已成为枢纽任务系统。现在,很多数据中央实时捕获和更新事务,并支持数十个运行业务的应用。现在业务用户越来越依靠数据中央信息来做出日常的业务决议计划,以至于他们叮嘱数据中央治理员不要让系统发生甚至几个小时的脱机。此外,作为决议计划引擎,当灾害袭来时,数据中央可以匡助企业以最佳的方式做出响应。数据中央报表可以匡助治理职员计算出如何划分流动的优先级、分配资源和重新分配人手以应付紧急情况。十年前,数据中央可能是灾害发生后最后一个恢复的系统;今天,它应该是在紧急情况下第一个恢复在线的系统。
如何保护?
研究显示,大多数组织对于他们的IT系统的弹性都显得很有决心信念。大多数组织都有灾害恢复计划以保障业务系统在短期和长期不至于间断。也许灾害恢复计划甚至包括数据中央、它运行的服务器、它支持的报表和应用。因为现在很多数据中央都运行在由IT策略治理的公司内部数据中央,IT策略包括业务连续性和灾害恢复计划,在某种程度上,这是一个不错的选择,你的组织已经为它的数据中央资产加了保险。
不幸的是,大多数灾害恢复计划在保护组织免于本钱上的损失方面,还做的远远不够。灾害恢复计划是保险措施,大多数公司只保证他们能够负担得起,而不考虑他们需要什么。
你的组织对于它的运转至关重要的业务流程和应用已经划分优先级了吗?假如数据中央是最高优先级,那么填充数据中央的提取、转换和负载(ETL)引擎以及天生和分发枢纽报表的BI服务器呢?一个链条的强度取决于其最薄弱的环节,数据中央是由多个系统、应用和相互依靠的内部和外部系统组成的一个复杂的环境。只有数据中央的每个组件恢复在线,整个数据中央环境才能完全恢复。
为数据中央的灾害恢复计划做最后一次测试的时间是什么时候?假如你进行数据库失效恢复的实践,你仅仅完成了测试的一部门。你需要恢复客户端、服务器、网络、存储、应用程序和数据库以完整地模拟一次恢复场景。假如你一年前进行了测试,那么它是一个很好的机会,由于你的计划已经由期了。因为数据中央是一个适应系统,它需要不断地变化以回答业务职员问的新题目。因此,自从你上次测试以来,查询、报表、元数据、ETL工作流程和聚合等等可能已经发生了变化。此外,在紧急情况下,业务职员问的题目可能和正常情况下问的题目不同。
弹性的枢纽不只是灵活性、冗余系统,它也包括人。灾害发生期间,有良多混乱和困惑。很多枢纽的职员可能不在场,或者无法工作或访问系统。因此,不仅在你的系统中需要冗余,而且在你的职员铺排上也需要冗余。应该培训你的团队,在各种紧急情况下如何应对,并随时预备根据需要扮演多种角色。
做好预备
灾害恢复正视高质量的、最新的、终端到终真个元数据,以及很少有组织已经成功地实施的内容。元数据对于执行影响评估是至关重要的——当在源系统中的某些部门发生变化时,你需要知道它将如何影响系统中的其他每个组件以及终极用户报表中的指标。在紧急情况下,假如没有对动态的、全面的元数据治理系统的访问,为知足恢复时间目标(即恢复业务功能的时间)、枢纽数据点(必需恢复到某个数据的时间点)和恢复点目标(恢复数据的时间),数据中央团队的能力可能被严峻拖累。
当然,数据是数据中央环境的核心和灵魂,为保证数据免遭停电、网络间断、洪水、风暴或其他劫难,组织必需制定良好的策略。大多数组织在低本钱磁带上执行备份,这些磁带在场外被运输和存储。从磁带恢复数据中央固然需要很长的时间,但因为大部门是历史数据,在紧急情况下没有较高的价值。为了保护更多最新的信息,跟着数据在ETL流程中的移动,组织应当复制或快照数据,并存储数据到位于灾害恢复系统中的磁盘上,在适当时间以后,通常在几天或几周,灾害恢复系统可以归档或者删除这些数据。大多数数据中央团队理解治理数据中央信息的生命周期的需要。
不幸的是,这些团队往往不会猜测双层的灾害。理想的情况下,在线备份系统应进行场外维护,以便数据中央题目不会同时破坏主备系统。(显然这是更昂贵的,并且需要高速网络连接。)假如场外系统泛起故障,他们没有备份的备份。大多数团队也不会预想灾害会持续数天。在卡特里娜(飓风)之后,假设很多业务系统仍是不能完好地工作,我们需要延长到我们期望灾害持续的时间长度。最后,很多场外备份系统没有保护公司免于病毒在内部的传播。场外系统应该有一个内部网关,可以延迟实时传播几个小时以防止软件攻击。
悲观绝望的声音并不好笑,没有人愿意花钱以避免一些可能永远不会发生的事情。但在我看来,我们正在目睹一个由环境退化和政治分化导致的危机、灾害和地舆政治紧张局势的数目拐点。除了过去的灾害,北京网站建设公司没有什么能够促使我们重新复习我们的灾害恢复计划。测试计划的有效性比等候真实灾害要好。
(发布时间:2013-02-20 14:34)