热线电话:+86-020-39199006
Language : 中文版
致力于高品质电源产品的推广与技术服务!

新闻中心

如何定义数据中心可用性

* 来源: * 作者: * 发表时间: 2019-07-09 15:10:45 * 浏览: 1
数据中心是一种安全基础设施,可为IT设备提供稳定的电力和适当的环境运行条件。通常,数据中心运营将面临许多不利因素,因此有充分的理由确保IT设备的电力可用性。在此讨论如何定义数据中心的“可用性”。数据中心是一种安全基础设施,可为IT设备提供稳定的电力和适当的环境运行条件。通常,数据中心运营将面临许多不利因素,因此有充分的理由确保IT设备的电力可用性。在此讨论如何定义数据中心的“可用性”。在数据中心领域,许多人经常将“可用性”和“可靠性”视为同一事物。此外,对于某些人来说,“冗余”一词似乎也意味着可用性的含义。可靠性不可用可靠性是系统或组件在指定条件下在指定时间内执行其所需功能的能力。组件的可靠性基于称为平均故障间隔时间(MTBF)的统计概率的预测,通常以小时(例如,100,000小时)表示。组件,设备或子系统的MTBF通常取决于数据中心设施的制造商。系统的可用性通常表示为时间的百分比。对于数据中心,它被称为“正常运行时间”,并通过“9”的数量来量化。应该注意的是,通常的五个9(即99.999%)是贝尔最初设定的系统可用性参考标准。然而,这5个声音令人印象深刻,但如果它们基于每年8,760小时,则5个仍然意味着每年的停机时间为5.3分钟。即使是9中的6个相当于每年32秒的停机时间。在当今的24/7 IT环境中,这对组织来说显然是不可接受的,因为IT电源只能容忍小于20毫秒的中断。而且,这并不一定意味着一年只有一次停电。这可能会面临多次断电,即使一次只有几秒钟,但一年的累积中断时间平均为32秒。显然,这将面临灾难性的结果,但就数理统计而言,这仍然是准确的。并且满足6的要求.9。在可用性陈述方面,重要的差异是预测和历史价值。在新数据中心或其计划设计的情况下,它只能是参考,可以基于其冗余设备级别和其容错控制系统的复杂性。相比之下,可用性的历史数据仅代表过去的运营经验。但是,历史数据并不代表未来的表现。具有“N + 1”冗余设计的数据中心设施可能不会中断五年,而具有“2N + 1”冗余设计的数据中心关键负载可能在运行的第一年中经历功率。中断。冗余表示部署额外设备,如果主设备或主设备不可用,则可通过故障或维护期间提供所需的电力或冷却(定义为“N”)设备。但是,这个简单的陈述并不能确保负载可以传输到辅助设备或附加设备,以便无缝或即时运行。举一个简单的例子,在电源中断期间,备用发电机通电并能够为负载供电,通常为10到30秒。显然,这对IT设备没有影响,并且需要使用具有足够能量储备的UPS来提供不间断的电力。对于冷却系统,可接受的时间取决于冷却系统的类型。对于低功率密度设备,它可以持续5到30分钟。对于功率密度非常高的IT设备,它只能坚持15到60秒。灵活的冗余设备,用于控制电源和冷却设备,以支持IT负载。冗余设备本身不会排除瞬态或瞬时中断。人们使用容错设计和冗余设备(N + 1,N + 2等)和关键电源路径(N,2N等)的组合,以便在可接受的范围内提供电源和冷却(和网络连接)服务大体时间。 IT设备在不中断电源的情况下运行。虽然具有高度可靠的设备可以减少系统故障的可能性,但确实如此不确保更高的可用性。 “可用性”的真正基础是冗余设备,容错设计以及电源和冷却系统的控制和传输时间的重要性。实际上,人们不应该将数据中心的可用性固定在设备的预期可靠性上。公司需要采取更全面的方法。 Green Grid正在开发其数据中心可用性开放标准(OSDA)的第一个版本。虽然不打算直接与UptimeInstituteTier4系统竞争,但OSDA概念适用于电源和冷却系统冗余级别的经典视图,但它还结合了多站点数据复制,以增加整体解决方案中的逻辑应用程序。程序的可用性,而不仅仅是数据中心基础架构的当前状态。 OSDA系统也更灵活,因为它们允许不同级别的电源和冷却来实现冗余,而不是灵活的框架,它们确实认识到某些组织(或应用程序)可能需要更高的电气冗余,例如2“N + 1 “冗余,只需要”N + 1“冗余。完全开发之后,OSDA平台和工具集可用于评估多站点数据复制如何提供相同或更高级别的应用程序可用性(这就是数据中心首先构建的原因),缩放1-10,即使在使用中低冗余数据中心基础设施也是如此。许多企业管理层认为云计算是一种“完美”的解决方案,因为它将消除与数据中心和IT硬件相关的所有资本和运营成本以及人员成本。虽然盲目地假设它始终可用,但实际上,云计算服务提供商的基础服务更加模糊或完全不透明。尽管如此,即使在今天,许多组织和商业组织也无法真正决定评估云计算服务可用性的有效方法。计算架构已变得非常活跃和不断发展,很明显,大多数组织已经放弃了构建或运营自己的数据中心设施。许多组织使用托管提供商提供的托管服务,这些托管提供商可以使用基于冗余方法的传统数据中心基础架构方因此,托管数据中心和云计算的混合方法已成为许多组织目前最喜欢的策略。许多人对“数据中心可用性”行业标准(由UptimeInstitute创始人KenBrill创建的四级Tier分类系统)的长期实施有不同的看法。虽然它仍然是一个有价值的(也是最基本的)概念和索引,但它只是评估数据中心设施基础设施的可用性,而无需评估IT硬件,软件和数据本身的可用性。在虚拟化和数据复制时代,其基于数据中心的“可用性评级”仅关注数据中心设施电源和冷却基础设施的冗余水平,虽然它很重要,但它不应该是评估计算系统和存储。数据可用性的唯一因素。因此,软件和应用程序需求的功能灵活性应该是规划和构建整体计算策略中更重要的因素之一。例如,开放计算项目组织提出了完全重新思考IT硬件的物理,电气和逻辑方面的需求,以及电气设备,机械基础设施和建筑本身的设计。这也是开放计算项目成员(如Facebook,谷歌和微软)运营的一个考虑因素。在许多情况下,它们的设备冗余级别相对较低(例如,某些系统为“N”或N + 1),但由于其软件故障转移冗余和多站点数据复制,它们的总体可用性很高。虽然其中一些要求与传统企业组织有根本的不同,但如果合适,应考虑并采用这些设计,设备和软件策略的某些方面。最后但同样重要的是,比特币现在被认为是世界未来货币的基础。大多数最新和最大的比特币数据中心运营模式似乎与传统数据中心设施相反。事实上,男人其数据中心设备没有配备UPS,备用发电机,很少或没有冷却设备。它们的唯一目的是最大限度地降低比特币采矿的成本,并在电力中断而没有损坏时停止它,并在电力恢复后立即开始采矿。因此,即使仅九个电力设施中的两个电力设施的可用性比具有额外初始成本和运营成本的大量数据中心设施更具成本效益。尽管如此,越来越大的托管数据中心设施,云服务数据中心和混合解决方案将在未来几年内占据主导地位,组织需要评估每个整体解决方案的长期成本和风险。在这个不断发展的计算环境中,构成“可用性”的内容是基于其目的的最佳选择,而不是依赖于依赖严格标准的传统Tier4级数据中心设施。