保护系统安全
|
面上,通过确保系统没有单点故障,可以将容错功能构建到系统中。如果单个组件停止工作,将导致整个系统完全停止工作,这要求提供容错功能。 标准系统中的典型单点故障是电源单元(PSU),其将交流(AC)电源转换为各种电压的直流(DC)电源以为不同组件供电。如果电源单元(PSU)发生故障,那么它所支持的所有组件也将失效,通常会导致整个系统发生灾难性故障。 容错通常遵循以下两种模型之一:
安全容错计划需要多个数据存储库以确保冗余。 建立容错能力 创建容错的关键目的是避免(或至少尽可能地最小化)系统的功能由于其一个或多个组件中的故障而变得不可用的可能性。 在用于保护人员安全的系统(例如空中交通管制硬件和软件系统)以及安全、数据保护和完整性以及高价值交易所依赖的系统中,必须具有容错能力。 冗余性 为了消除单点故障,并提供容错功能,容错系统使用“冗余”概念。实际上,在以上例子中,这将意味着为系统配备一个或多个额外的电源单元(PSU),这些电源单元(PSU)是冗余的,在主要的电源单元(PSU)正常工作时,它们不需要为系统供电。 但是,如果主要电源单元(PSU)发生故障(或者检测到诸如过热的故障,表明它即将发生故障),那么它就可能停止服务,其中冗余的电源单元(PSU)可以启动而不会中断运行整体系统。 在理想情况下,将为系统中的所有组件提供冗余,但实际上成本更加高昂。出于这个原因,设计人员在选择***候选冗余之前,计算组件发生故障的可能性、系统的重要程度以及冗余的成本。 另一种方法是采用在系统发生故障时启动的备用计算机系统。 多样性 在某些情况下,可能无法提供冗余,这方面的一个例子是通常来自电网的主要电力供应。如果市电发生故障(可能是由于发电厂发生故障或在风暴期间电力线路刮断),则通常无法接入替代的公共电网。 在这种情况下,容错可以通过多样性来实现,这意味着完全从另一个电源获得电力供应——很可能是备用发电机,在市电故障时自动启动。 在某些情况下,“多样化”选项(在这种情况下是发电机)可能不具有与主要选项相同的容量,这可能需要适当地降低服务,直到可以恢复主要选项。 复制 实现容错的更复杂方法是通过“复制”。这涉及运行系统或子系统的多个相同版本,并检查它们的功能总是产生相同的结果。如果结果不同,则调用某些过程来确定哪个系统出现了故障。 最常用的是“民主”系统,因此如果三个系统提供相同的结果,而第四个系统提供不同的结果,那么第四个系统被认为是错误的。 另一种方法是重新运行已知正确结果的过程,以检查哪个系统出现不同的结果,表明它有故障。
复制可以在组件级别执行,例如,通过使三个处理器全部同时工作,或者可以在系统级别执行,同时使用一组相同的计算机系统。 (编辑:开发网_开封站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


浙公网安备 33038102330459号