Fouttolerantie is de eigenschap van een apparatuur of systeem om operationeel te blijven na het falen van een of meer componenten.
De betrouwbaarheid van een fouttolerant systeem wordt gekenmerkt door het aantal negens. Elke webpagina garandeert bijvoorbeeld in 99% van de gevallen een stabiele werking en de database van een organisatie op Sberbank—niveau garandeert 99,9999%.
Specificatie
Een fouttolerant systeem wordt gekenmerkt door de aanwezigheid van redundante elementen. Conventioneel behoren ze tot de volgende soorten::
1. Het software gedeelte. De aanwezigheid van een identieke toepassing op elke module van het informatiesysteem. Het is verplicht om besturingssoftware te hebben die de status van elke knoop controleert en de belasting omleidt.
Een treffend voorbeeld is het clusteringschema op basis van de Veritas clustermodule. Als een element faalt, wordt het door de toepassing losgekoppeld van het cluster en wordt de belasting opnieuw verdeeld over de rest.
2. Het hardware gedeelte. Vergelijkbaar met de vorige, maar hier treedt redundantie op op het niveau van logische modules of apparatuur. Een gegevensopslagsysteem heeft bijvoorbeeld dubbele elementen: twee controllers, twee voedingen, twee netwerkadapters, enz. Als een van de modules uitvalt, wordt de belasting verdeeld over de tweede.
Redundantie op hardwareniveau impliceert de aanwezigheid van verschillende apparaten met vergelijkbare kenmerken. Een voorbeeld is een server met een hoge dichtheid met daarin geïnstalleerde computerknooppunten.
3. Het rampbestendige deel. Dit type reservering wordt alleen verstrekt voor bedrijfskritische systemen, omdat het gepaard gaat met hoge financiële kosten en de beschikbaarheid van gekwalificeerde specialisten.
Het redundantieschema wordt overgedragen naar de schaal van datacenters. Op twee verschillende locaties worden soortgelijke infrastructuren gebouwd. Er wordt communicatie tussen hen tot stand gebracht en vervolgens wordt gespecialiseerde software gebruikt.
De eerste dergelijke software werd gemaakt door NetApp, bekend om zijn technologische innovaties op het gebied van gegevensopslagsystemen. De leverancier heeft een MetroCluster-product ontwikkeld dat alle datacentercomponenten op een externe locatie volledig reserveert. Zelfs als een van de datacenters volledig wordt afgesloten, herstelt de tweede zich binnen enkele seconden volledig.
Om fouttolerante systemen te bouwen, wordt de huidige infrastructuur van de klant eerst gecontroleerd om kwetsbaarheden te identificeren.
De volgende stap bepaalt de risico ‘ s in geval van verlies van een van de infrastructuurelementen. Er worden verschillende varianten van gebeurtenissen overwogen, waarbij de klant maximale verliezen zal lijden. Op basis van de ontvangen informatie wordt een schema ontwikkeld voor het bouwen van een fouttolerant systeem van noodzakelijke elementen. Hierdoor krijgt de klant een totaaloplossing die de risico ‘ s zoveel mogelijk dekt tegen een aanvaardbare kostprijs.
Fouttolerantie is een belangrijke indicator van elk informatiesysteem. Redundantie kan op verschillende niveaus van het IP optreden, te beginnen met de software en eindigend met het datacenter.