Webinar
ITGLOBAL.COM events
Opslag (gegevensopslagsysteem)
Glossary

Een data storage system (DSS) is een complex van hardware en software dat is ontworpen om informatie op te slaan en te verwerken, meestal van een groot volume. Informatie is bestanden, inclusief media, gestructureerde (DBMS) en ongestructureerde gegevens (big data), back-ups, Archieven. Harde schijven worden gebruikt als opslagmedia, voornamelijk SSD ‘ s (All Flash Array systems), evenals hybride oplossingen die SSD-en HDD-schijven in één opslag combineren.

Opslagsystemen verschillen van een harde schijf van een gebruiker in hun complexe architectuur, de mogelijkheid om opslag te combineren in een datatransmissienetwerk, de beschikbaarheid van afzonderlijke software voor het beheer van het opslagsysteem, geavanceerde back-up -, compressie-en virtualisatietechnologieën.

Gegevensopslagsystemen verschillen in verschillende parameters, waarvan de keuze het gebruik van opslag bepaalt.

selecteer opslag

Opslagniveaus

Block storage

De opslag wordt gebruikt als een gewone schijf, die kan worden geformatteerd, erop kan worden geïnstalleerd door het besturingssysteem en logische schijven kan maken. Gegevens worden niet opgeslagen in bestanden, maar in blokken, wat de I/O-operaties versnelt. Het wordt vaker gebruikt in SAN-Netwerken (Storage Attached Network). Het is geschikt voor high-performance computing, DBMS, opslag van grote hoeveelheden gegevens, als ontwikkelomgevingen (Dev/Test). Van de nadelen: a) de complexiteit van de installatie en het onderhoud, die passende kwalificaties vereisen; b) hoge kosten.

bestandsopslag

De gegevens worden opgeslagen als bestanden die in mappen worden geplaatst. Deze opslag wordt gebruikt om “koude” informatie op te slaan die niet nodig is voor operationele berekeningen. NAS (Network Attached Storage) zijn meestal gebouwd op bestandsopslag. Nadelen: met de accumulatie van grote hoeveelheden gegevens wordt de maphiërarchie ingewikkelder en neemt de snelheid van opslag geleidelijk af. Het is niet geschikt voor belastingen die een hoge respons vereisen.

Object Storage

Een soort opslag die is gericht op het werken met grote ongestructureerde gegevens tot petabytes groot. Informatie wordt niet als bestanden opgeslagen, maar als” objecten ” met een unieke identificatiecode en metagegevens. Daarom is de objectopslag vergelijkbaar in structuur met een database. Het wordt gebruikt in analytics, big data, machine learning, voor het opslaan van “zware” mediabestanden en back-ups, het ontwikkelen en bedienen van applicaties in de cloud en het hosten van websites. In termen van snelheid is het inferieur aan blokopslag in taken die verband houden met transactionele belastingen.

Netwerktoegang

NAS (network-attached storage)

Een bestandsserver die is verbonden met het lokale netwerk. De toegang tot schijfopslag is georganiseerd via NFS-protocollen (op UNIX/Linux-systemen) of CIFS (Windows). De NAS wordt gebruikt om te werken met bestandstype gegevens die collectieve gelijktijdige toegang nodig hebben, bijvoorbeeld tot gedeelde Word—en Excel – documenten. De NAS werkt “bovenop” een bestaand LAN, via gedeelde switches/routers.

SAN (storage area network)

Een netwerk dat geschikt is voor het gebruik van verschillende soorten opslag (schijven, optische schijven, tape arrays), maar die door het besturingssysteem worden waargenomen als een enkele logische gegevensopslag of als een logische netwerkschijf. Protocollen: iSCSI (IP-SAN) en FibreChannel (FC). HBA (Host Bus Adapter) adapters worden gebruikt om computers aan te sluiten. De SAN gebruikt voornamelijk een bloktype van gegevensopslag.

De SAN / NAS-scheiding is niet langer zo strikt als in het begin van de jaren 2000, aangezien fabrikanten met de komst van het iSCSI-protocol hybride oplossingen begonnen te produceren.

Fouttolerantie

Om het vermogen van een opslagsysteem om te herstellen van storingen te beoordelen, worden twee indicatoren gebruikt — RPO en RTO.

RPO (recovery point objective)

De periode waarin gegevens verloren gaan, ligt tussen het moment van het ongeval en het moment waarop de laatste back-up is gemaakt. Als de RPO gelijk is aan 12 uur, kunnen gegevens die in de afgelopen 12 uur zijn verzameld, verloren gaan als de opslag mislukt. RPO heeft invloed op de keuze van de disaster recovery-technologie en is afhankelijk van de kosten van het verliezen van een bepaalde hoeveelheid gegevens.

RTO (recovery time objective)

De tijd die nodig is om de toegang tot de opslag te herstellen. De RTO-waarde is belangrijk voor het schatten van de kosten van stilstand van het systeem.

Back

De frequentie van backups wordt geselecteerd op basis van specifieke taken en het vereiste beschermingsniveau. Hetzelfde geldt voor plaatsing: werkgegevens en hun back-up kunnen worden opgeslagen in geografisch verspreide opslag (bijvoorbeeld in datacenters in verschillende landen en zelfs continenten).

Naast back-ups worden snapshots gemaakt — snapshots die worden gebruikt om terug te gaan naar de nieuwste werkende versie van het systeem.

Ontdubbeling wordt gebruikt om back-ups minder ruimte in beslag te nemen. In dit geval worden alleen de gegevens die zijn gewijzigd naar de kopie gekopieerd. Het verschil tussen back-ups is gemiddeld niet meer dan 2%, dus deduplicatie helpt om schijfruimte te besparen.

Hoe een opslagsysteem te kiezen

Allereerst moet je begrijpen welke taken het zal oplossen. Voordat u contact opneemt met de leverancier (of integrator), moet u verschillende basisparameters bepalen.

Gegevenstype

Verschillende soorten gegevens vereisen verschillende toegangssnelheden, verwerkingstechnologieën, compressie, enzovoort. Een opslagsysteem voor het werken met grote mediabestanden verschilt bijvoorbeeld van een systeem dat geschikt is voor het werken met een transactioneel DBMS, of van een systeem dat werkt met ongestructureerde gegevens voor een neuraal netwerk.

De hoeveelheid data

De keuze van disk drives hangt hiervan af. Soms kunt u doen met een SSD van consumentenkwaliteit—als u weet dat de opslagcapaciteit, zelfs in het ergste geval, niet hoger is dan 300 GB en de toegangssnelheid niet kritisch is.

Fouttolerantie

Het is noodzakelijk om je voor te stellen wat de kosten van gegevensverlies over een bepaalde periode zijn. Dit helpt u bij het berekenen van de RPO en RTO, en voorkomt onnodige back-upkosten.

Efficiëntie

Als de opslag wordt gekocht voor een nieuw project (dienst), waarvan de belasting moeilijk te beoordelen is, is het beter om te communiceren met collega ‘ s die dit probleem al hebben opgelost. Of neem contact op met een ervaren leverancier die al soortgelijke projecten heeft gelanceerd. De ideale optie is om de opslag te testen.

Leverancier

Soms is zelfs een low-cost of medium-level oplossing (StarWind, Huawei, Fujitsu) geschikt voor een resource-intensieve service. Echter, de top fabrikanten — NetApp, HPE, Dell EMC — hebben een vrij brede productlijn en relatief goedkope opslagsystemen zijn hier ook te vinden. In ieder geval is het raadzaam om het aantal leveranciers op dezelfde infrastructuur niet sterk uit te breiden.

 

 

 

Wij gebruiken cookies om de functionaliteit van de website te optimaliseren en onze diensten te verbeteren. Lees voor meer informatie ons Privacybeleid.
Instellingen cookies
Strikt noodzakelijke cookies
Analytics-cookies