Webinar
ITGLOBAL.COM events
datacompressie
Glossary

Datacompressie betekent de transformatie van informatie die wordt uitgevoerd om het volume ervan te verminderen. Het wordt gebruikt om het rationele gebruik van hardwarebronnen te garanderen die informatie opslaan, verwerken, verzenden en uitvoeren.

gegevenscompressie in NetApp-opslag


meer informatie

Het Datacompressieproces is gebaseerd op de eliminatie van redundantie, die kenmerkend is voor intacte (ongecomprimeerde) gegevens. Het eenvoudigste voorbeeld van informatie-redundantie is te veel herhalingen van hetzelfde woord in de tekst.

Om dit soort redundantie te verwijderen, moet u een vaak voorkomend woord vervangen door een koppeling naar een ander stuk gegevens dat is gecodeerd en een strikt gespecificeerd volume heeft.

Het “gewicht” van gegevens kan worden verminderd door gecodeerde woorden te vervangen door te vaak herhaalde datatypen en lange codes van te zeldzame gegevens (entropiecodering). Als de gegevens geen redundantie hebben (gecodeerde informatie, “witte ruis”, kort signaal, enz.).), dan is het niet mogelijk om ze te comprimeren zonder informatie te verliezen.

Verliesloze datacompressie is een proces dat het mogelijk maakt, indien nodig, om de oorspronkelijke informatie volledig te herstellen, omdat het volume van opgeslagen informatie niet afneemt, ondanks de afname van de ruimte die het inneemt.

De bovenstaande mogelijkheid kan verschijnen als de waarschijnlijkheid ongelijk verdeeld is over de berichten. Bijvoorbeeld, wanneer sommige van de berichten die in theorie mogelijk zijn niet voorkomen in de vroege codering van deze berichten.

Datacompressie-algoritmen voor onbekende gegevenstypen

Er zijn 2 hoofdmethoden voor gegevenscompressie die een onbekend formaat hebben:

  1. Elk opeenvolgend gecomprimeerd teken wordt in zijn oorspronkelijke vorm in de uitgangsbuffer geplaatst of een groep van meerdere gecomprimeerde tekens wordt vervangen door een verwijzing naar een soortgelijke groep gecodeerde tekens. Deze methode wordt meestal gebruikt bij het maken van zelf extraherende software.
  2. Voor elke reeks tekens die worden gecomprimeerd, worden statistieken (frequentie van het voorkomen van gegevens in de code) eenmaal of continu verzameld. Op basis van deze statistieken wordt de waarschijnlijkheid van de waarde van het volgende gecodeerde teken (of hun volgorde) bepaald. Dan wordt een van de soorten entropie codering gebruikt om vaak voorkomende datatypen te vervangen door korte codewoorden en zeldzame door langere.
Wij gebruiken cookies om de functionaliteit van de website te optimaliseren en onze diensten te verbeteren. Lees voor meer informatie ons Privacybeleid.
Instellingen cookies
Strikt noodzakelijke cookies
Analytics-cookies