Kunt u deduppen?

Deduplicatie of afgekort dedup. Klinkt duur dan wel iets technisch, maar in feite is het niets meer het elimineren van dubbele data op een opslagsysteem. Dat maakt het proces an sich niet minder belangrijk, want dubbele data neemt vanzelfsprekend de dubbele opslagruimte in beslag. En je maakt dan weer een back-up van dubbele data. Allemaal onnodig en zelfs kostbaar.

Praktijk

Een praktijkvoorbeeld. Stel, je hebt een bedrijf of organisatie met 500 mensen met een e-mailaccount op Outlook. Dit bedrijf stuurt elke maand een nieuwsbrief naar de personeelsleden. Vijfhonderd keer deze nieuwsbrief naar vijfhonderd e-mailboxen. Deze nieuwsbrief wordt elke maand vijfhonderd keer opgeslagen en geback-upt. Dit kan anders. Door te ‘deduppen’ wordt de nieuwsbrief nog maar één keer opgeslagen en in alle mailboxen staat een verwijzing naar dit bestand. Op zich is dit geen abracadabra.

Verwijzen!

Een Silent Brick en een aantal andere opslagsystemen werken met een Object Orientated Storage: in de database staat een verwijzing naar de plaats van het bestand. Maar als je dit bestand onder een andere naam opslaat, of in een andere mailbox, dan krijg je in de database een tweede verwijzing naar het reeds opgeslagen bestand, een tweede entry. Daarmee heb je al een vrij eenvoudige dedup-mogelijkheid. Onder andere Silent Bricks doen dit automatisch.

Meer geavanceerd, meer risico

Nu zijn er ook opslagsystemen die beweren dat ze een meer geavanceerde dedup hebben. Deze systemen kijken niet naar het hele bestand, maar naar stukjes in het bestand. Door weer afzonderlijk entry’s te maken naar deze stukjes data, kun je nog meer deduppen en meer ruimte besparen. Als je bij de minder geavanceerde manier één verwijzing kwijt bent, verlies je alleen het ene bestand waar deze entry naar verwijst. Met de meer geavanceerde manier bespaar je inderdaad meer ruimte, maar loop je een veel groter risico. Als je één verwijzing kwijtraakt, raak je daarmee direct alle bestanden kwijt die het kleine stukje bevatten, waar deze entry naar verwijst. Daar komt nog bij dat deze manier van werken meer rekenwerk en dus tijd vraagt. Het voordeel is: je bespaart (veel) meer ruimte, maar daar staat dus tegenover dat het risico op verlies van bestanden veel groter is en dat het systeem trager werkt.

Afwegen

De truc is om een goede afweging te maken tussen de ruimte die je door deduppen wilt besparen en het risico dat je daarmee wilt lopen. Linksom of rechtsom is deduppen een besparende maatregel. Meer weten? Informeer eens naar de mogelijkheden!

Schrijf in voor tips en info

Wij schrijven regelmatig blogs over actuele onderwerpen uit de wereld van digitale opslagtechnologie. Meld je hier aan om over nieuwe blogs geïnformeerd te worden.