Deduplication nhnent

1. Data deduplication • Deduplication – Detect and eliminate duplicated data • Deduplication overhead – Disk fragmentation(read latency ), data comparison cost(write latency ) • Mitigate deduplication overhead – Decentralize dedup process – Use cache for fingerprint(hash) of data – Use large Dedup unit size • File, sequence of data blocks, and larger block size than 4KB • (but, dedup rate )