CAD日記

主にAutoCADのことについて書いているけど、近頃は投資系ネタに注力している。自動売買、仮想通貨、PC関係、プログラミングなど。@caddiary

コンピュータ全般

Windows Serverのデータ重複除去をやってみた

投稿日:

Windows Serverにはデータ重複除去という機能があって、ディスク容量を大幅に節約できる。
一般的には50%程度の使用量を減らすことができ、用途によってこの数字が変わるが仮想化ライブラリでは90%もの削減効果が得られるとされている。
ファイルをチャンクと呼ばれる可変長のブロック(32~128KB)に分割して、チャンク単位で内容が一致しているかどうかを判定している。よって、ファイル単位での一致による削減効果以上の結果が得られる。

Windows Server 2012から採用された機能で、サーバーマネージャーから容易な操作で有効化できる。
・サーバーの役割追加で、「データ重複除去」を有効とする
・ボリュームから、ドライブを指定して右クリックで「データ重複除去の構成」 ※Cドライブは指定不可

気になるのはパフォーマンス。重複を検知して除去するのはリアルタイムではなくバッチ処理で実行。夜間帯など普段人が使わない時間とすることを想定している。重複除去の対象とするファイルについて、経過日数を指定できて既定値は5日。この数字を小さくすることで、重複除去の効果が大きくなるが、バッチ処理でのオーバーヘッドが大きくなる。通常利用(つまりファイルIOのレスポンス)はどうかということは、最後に検証結果を記す。

実機サーバーでのサイズの変化は以下の通り。
【重複除去実施前(使用領域221GB)】

【重複除去実施後(使用領域103GB】

サーバーマネージャーの表記では、重複除去率53%。

重複除去によるデータ削減効果は、対象ドライブにデータがある場合に限られる。バックアップ用にと、別ドライブや別サーバーにコピーした場合は、データ削減前のファイル容量になる。また、何らかの理由で重複除去機能を無効にする場合は、対象ドライブ内にデータ削減前の容量が必要となることも注意が必要となる。

約500MB(ファイル数133フォルダ数18)のファイル群に対して、アクセスを行った際の時間計測行ったところ、重複除去ドライブと非重複除去ドライブで体感上の違いはわからなかった。
だったらと、、一般的によく使われているストレージ性能評価ツール「CrystalDiskMark」を使って計測した。
【重複除去実施前】

【重複除去実施後】

以下MSサイト記事より、重複除去最適化ジョブによってファイルの更新日時が変わるという懸念があったため、実機で調査。
CSV でデータ重複除去を有効にした後の既知の問題

1.重複除去無効状態から有効状態に変更を実施
2.1が完了した後に、1の実施開始日時以降に変更されたファイルがないことを確認
CSV=クラスタ共有ボリュームで、複数のHyper-V仮想マシンをクラスター化するものであるため、物理サーバーでは関係ないというのが結論。

【データ重複除去の仕組み】
以下の図は、別サイトのわかりやすいものを引用した。

ようするに、ファイルの実体をチャンクストアに移して、ファイルからみると実体であるチャンクストアのポインターを持つということで、チャンクの重複があればあるほど使用するディスクのサイズが減るというものだ。
こんな仕組みということを考えれば、重複除去によってファイルIOが極端に遅くなることはないと言えるし、場合によっては速くすらなることがわかる。

【参考URL】
第4回 ストレージの利用効率を高めるデータ重複除去機能
Windows Server 重複除去を試してみた!(その1)
Windows Server 2012のデータ重複排除機能を試す

-コンピュータ全般

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

関連記事

no image

続々)SSD

続)SSDの続き。 SATAのSSDをUSB2.0接続したら激遅だったが、SATA接続したら よっぽど速くなるだろうということで終わっていた。 結果を先に記そう。 USB2.0に比べれば激速なわけだが …

PCまわりの問題がいくつか解消

先週はPCまわりの問題がいくつか解消したので、その一つ一つについてレポートしてみる。これに取り組んでいた影響で、やらなきゃならなかったことのいくつかができなかったが、まぁクソ上司のファッキンな指示を守 …

ブラウザ使うだけならChromebookで十分じゃね

おいらが企画運営しているZoomで打つ件は、天鳳サイトで麻雀打って、Zoomでビデオ会議して、スプレッドシートで得点管理して、テキストベースのやりとりをLINEでやっている。天鳳・Zoom・Googl …

no image

会社がケチなもんでディスプレイが壊れた際の対応がちょーめんどいって話

会社がケチって言ったって会社という人間がいるわけがないので、ようするに上層部がケチだって話。上司から飲みでおごってもらったことないし、会社で何か買おうとしようもんなら、ちょーめんどうな手続きを経て買え …

no image

facebook

facebookがおもしろくなってきた。 何がおもしろいって、実名で関係を築くことだ。 このブログでは、匿名性を保ってやってきたわけだが、 それとはまた違うおもしろさがある。 会社、大学、高校で友達を …