VMware 仮想マシンの消せなくなった数珠つなぎスナップショットの除去と修復

公開 | 更新 

VMware ESXi 上のとあるWindows Server 2012仮想マシンの動作が死ぬほど遅い、助けてくれと担当からあり、設定覗いてみるとそこにはスタックした スナップショット の 数珠つなぎ がありました。

図1.vCSA上で確認されたスナップショット群

図1.vCSA上で確認されたスナップショット群

社内の仮想マシンは、VMware ESXiの黎明期から、自作のクローニングバッチで定期バックアップしており、火の入っている仮想マシンをクローニングする際は、スナップショットを生成、バッチ終わりに消す仕様にしています。

それとは別に、以前、担当者はシステム更新作業前に手動でスナップショットを作ったそうで、その時以来、バッチはスナップショットを消せずにバックアップしてきたことになります。

vCSAのGUI上でスナップショット全部削除しようとすると、

と言うエラーで失敗。調べてみると、潔くスナップショット関連ファイルを隠してしまって良さそう。

早速サブフォルダ作って*.vmsdと*.vmsnを移して、GUI上ではスナップショットいなくなったことになり、仮想ディスクの統合を促されます。そして統合に失敗。GUI上での解決を諦め、ESXiにsshで潜ります

まず、現在の仮想マシンファイル構成を確認します。

このように仮想ディスクは、計25+1ファイルに分断されています。仮想マシンの起動時はこれを最新の25番から順に辿ってブートするのでそりゃ遅いのは当たり前。試しにディスク000001について、vmkfstoolsを使って検証してみます。

この分断セット、実はコピーとか出来なくて怪しんでいたのですが、ほぼ確定。次に最新セットを検証してみます。

エラー無く完走しました。おかしかった000001ディスクについては、シーケンシャルに数珠を遡る際にこのセットは飛ばされているので、仲間外れなのでしょう。そして、おそらくこれがGUIでディスク統合出来なかった原因の1つ。

と判断して、CLIでディスク統合してみます、つまりディスククローン。

入出力を同じストレージにするとむちゃくちゃ時間掛かります(一晩掛かりました)。別のストレージなら2時間強。分断化ディスクを消した後、気持ち悪いので統合ディスク名を変更しておきます。

このディスクを仮想マシンの起動ディスクとして登録してパワーオン。元通りサクサクと起動したので、「スナップショット使ったら消してね」とお願いして担当者へ引き渡しました。

この担当者さん、実はベンダーさん、経験豊富で腕は確かなのですが、CLI特にLinuxというよりはWindows派なので、sshで潜って作業するよりは、GUIかVeeamアプリを駆使する傾向にあります。

参考)

 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA