Jarosław 的个人资料itkeny照片日志列表更多 工具 帮助

日志


    9月2日

    Zapomniany snapshot

    Co to za urlop bez awarii.

    Wczoraj o 7:10 dostałem informację, że padł jeden z serwerów webowych. Jako, że jest to Bardzo Ważny Serwer, przerwałem to co aktualnie mnie pochłaniało (spanie) i usiadłem do komputera.


    Serwer webowy jest maszyną wirtualną hostowaną na Vmware ESX (jak większość mojej infrastruktury).
    Problem ujawnił się zaraz po zalogowaniu do konsoli VI, na dysku macierzy skończyło się miejsce. Ale moment, kilka dni temu było tam 33GB wolnego miejsca. Problemem okazał się “zapomniany” snapshot zrobiony kilka tygodni wcześniej przez soft do backupu. Oprogramowanie, owszem stworzyło snapshot, wykonało backup, ale po sobie nie posprzątało. Snapshot rósł sobie w najlepsze przez kilka tygodni. W międzyczasie na serwerze uruchomiony został proces defragmentacji dysku. Co ta operacja robi z dyskami różnicowymi … teraz to wiem ;)

    Ok, mam przyczynę, ale co z tym zrobić? Zawartość dysku w chwili padu wyglądała następująco:
    dysk systemowy – 70 GB i dysk różnicowy 77 GB, reszta pomijalna, wolnego miejsca na dysku 30MB.
    Z takiej sytuacji są dwa wyjścia – przenieść maszynę wirtualną na większe dyski, albo zmergować dysk różnicowy z podstawowym. Jako, że serwer i tak już nie działał, a klienci bili pianę wybraliśmy opcję drugą. 30MB wolnej przestrzeni nie było problemem. W sytuacji, gdybym miał więcej niż 1 aktywny snapshot, należałoby wygospodarować więcej miejsca. Wyłączyłem serwer wirtualny, wybrałem snapshot i kliknąłem delete. Po 15 minutach ESX wypluł komunikat “Operation timed out”. Dziwne, na dyskach dalej 30MB wolnego miejsca, esx dalej mieli dyskami jakby cały proces mergowania się nie zakończył. I nie zakończył się faktycznie. Można to poznać na 2 sposoby – 1) to śledzenie operacji zapisu i odczytu dysków (zakładka performance w VI) , 2) zalogowanie sie do konsoli esx odnalezienie pliku dysku i śledzenia daty jego modyfikacji. Jako, że maszyna jest wyłączona jedynym procesem jaki zmienia jej znacznik czasu jest operacja mergowania. U mnie, przy 70GB dysku różnicowym cała operacja trwała 2,5h (ESX 3.5). Podszas pracy procesu (szczególnie jak zaniepokoi was komunikat o przekroczonym czasie operacji) odradzam restart ESXa lub klikanie 2x “delete” na snapshocie. Po zakończeniu scalania dysków, snapshota nie widać w przystawce “snapshot manager” a na dysku brak plików dysku różnicowego (dysk1-00000.x), no i 30GB wolnego miejsca. Lekcje na przyszłość: Ustawić sobie alertowanie o kończącym się miejscu na dysku, śledzenie czy któraś z maszyn wirtualnych przypadkiem nie ma aktywnego snapshota.

    I spokojnie wracam na plac budowy – piękna, żółta kopara zabiera mi ziemie z działki – zapytam kierowcy, może da pojeździć a on sobie na fajeczke skoczy.

    Inżynier Mamoń


    评论

    请稍候...
    很抱歉,您输入的评论太长。请缩短您的评论。
    您没有输入任何内容,请重试。
    很抱歉,我们当前无法添加您的评论。请稍后重试。
    若要添加评论,需要您的家长授予您相应权限。请求权限
    您的家长禁用了评论功能。
    很抱歉,我们当前无法删除您的评论。请稍后重试。
    您已超过了一天之内允许提供的评论数上限。请在 24 小时后重试。
    因为我们的系统表明您可能在向其他用户提供垃圾评论,您的帐户已禁用了评论功能。如果您认为我们错误地禁用了您的帐户,请联系 Windows Live 支持部门
    完成下面的安全检查,您提供评论的过程才能完成。
    您在安全检查中键入的字符必须与图片或音频中的字符一致。

    若要添加评论,请使用您的 Windows Live ID 登录(如果您使用过 Hotmail、Messenger 或 Xbox LIVE,您就拥有 Windows Live ID)。登录


    还没有 Windows Live ID 吗?请注册

    引用通告

    此日志的引用通告 URL 是:
    http://itkeny.spaces.live.com/blog/cns!B3FFA6BA47C8C9FF!232.trak
    引用此项的网络日志