Backup dyskowy a ryzyko utraty wydajności
7 maja 2007
Krzysztof Jakubik Systemy backupu bazującego na dyskach, które wspierają kompresję i deduplikację danych, mogą być atrakcyjną alternatywą dla backupu taśmowego. Ale decydując się na system zbudowany w tej architekturze narażamy się na utratę kontroli nad wydajnością i możliwością skalowania.Równie ważna, jak wydajność backupu, jest wydajność odzyskiwania danych. Przy dążeniu do maksymalnego skrócenia okna backupowego warto pamiętać, aby nie czynić tego kosztem znacznego wydłużenia odzyskania danych w przypadku awarii. Algorytmy umożliwiające redukcję ilości zapisanych danych pracują w różny sposób. Niektóre dzielą dane na bardzo małe porcje, aby kontrolować pojawianie się duplikatów. Ale w takim przypadku odzyskanie kompletu z milionów takich porcji może okazać się dość czasochłonne.
Ale w innym podejściu przechowywany jest ostatni pełen backup, a względem niego zapisywana jest historia zmian, przy wykorzystaniu deduplikacji na poziomie bajtów. Dzięki temu podejściu zamiast pełnych kopii są przechowywane tylko zmiany, co pozwala na szybkie odzyskanie pełnego backupu, a następnie uzupełnienie go ostatnimi zmianami.
Z punktu widzenia skalowalności warto też zasymulować sobie, jak tworzony przez nas system zareaguje na 30-procentowy roczny wzrost ilości backupowanych danych.
Jeśli do backupu wykorzystujemy tradycyjną macierz dyskową opartą na dyskach SATA, prawda może być dość bolesna - będziemy cały czas musieli dokupować kolejne dyski, a finalnie kolejne macierze. Co więcej, wraz ze wzrostem ilości danych, będziemy musieli kupić odpowiednio dużo przestrzeni dyskowej także z odpowiednim zapasem, wynikającym ze stosowanej przez nas technologii zabezpieczeń RAID. Coraz większym wyzwaniem będzie też zarządzanie wciąż powiększającą się przestrzenią dyskową - jej konfiguracja, zarządzanie obłożeniem i obserwacja stopnia wykorzystania zasobów.
Znaczne oszczędności miejsca i pomoc w kwestiach skalowalności mogą przynieść technologie redukcji ilości zapisywanych danych, jak kompresja czy deduplikacja. Analizując możliwość ich wykorzystania, warto odpowiedzieć sobie na parę pytań:
- Systemy redukcji ilości danych potrzebują mocy obliczeniowej (procesora i pamięci), zatem w jaki sposób możemy zagwarantować, że system wciąż będzie pracował z pełną wydajnością, po dołożeniu kolejnej przestrzeni dyskowej?
- Czy pojemność macierzy może być zwiększana w pojemnościach, które odpowiadają naszym potrzebom?
- W jaki sposób są instalowane i konfigurowane dodatkowe pojemności?
- Czy wraz ze wzrostem pojemności wciąż możemy korzystać z pełnej funkcjonalności redukcji danych?
Jeśli wykorzystywany dotychczas przez nas system pamięci masowych nie ma możliwości rozbudowy, a przestrzeń dyskowa jest prawie pełna, warto zastanowić się na kupnem nowej, bardziej funkcjonalnej macierzy, starą zaś przeznaczyć do obsługi mniejszej ilości serwerów.
Aby uniknąć problemów ze skalowalnością, warto rozejrzeć się za systemem, gdzie nowa przestrzeń dyskowa jest dodawana do wirtualnej puli i w ten sposób udostępniana serwerom. System powinien umożliwić automatyczne rozproszenie danych wśród nowych dysków, bez konieczności wprowadzania zmian do konfiguracji zadań backupowych, a także automatycznie zarządzać nośnikami backupowymi.
Podsumowując, systemy backupu dyskowego nie tylko powinny działać efektywnie podczas backupu i odzyskiwania danych, ale także bez problemu rosnąć wraz ze wzrostem ilości danych. Nie ma sensu zamieniać problemów związanych z backupem taśmowym na problemy związane z zarządzaniem wydajnością i pojemnością.
Komentarze
- Liczba zatwierdzonych komentarzy (1) |
- dodaj komentarz |
- zobacz wszystkie
mirek
- ocena: brak oceny
- IP: 83.23.203.128
- 09-05-2007, 12:05
Kolejny
04-204 Warszawa ul. Jordanowska 12
tel.: (+48 22) 321 78 00 fax: (+48 22) 321 78 88
© copyright 2012 IDG Poland SA
tel.: (+48 22) 321 78 00 fax: (+48 22) 321 78 88
© copyright 2012 IDG Poland SA









wydrukuj