Pojęcie midrange w kontekście systemów pamięci masowej często podsuwa ich użytkownikom obawy związane z kompromisami dotyczącymi pojemności, wydajności oraz funkcjonalności, a także z kosztami utrzymania i ceną, jaką chcą lub mogą za nie zapłacić.

W lutym 2022 roku, wraz z pojawieniem się na rynku modelu macierzy VSP E1090, Hitachi redefiniuje pojęcie midrange storage oraz pozwala wyeliminować te kompromisy zarówno w obszarze pojemności i wydajności, jak i funkcjonalności, które są dostarczane wraz z macierzą, a wśród których można wymienić między innymi:

  • mechanizmy redukcji danych ze sprzętową akceleracją,  
  • wirtualizację przestrzeni z innych macierzy dyskowych,
  • możliwość skalowania nawet do 130 kontrolerów w klasterze Virtual Storage Scale Out (VSSO),
  • szyfrowanie danych na dyskach,
  • mechanizm ustawiania retencji dla wolumenów, chroniący między innymi przed atakami typu ransomware,
  • wachlarz narzędzi do kopiowania i replikacji wolumenów, włączając w to również możliwość budowy klastra macierzowego typu active-active (tam, gdzie potrzebujesz zapewnić dla swoich środowisk RPO=0 oraz RTO=0),
  • możliwość projektowania architektury planów odtworzenia środowiska IT w oparciu o replikację danych pomiędzy trzema ośrodkami (3DC), a wraz z nowym produktem Hitachi Virtual Storage Software for Block (VSSB) – również możliwość zaprojektowania takiej replikacji do chmury publicznej,
  • adaptery pozwalające na wykorzystanie macierzy w środowiskach kontenerowych,
  • narzędzia do monitorowania (nie tylko samej macierzy) oraz automatyzacji zadań administracyjnych.

Pojemność

Zacznijmy od pojemności. VSP E1090 pozwala na zapewnienie ogromnej przestrzeni dyskowej dla aplikacji i ich danych. Mówimy tutaj o ponad 25 PB przestrzeni surowej (RAW). A w połączeniu z wbudowanymi mechanizmami kompresji i de-duplikacji efektywna dostarczana przestrzeń może być zdecydowanie większa. O ile większa? To będzie oczywiście zależało przede wszystkim od infrastruktury u klienta i rodzaju danych.

Istnieją na rynku programy marketingowe producentów macierzy, które obiecują uzyskanie oszczędności przestrzeni w oparciu o wykorzystanie mechanizmów kompresji i de-duplikacji (a czasami do tego również snapshotów i thin provisioningu). Hitachi w swojej ofercie dla macierzy blokowych również posiada taki program, który dla określonych warunków oferuje gwarancję redukcji danych na poziomie współczynnika 4:1, co przekłada się na 75% oszczędność przestrzeni dyskowej, czyli na mniejszą ilość fizycznych dysków w urządzeniu, mniejszą ilość półek dyskowych i potrzebnej przestrzeni w szafach komputerowych oraz na mniejszą ilość energii potrzebnej do pracy urządzenia. A to wszystko ma oczywiście bezpośredni wpływ na niższe koszty utrzymania macierzy.

Klient, decydując się na taki program, powinien pamiętać, że jego sukces – czyli uzyskanie obiecanego współczynnika redukcji – w dużym stopniu zależeć będzie od rodzaju przechowywanych danych. A w macierzach Hitachi kompresja i de-duplikacja włączana może być dla wszystkich lub dla wybranych wolumenów macierzy (dla tych, dla których jest to racjonalne).

Oczywiście procesy wykonywane w tle, takie jak chociażby kompresja danych wymagają przeznaczenia dla ich obsługi określonej mocy obliczeniowej. Aby jednak jak najwięcej tej mocy w kontrolerach pozostawić dla procesowania zapisów i odczytów (IO), VSP E1090 wyposażona została w dedykowane układy, wykorzystywane do sprzętowej akceleracji kompresji danych. Dzięki tym dodatkowym procesorom nie tylko zwiększa się dostępna przepustowość dla obsługi IO, ale również skróceniu ulegają czasy odpowiedzi dla aplikacji (co wynika bezpośrednio z niższego obciążenia kontrolerów).

Uzupełnieniem kompresji jest de-duplikacja, realizowana przez system operacyjny macierzy (SVOS). De-duplikacja ta wykorzystuje wbudowane mechanizmy AI i ML, które pozwalają dostosować sposób działania tej funkcji do rodzaju ruchu i typu obciążenia macierzy oraz do aktualnej wielkości tego obciążenia. Zadaniem tych mechanizmów jest przede wszystkim optymalizacja procesu de-duplikacji oraz ochrona macierzy przed przeciążeniem jej procesorów.

Mówiąc o pojemności macierzy nie należy zapominać o tym, na jakich dyskach tę pojemność możemy zbudować. Seria VSP E wraz z nowym modelem VSP E1090 daje użytkownikowi możliwość wyboru technologii dyskowej, w oparciu o którą będzie budowana przestrzeń dla aplikacji. Mamy tutaj do wyboru technologię SAS z dobrze znanym protokołem SCSI dla mniej wymagających zastosowań lub PCI Express z nowoczesnym protokołem NVMe, tam, gdzie oczekiwane jest dostarczanie dla aplikacji bardzo niskich, stabilnych i przewidywalnych czasów odpowiedzi przy jednoczesnym dużym obciążeniu (IOPS).

Dodatkowo, skalowanie przestrzeni dyskowej w macierzy VSP E1090 jest możliwe również poprzez wykorzystanie wbudowanego mechanizmu wirtualizacji innych macierzy. VSP E1090 potrafi zaadresować nawet 280 PB dodatkowej przestrzeni zwirtualizowanej z zewnętrznych macierzy dyskowych (zarówno FC jak i iSCSI). Funkcja ta jest realizowana wewnątrz VSP E1090 i nie wymaga stosowania żadnych dodatkowych urządzeń i wirtualizatorów oraz żadnych dodatkowych interfejsów do zarządzania – to kontrolery macierzy VSP E1090 są tutaj tym wirtualizatorem.

No dobrze, ale czy te kontrolery są w stanie zapewnić wydajność dla tak dużych przestrzeni dyskowych i czy to właśnie ta wydajność nie będzie „wąskim gardłem”?

Wydajność

W testach VSP E1090 osiągnięto najwyższy w swojej klasie wynik wydajności na tle wyników, które publikuje konkurencja dla urządzeń pozycjonowanych w tej samej grupie macierzy. Oczywiście, mówimy tutaj o testach laboratoryjnych i o tak zwanych wynikach maksymalnych (hero numbers), czyli takich, które są publikowane przez dostawców systemów pamięci masowych i które mogą posłużyć nam bardziej jako punkt odniesienia do wzajemnego pozycjonowania. Wynik na poziomie 8,4 mln operacji na sekundę (IOPS), jaki osiągnęła macierz VSP E1090 dla dwukontrolerowej konstrukcji, jest dla wielu konkurentów trudny do osiągnięcia nawet w konfiguracjach wielo-kontrolerowych.

Miliony IOPS-ów wyglądają imponująco, ale co dla wielu aplikacji jest dzisiaj zdecydowanie ważniejsze, to gwarancja niskich czasów odpowiedzi. W przypadku VSP E1090 mówimy o rekordowych w tej klasie poziomach RT (response time) rzędu 41 mikrosekund (=0,041 ms). Te 41 mikrosekund osiągnięto dla obciążenia wynoszącego 388 tys. IOPS. Czytelnika zainteresuje zapewne, jakie w takim razie czasy odpowiedzi uzyskano przy obciążeniu maksymalnym 8,4 mln IOPS? Otóż czas odpowiedzi dla maksymalnego obciążenia kształtował się na poziomie 227 mikrosekund (= 0,227 ms). I to pokazuje potęgę tych kontrolerów.

Pamiętaj, powyższe wyniki, to tzw. hero numbers – wyniki, które pokazują maksymalne możliwości kontrolerów macierzy. Do wymiarowania macierzy i projektowania jej konfiguracji dla określonych środowisk i w oparciu o określone dla nich profile IO wykorzystywane są dedykowane narzędzia, które pozwalają na wybranie właściwej konfiguracji do potrzeb konkretnego środowiska. 

Ponadto, wraz z macierzą VSP E1090 ogłoszona została nowa dla macierzy klasy midrange Hitachi możliwość horyzontalnego skalowania kontrolerów – Virtual Storage Scale Out (VSSO). Mechanizm ten pozwala na skalowanie zarówno pojemności, jak i wydajności oraz balansowanie nimi pomiędzy różnymi kontrolerami różnych macierzy w klastrze. Tak, to nie jest pomyłka. Klaster VSSO może być zbudowany z kontrolerów różnych modeli macierzy, na przykład serii E i zarządzany w całości z poziomu pojedynczego interfejsu. Ponadto do różnych węzłów klastra VSSO mogą być podłączone jednocześnie dyski w różnych technologiach, zarówno mechaniczne, jak i flash (SSD i/lub NVMe). Pojedynczy klaster Virtual Storage Scale Out może być zbudowany nawet z 65 węzłów (130 kontrolerów)!