Pamięci masowe: czas to pieniądz

Choć wszystko wskazuje na to, że taśmy, a także dyski HDD szybko nie znikną z centrów danych, to starzy wyjadacze czują na plecach oddech młodych graczy, którzy nie uznają kompromisów.

Rynek pamięci masowych stał się w ostatnich latach wyjątkowo pojemny i łaskawy dla dostawców różnych technologii. Choć często słyszy się o dominacji pamięci flash, to jednak starsze i wolniejsze rodzaje nośników wciąż trzymają się mocno. Według IDC dostawy napędów taśmowych, bibliotek taśmowych i wirtualnych bibliotek taśmowych wzrosły w 2021 roku o 10,5 proc. w porównaniu z 2020. I choć wszystko wskazuje na to, że taśmy, a także dyski HDD szybko nie znikną z centrów danych, to starzy wyjadacze, tacy jak Quantum czy Spectra Logic, czują na plecach oddech młodych graczy, którzy nie uznają kompromisów. Jednym z takich przykładów jest amerykański startup VAST Data, działający na rynku od 2016 roku. Oferuje oprogramowanie Universal Storage, które służy do przechowywania plików i obiektów na certyfikowanych konfiguracjach sprzętowych. Platforma obsługuje pamięci flash QLC, składowania danych oraz Intel Optane 3D X Point, które spełniają rolę bufora.

Jak na nowicjusza, firma radzi sobie nieźle. Z jej systemów korzystają m.in. Narodowe Instytuty Zdrowia czy Uniwersytet Stanforda. Na liście kontrahentów startupu znajdują się też instytucje finansowe, koncerny medialne i dostawcy usług chmurowych. Średnia wartość kontraktu podpisywanego przez VAST Data oscyluje wokół miliona dolarów. Jeden z największych klientów startupu, pochodzący z branży energetycznej, przechowuje 25 PB danych.

– W 14 szafach rack możemy zmieścić 600 petabajtów danych. Z punktu widzenia kosztów jesteśmy w zasadzie na równi z dostawcami tych rozwiązań do archiwizacji, które bazują na dyskach twardych. Klienci nie muszą zatem wybierać pomiędzy szybkością a pojemnością. Cały czas szukamy optymalizacji, tym bardziej, że na każdym petabajcie powierzchni dyskowej można uzyskać oszczędności rzędu 100 tysięcy dol. – tłumaczy Jeff Denworth, , wiceprezes VAST Data.

Warto zauważyć, że VAST Data korzysta z nośników QLC (4 bity na komórkę), które mają średnią wytrzymałość zapisu na poziomie 1000 cykli (w przypadku TLC to pięć razy więcej). Co jednak nie przeszkadza, aby udzielać klientom 10-letniej gwarancji na pamięci QLC. Specjaliści VAST Data opracowali metody wydajnej redukcji danych, umożliwiającej odciążenie pamięci flash, a także modelu zabezpieczeń Erasure Coding.

Jeff Denworth nie wyklucza w przyszłości użycia dysków PLC (5 bitów na komórkę), co pozwoliłoby zredukować koszty wdrożenia Universal Storage o jedną piątą. Firma nie uznaje innych nośników poza pamięciami flash, a stosowany w większości macierzy dyskowych tiering storage (warstwowa przestrzeń dyskowa) uważa za rozwiązanie archaiczne.

Ferrari w segmencie pamięci

Weka.IO, podobnie jak VAST Data, stawia na zawrotne szybkości i petabajtowe pojemności. Startup powstał osiem lat temu w Tel Awiwie, ale w międzyczasie przeniósł swoją główną siedzibę do Campbell w Kalifornii. Firma oferuje zdefiniowany programowo rozproszony system plików, który działa w trybie obiektowym na serwerach 86x, klastrze hiperkonwergentnym lub w chmurze (AWS, Azure, GCP, Oracle). Architektura systemu umożliwia tworzenie tysięcy rozproszonych węzłów obliczeniowych, wykonywanie milionów operacji wejścia/wyjścia na sekundę i obsługę petabajtów danych. Wśród klientów startupu przeważają firmy z sektora energetycznego, finansowego, produkcyjnego i zdrowia.

– Systemy następnej generacji zapewniają od 10 do 100 razy wyższą wydajność aniżeli starsze pamięci masowe. Poza tym bardzo dobrze sprawdzają się w środowisku hybrydowym i na brzegu sieci. Klasyczne rozwiązania nie są dostosowane do pracy w chmurze, a zapis danych wewnątrz serwera mierzony jest w dziesiątkach mikrosekund. Innym problemem jest ich fragmentacja na bloki, pliki i obiekty – tłumaczy Liban Zvibel, CEO Weka.IO.

Startup znalazł się w gronie wizjonerów w Magicznym Kwadrancie Gartnera opisującym rozproszone systemy plików i obiektowe pamięci masowe. Analitycy chwalą producenta za dużą uniwersalność, a więc pracę w środowisku lokalnym, na brzegu sieci i chmurze publicznej oraz możliwość rozszerzenia systemu plików o przechowywanie obiektów, co zapewnia lepszą skalowalność i opłacalność wdrożenia w porównaniu z tradycyjnymi systemami all-flash do obsługi plików. Słabością jest znajomość marki, co może hamować globalną ekspansję producenta. Nie bez przyczyny Weka.IO wchodzi w alianse z liderami pamięci masowych. Bardzo dobrym przykładem jest współpraca z Hitachi Vantara, które oferuje rozwiązanie Weka.IO w modelu OEM. Dla ekspertów, którzy uważnie obserwują rynek pamięci masowych, może to być pewnego rodzaju niespodzianka.

– Hitachi Vantara bardzo rzadko decyduje się na akwizycje bądź sprzedaż rozwiązań innych producentów pod własną marką. W przypadku Weka.IO zrobiliśmy wyjątek, ponieważ to szczególny produkt. Nasze partnerstwo jest owocne, gdyż posiadamy silną pozycję w segmencie klientów korporacyjnych, potencjalnych odbiorców systemu Weka.IO – mówi Jason Hardy, CTO Hitachi Vantara.

Na początku czerwca startup przedstawił czwartą wersję swojej platformy, która ma obsługiwać na bardzo dużą skalę obciążenia analityczne w różnych środowiskach, ze szczególnym uwzględnieniem projektów sztucznej inteligencji i uczenia maszynowego. System zapewnia możliwość natywnej integracji z Amazon Web Services (AWS), Google Cloud Platform (GCP), Microsoft Azure i Oracle Cloud Infrastructure (OCI). Nowością jest też wybór dysków NVMe pod względem pojemności (QLC) lub zoptymalizowanych pod kątem wydajności (TLC).