Pamięci masowe: czas to pieniądz
Choć wszystko wskazuje na to, że taśmy, a także dyski HDD szybko nie znikną z centrów danych, to starzy wyjadacze czują na plecach oddech młodych graczy, którzy nie uznają kompromisów.
Rynek pamięci masowych stał się w ostatnich latach wyjątkowo pojemny i łaskawy dla dostawców różnych technologii. Choć często słyszy się o dominacji pamięci flash, to jednak starsze i wolniejsze rodzaje nośników wciąż trzymają się mocno. Według IDC dostawy napędów taśmowych, bibliotek taśmowych i wirtualnych bibliotek taśmowych wzrosły w 2021 roku o 10,5 proc. w porównaniu z 2020. I choć wszystko wskazuje na to, że taśmy, a także dyski HDD szybko nie znikną z centrów danych, to starzy wyjadacze, tacy jak Quantum czy Spectra Logic, czują na plecach oddech młodych graczy, którzy nie uznają kompromisów. Jednym z takich przykładów jest amerykański startup VAST Data, działający na rynku od 2016 roku. Oferuje oprogramowanie Universal Storage, które służy do przechowywania plików i obiektów na certyfikowanych konfiguracjach sprzętowych. Platforma obsługuje pamięci flash QLC, składowania danych oraz Intel Optane 3D X Point, które spełniają rolę bufora.
Jak na nowicjusza, firma radzi sobie nieźle. Z jej systemów korzystają m.in. Narodowe Instytuty Zdrowia czy Uniwersytet Stanforda. Na liście kontrahentów startupu znajdują się też instytucje finansowe, koncerny medialne i dostawcy usług chmurowych. Średnia wartość kontraktu podpisywanego przez VAST Data oscyluje wokół miliona dolarów. Jeden z największych klientów startupu, pochodzący z branży energetycznej, przechowuje 25 PB danych.
– W 14 szafach rack możemy zmieścić 600 petabajtów danych. Z punktu widzenia kosztów jesteśmy w zasadzie na równi z dostawcami tych rozwiązań do archiwizacji, które bazują na dyskach twardych. Klienci nie muszą zatem wybierać pomiędzy szybkością a pojemnością. Cały czas szukamy optymalizacji, tym bardziej, że na każdym petabajcie powierzchni dyskowej można uzyskać oszczędności rzędu 100 tysięcy dol. – tłumaczy Jeff Denworth, , wiceprezes VAST Data.
Warto zauważyć, że VAST Data korzysta z nośników QLC (4 bity na komórkę), które mają średnią wytrzymałość zapisu na poziomie 1000 cykli (w przypadku TLC to pięć razy więcej). Co jednak nie przeszkadza, aby udzielać klientom 10-letniej gwarancji na pamięci QLC. Specjaliści VAST Data opracowali metody wydajnej redukcji danych, umożliwiającej odciążenie pamięci flash, a także modelu zabezpieczeń Erasure Coding.
Jeff Denworth nie wyklucza w przyszłości użycia dysków PLC (5 bitów na komórkę), co pozwoliłoby zredukować koszty wdrożenia Universal Storage o jedną piątą. Firma nie uznaje innych nośników poza pamięciami flash, a stosowany w większości macierzy dyskowych tiering storage (warstwowa przestrzeń dyskowa) uważa za rozwiązanie archaiczne.
Ferrari w segmencie pamięci
Weka.IO, podobnie jak VAST Data, stawia na zawrotne szybkości i petabajtowe pojemności. Startup powstał osiem lat temu w Tel Awiwie, ale w międzyczasie przeniósł swoją główną siedzibę do Campbell w Kalifornii. Firma oferuje zdefiniowany programowo rozproszony system plików, który działa w trybie obiektowym na serwerach 86x, klastrze hiperkonwergentnym lub w chmurze (AWS, Azure, GCP, Oracle). Architektura systemu umożliwia tworzenie tysięcy rozproszonych węzłów obliczeniowych, wykonywanie milionów operacji wejścia/wyjścia na sekundę i obsługę petabajtów danych. Wśród klientów startupu przeważają firmy z sektora energetycznego, finansowego, produkcyjnego i zdrowia.
– Systemy następnej generacji zapewniają od 10 do 100 razy wyższą wydajność aniżeli starsze pamięci masowe. Poza tym bardzo dobrze sprawdzają się w środowisku hybrydowym i na brzegu sieci. Klasyczne rozwiązania nie są dostosowane do pracy w chmurze, a zapis danych wewnątrz serwera mierzony jest w dziesiątkach mikrosekund. Innym problemem jest ich fragmentacja na bloki, pliki i obiekty – tłumaczy Liban Zvibel, CEO Weka.IO.
Startup znalazł się w gronie wizjonerów w Magicznym Kwadrancie Gartnera opisującym rozproszone systemy plików i obiektowe pamięci masowe. Analitycy chwalą producenta za dużą uniwersalność, a więc pracę w środowisku lokalnym, na brzegu sieci i chmurze publicznej oraz możliwość rozszerzenia systemu plików o przechowywanie obiektów, co zapewnia lepszą skalowalność i opłacalność wdrożenia w porównaniu z tradycyjnymi systemami all-flash do obsługi plików. Słabością jest znajomość marki, co może hamować globalną ekspansję producenta. Nie bez przyczyny Weka.IO wchodzi w alianse z liderami pamięci masowych. Bardzo dobrym przykładem jest współpraca z Hitachi Vantara, które oferuje rozwiązanie Weka.IO w modelu OEM. Dla ekspertów, którzy uważnie obserwują rynek pamięci masowych, może to być pewnego rodzaju niespodzianka.
– Hitachi Vantara bardzo rzadko decyduje się na akwizycje bądź sprzedaż rozwiązań innych producentów pod własną marką. W przypadku Weka.IO zrobiliśmy wyjątek, ponieważ to szczególny produkt. Nasze partnerstwo jest owocne, gdyż posiadamy silną pozycję w segmencie klientów korporacyjnych, potencjalnych odbiorców systemu Weka.IO – mówi Jason Hardy, CTO Hitachi Vantara.
Na początku czerwca startup przedstawił czwartą wersję swojej platformy, która ma obsługiwać na bardzo dużą skalę obciążenia analityczne w różnych środowiskach, ze szczególnym uwzględnieniem projektów sztucznej inteligencji i uczenia maszynowego. System zapewnia możliwość natywnej integracji z Amazon Web Services (AWS), Google Cloud Platform (GCP), Microsoft Azure i Oracle Cloud Infrastructure (OCI). Nowością jest też wybór dysków NVMe pod względem pojemności (QLC) lub zoptymalizowanych pod kątem wydajności (TLC).
Podobne artykuły
Sztuczna inteligencja w czterech odsłonach
Startupy bardzo szybko adaptują w swoich rozwiązaniach sztuczną inteligencję. Co ważne, większość z nich nie robi tego, aby nadążać za modą, lecz zwiększać funkcjonalność produktów.
Sztuczna inteligencja najlepszym przyjacielem danych
W ciągu ostatnich kilku lat niemal wszystkie organizacje zgromadziły ogromne zbiory danych. Samo przechowywanie i zarządzanie nimi to za mało, bowiem z informacji, o ile ma być przydatna, trzeba wyciągnąć określoną wartość.
Wszechobecne dane źródłem kłopotów
Cykl życia danych nigdy wcześniej nie był bardziej złożony. Powodem jest nie tylko ich ciągły przyrost, ale również „przemieszczanie się” po wielu różnych środowiskach.