Sztuczna inteligencja vs. dane zombie

Komprise już kilka lat temu ukuł termin „zombie data”, pod którym kryją się nikomu niepotrzebne informacje spoczywające na serwerach i macierzach dyskowych. Firma z Campbell, założona w 2014 toku, praktycznie od początku swojej  działalności walczy z „zombie data”. Jej bronią jest platforma Komprise Intelligent Data Management, natychmiastowy wgląd w nieustrukturyzowane dane we wszystkich silosach NAS i obiektowych magazynach danych — od rozwiązań lokalnych po urządzenia brzegowe i chmury.

System identyfikuje oszczędności, przenosi tzw. zimne dane, aby zoptymalizować koszty, a także umożliwia analizowane, warstwowanie i zarządzanie danymi na dużą skalę.  Czasami są to zbiory o pojemności liczonej w petabajtach i składające się z setek milionów plików.

Jeszcze kilka lat temu wszyscy mówili o potrzebie stosowania backupu czy disaster recovery, ale prawie nikt nie wiedział czym jest zarządzanie danymi. To się jednak zmienia i rozwiązania tej klasy powoli wchodzą do głównego nurtu – tłumaczy Kumar Goswami, dyrektor generalny Komprise.

Kumar Goswami, dyrektor generalny Komprise

Tsunami danych nieustrukturyzowanych (teksty, obrazy, e-maile, wideo, dźwięk) sprawia, że firmy zastanawiają jak opanować rozgardiasz w centrach danych.  Szefowie działów IT z jednej strony starają się obniżyć koszty ich magazynowania, zaś z drugiej, zapewnić bezpieczeństwo oraz dostępność. Nie jest to łatwe zadanie, tym bardziej, że danych nieustrukturyzowanych nie można w prosty sposób analizować ani przetwarzać przy użyciu metod stosowanych w przypadku zbiorów ustrukturyzowanych.

–  Chcemy zmienić sposób w jaki świat zarządza danymi nieustrukturyzowanymi. To ambitny cel, ale ma on sens biorąc pod uwagę trudności jakie nastręcza im ten proces. Zauważamy, że biznes naciska na fundamentalne zmiany. Pierwsza dotyczy przejścia od prostej administracji pamięci masowej do strategii bazujące na analizie. Druga kwestia wiąże się z uwolnieniem danych. W praktyce oznacza to, że muszą być one bezpiecznie udostępniane wszędzie tam, gdzie są potrzebne – tłumaczy Kumar Goswami

Platforma Komprise Intelligent Data Management składa się trzech podstawowych elementów: konsoli zapewniającej ujednoliconą widoczność, obserwatora maszyn wirtualnych oraz globalnego indeksu plików. System działa w środowisku lokalnych, chmurowym oraz pamięciach obiektowych. Użytkownik ma dostęp do ujednoliconego widoku danych, niezależnie od tego gdzie one się znajdują. Platforma wykorzystuje maszyny wirtualne nazywane „obserwatorami”, które działają blisko systemów pamięci masowych. Analiza i zarządzanie danymi w środowisku lokalnym zapewnia użytkownikom bardzo szybki dostęp do potrzebnych informacji.

Natomiast Global File Index tworzy kompleksowy widok ekosystemu danych, przechowując szczegółowe informacje o każdym pliku: kto go stworzył, kiedy ostatnio był dostępny, jaki rodzaj danych zawiera. Komprise posiada około eksabajta tego rodzaju informacji.

Platforma obsługuje praktycznie każde środowisko pamięci masowej, począwszy od tradycyjnych systemów NAS po nowoczesne platformy chmurowe.

Jesteśmy partnerem AWS, Azure oraz Google Cloud Platform, aczkolwiek większość naszych klientów współpracuje z dwoma pierwszymi  usługodawcami, co odzwierciedla wymagania rynku. Poza wielką trójką współpracujemy z innymi dostawcami usług chmurowych, w tym między innymi Wasabi – dodaje Kumar Goswami,

Komprise ma odmienne podejście do sztucznej inteligencji niż większość dostawców infrastruktury IT, koncentrujących się na uzyskaniu jak najwyższej wydajności. Tymczasem badania Gainera pokazują, iż zarządzanie danymi ma większe znaczenie niż prędkość ich przetwarzania.

Jedynie 5 proc.przedsiębiorstw będzie kiedykolwiek szkolić własne modele sztucznej inteligencji. Prawdziwym wyzwaniem jest bezpieczne połączenie istniejących systemów sztucznej inteligencji z danymi korporacyjnymi – i zrobienie tego w sposób, który chroni wrażliwe informacje, jednocześnie udostępniając przydatne dane – wyjaśnia Krishna Subramanian,President & COO w Komprise.

Niedawno firma wprowadziła funkcjonalność wykrywania nieustrukturyzowanych danych osobowych,  w tym numerów ubezpieczeń  społecznych,  numerów telefonów, adresów w    hybrydowym środowisku, a następnie automatycznego ich  przenoszenia  do bezpiecznej lokalizacji wskazanej przez administratora. Poza tym usługa pozwala również odnajdywać informacje oznaczone jako wrażliwe

za pomocą słów kluczowych, fraz lub typowych skrótów, kodów produktów, formatów identyfikatorów pracowników lub innych danych zdefiniowanych prawem.