W ostatnim czasie wyraźnie wzrosło znaczenie obszaru, jakim jest zarządzanie infrastrukturą centrum danych. Trwałe zmiany spowodowane przez pandemię, w tym przyśpieszona cyfryzacja, zwiększyły nacisk na łączność, zdalne monitorowanie, analizę danych, a nawet użycie sztucznej inteligencji wspomagającej podejmowanie decyzji w obszarze administrowania data center. Nowoczesne systemy monitorowania opierają się na ogromnej ilości danych generowanych przez czujniki i sprzęt, wykorzystując uczenie maszynowe do rozwiązywania problemów zanim się pojawią oraz do przewidywania awarii i wyszukiwania operacyjnych wąskich gardeł.

– Jeszcze kilka lat temu monitorowanie infrastruktury serwerowni skupiało się przede wszystkim na elementach związanych z nadzorem nad jej bezpieczeństwem i ciągłością działania. Okazuje się jednak, że monitorowanie infrastruktury to świetny sposób na wykrycie miejsc, gdzie możliwe jest obniżenie kosztów operacyjnych, na przykład energii, poprzez analizę warunków środowiskowych, w których działają serwery – tłumaczy Sebastian Zasina, Data Center Solutions Architect w Schneider Electric.

Na sile przybierają trendy rozbudowy dużych centrów danych oraz zwiększanie liczby mikro data center. W obu przypadkach rośnie liczba i znaczenie urządzeń wspierających pracę tych objektów.

– Nie dopuszczamy myśli, że czas przestoju może być dłuższy niż kilka sekund. Najlepiej, aby nigdy nie wystąpił. Wszystkie urządzenia infrastruktury krytycznej należy monitorować i w przypadku pojawienia się istotnego alarmu, podjąć działania naprawcze lub zapobiegawcze – mówi Krzysztof Krawczyk, IT Solutions Sales Manager w polskim oddziale Vertiva.

Monitorowanie zwiększa ciągłość działania

Platforma do zarządzania infrastrukturą centrum danych (DCIM – Data Center Infrastructure Management) stale monitoruje jej krytyczne elementy. „Odpytuje” sprzęt, raportuje wyniki oraz śledzi trendy i przypadki przekraczania ustalonych progów. Ułatwia to identyfikację słabych punktów, które mogą skutkować awariami. Operatorzy centrów danych mogą też proaktywnie rozwiązywać problemy ze środowiskiem, siecią czy zasilaniem, zanim staną się poważne.

Do najważniejszych funkcji, jakie oferują narzędzia DCIM, należą: monitorowanie infrastruktury w czasie rzeczywistym, raportowanie, wizualizacja danych, zarządzanie zasobami i wydajnością centrum danych, a także możliwość ich planowania. Istotna jest także uzyskiwana za ich pośrednictwem większa automatyzacja działań, która ogranicza ryzyko wystąpienia ludzkiego błędu.

Dzięki zastosowaniu czujników temperatury i innych sensorów środowiskowych można monitorować najistotniejsze obszary centrum danych i na podstawie otrzymywanych danych dokonywać zmian w systemach chłodzenia, dbając o ciągłość działania DC. Nie mniej ważne od dostępności jest to, że odpowiednio chłodzone serwery po prostu pracują wydajniej.

Funkcje monitorujące powinny obejmować ponadto alarmy ostrzegające o przekroczeniu dopuszczalnych poziomów temperatury, zasilania czy wilgotności. Informując o zagrożeniach, ułatwiają one zapobieganie problemom związanym z przegrzanymi serwerami lub brakiem ochrony sprzętu przed przepięciami elektrycznymi. Z kolei dostarczane przez DCIM raporty mogą przyczynić się do skrócenia czasu napraw serwerów, a w dłuższej perspektywie do zwiększenia ich dostępności. Służą przy tym  do wykonywania analiz pod kątem predykcyjnego utrzymania sprzętu o znaczeniu krytycznym, co przekłada się na ciągłość działania serwerowni.

Mniej okazji do popełnienia błędów

Jedną z najważniejszych funkcji narzędzia DCIM jest możliwość szybkiej i precyzyjnej wizualizacji krytycznych danych. Ułatwia ona reagowanie na incydenty i realizowanie przyjętych w data center strategii. Dane zgromadzone przez moduły monitorowania i raportowania powinny być prezentowane przy użyciu czytelnego, dobrze zaprojektowanego interfejsu. Możliwa jest nawet wizualizacja trójwymiarowego modelu obiektu, dzięki czemu uzyskuje się kompleksowy wgląd w infrastrukturę DC. Na podstawie informacji pozyskiwanych przez narzędzia DCIM administratorzy mogą lokalizować miejsce instalacji danego urządzenia i określić sposób jego funkcjonowania w obrębie serwerowni.

Z kolei analiza predykcyjna, przeprowadzana na podstawie danych dostarczanych przez DCIM, może posłużyć do symulowania różnych scenariuszy, ułatwiając opracowywanie planów działania na wypadek wystąpienia jakiegoś incydentu. Przyda się także na wcześniejszych etapach: podczas planowania serwerowni lub jej rozbudowy o dodatkowe elementy. Można użyć wielu dostępnych informacji przy każdej zmianie w data center, na przykład do określenia lokalizacji nowych serwerów oraz ich gęstości w poszczególnych szafach.

Rozwiązania do zarządzania infrastrukturą centrum danych pomagają uprościć rutynowe czynności wykonywane ręcznie, ograniczając liczbę błędów ludzkich, które są przyczyną nawet 80 proc. wszystkich przestojów w centrach danych. Im mniejsza liczba logistycznych obowiązków do wykonania, tym administratorzy IT mają więcej czasu na czynności bardziej złożone i ważniejsze z punktu widzenia działalności organizacji.

Zdaniem specjalisty

Michał Kulesza, Business Development Manager, Enterprise, Consumer and Green Energy, Aten  

Zarządzanie infrastrukturą data center od zawsze ułatwiało oraz kreowało strategie wykorzystania zasobów, ale także eliminowało czynnik błędu ludzkiego w przeciwdziałaniu przestojów. Po burzliwym 2020 roku, jak też we wciąż niestabilnym 2021, plany i prognozy nadal kształtują skutki pandemii oraz rosnące zagrożenia związane z ogólnoświatową intensyfikacją pracy zdalnej. Dlatego obecnie największym wyzwaniem dla administratorów jest nie tylko zapewnienie dostępu do infrastruktury za pomocą przełączników KVM over IP lub serwerów typu Serial, ale także gwarancja, że dostęp ten będzie bezpieczny, przy czym najlepiej szyfrowany. Coraz częściej także użytkownicy decydują się na dostęp typu hardware, ze względu na dużo większą uniwersalność i przewagę nad dostępem typu software.

  
Sebastian Zasina, Data Center Solutions Architect, Schneider Electric  

Rozwiązanie DCIM ma przede wszystkim pomagać, a nie przeszkadzać administratorowi. Zapewne każdy informatyk spotkał się z tym, że w razie awarii następuje „zalew” alarmów i komunikatów z różnych czujek i systemów, które znajdują się w dotkniętym nią obszarze. Dzięki mechanizmom AI nowoczesne oprogramowanie DCIM umożliwia grupowanie powiadomień i przekazuje jasną informację o źródle problemu. Skuteczny system monitoringu serwerowni pozwala na wieloaspektową analizę, informując nie tylko o stanie infrastruktury towarzyszącej serwerom. Przykładowo, oprogramowanie na podstawie analizy środowiska wirtualnego może zarządzać optymalnym przenoszeniem maszyn wirtualnych i wyłączaniem nieużywanych fizycznych serwerów, czego efektem jest niższy pobór energii w pewnej części infrastruktury IT.

  
Krzysztof Krawczyk, IT Solutions Sales Manager, Vertiv  

Co tworzy skuteczne rozwiązanie do zarządzania i monitorowania infrastruktury centrum danych? Otóż wszechstronność, uniwersalność oraz intuicyjność pracy z systemem. Kluczowa jest możliwość pobierania danych zarówno z urządzeń inteligentnych (za pomocą protokołów komunikacyjnych takich jak SNMP, Modbus, BACnet), jak i nieinteligentnych (wystawiających tylko pojedyncze sygnały). Może to zapewnić tylko połączenie oprogramowania i sprzętu. Nie bez znaczenia jest łatwość tworzenia sterowników do urządzeń dowolnego producenta i możliwość modyfikacji ustawień pod własne potrzeby. Na koniec własne dashboardy oraz raporty, które skupią się na najważniejszych elementach, bo każdy klient ma własną wizję, jak chce obserwować zmieniającą się sytuację w data center. Duże znaczenie ma odpowiednia wizualizacja danych, ułatwiająca „wyłowienie” cennych informacji z ogromnej ich ilości.

  

Nowa generacja narzędzi 

Rozwiązania DCIM nowej generacji, gwarantując dostęp do tych samych podstawowych funkcji, co tradycyjne narzędzia, są w przeciwieństwie do nich coraz częściej wdrażane nie lokalnie, ale w chmurze. To oczywiście stwarza ich sprzedawcom nowe możliwości. Ponieważ są oferowane w modelu Software-as-a-Service (SaaS), znacznie łatwiej je uruchomić – ich dostawcy twierdzą, że klienci mogą rozpocząć pracę w ciągu dni, a nie miesięcy. Oprogramowanie, firmware i poprawki zabezpieczeń są dostarczane automatycznie, a działający w chmurze serwer umożliwia odzyskiwanie danych po awarii.

Nowe DCIM są wyposażone w innowacyjne narzędzia, takie jak sztuczna inteligencja (AI) i uczenie maszynowe (ML). Monitorują w czasie rzeczywistym wydajność określonego elementu infrastruktury i wykrywają odchylenia usługi od poziomu odniesienia, wskazując konieczność zastosowania prewencyjnych działań utrzymaniowych. W rezultacie pozwalają ograniczyć przestoje i koszty obsługi data center. Zamiast przeprowadzać konserwację zgodnie z harmonogramem (niezależnie od tego, czy jest potrzebna, czy nie), robi się to tylko wtedy, gdy jest ona wymagana.

– Nie chcemy już reagować wtedy, gdy coś się zepsuje, ale wcześniej, gdy działanie sprzętu sugeruje, że taka czy inna awaria może wkrótce nastąpić. Mając ogromną bazę wiedzy, gromadzoną przez wiele lat i analizując dane przychodzące do naszego centrum diagnostycznego, jesteśmy w stanie powiadomić klienta o ryzyku i zaproponować rozwiązanie – zapewnia Krzysztof Krawczyk.

Najnowsze narzędzia do zarządzania infrastrukturą centrów danych są również dobrym rozwiązaniem w przypadku brzegowych centrów danych, którymi na miejscu zajmuje się zwykle bardzo nieliczny personel IT (albo nie ma go wcale). Infrastrukturą typu edge można sterować zdalnie – poprzez chmurę – z dowolnego urządzenia obsługującego przeglądarkę internetową.

Rosnące znaczenie edge computingu, z czym mamy obecnie do czynienia, wymusza zastosowanie systemów, które dobrze skalują się do środowisk rozproszonych, na przykład kilkunastu mniejszych serwerowni czy punktów dystrybucyjnych. To jeden z powodów coraz częstszego zastępowania lokalnych systemów monitorowania przez ich odpowiedniki hostowane w chmurze.

– Chmurowy system pozwala na zarządzanie rozproszonymi geograficznie obiektami z poziomu aplikacji mobilnej. Poza „lekkością” i wygodnym sposobem licencjonowania subskrypcyjnego, zapewnia dostęp do szeregu dodatkowych funkcjonalności. Przykładowo, umożliwia anonimowy benchmarking stanu infrastruktury klienta w porównaniu z danymi innych użytkowników platformy – mówi Sebastian Zasina.

Zadanie dla integratora

Biorąc pod uwagę wysoki poziom geograficznego rozproszenia zasobów IT, działy informatyczne muszą oceniać, zarządzać i optymalizować całą infrastrukturę, w tym centralne centrum danych oraz poszczególne lokalizacje brzegowe i ich połączenia. Różnorodne zasoby infrastruktury fizycznej (zasilanie, chłodzenie, powierzchnia obiektów), infrastruktury IT (sieci, serwery, pamięć masowa), łączności (okablowanie fizyczne i obwody logiczne) oraz usługi (oprogramowanie, aplikacje) wymagają całościowego zarządzania.

Dlatego jednym z kluczowych wyzwań w skutecznej implementacji DCIM jest integracja całego systemu. Dotyczy to zarówno wyspecjalizowanych narzędzi wdrożonych w centrum danych, jak i procesów operacyjnych i procedur, które ułatwiają bieżące zarządzanie oraz – co ważne – umożliwiają wprowadzanie coraz większej automatyzacji. Tego rodzaju integracja, która wcześniej była albo niemożliwa, albo technicznie lub finansowo zbyt trudna do przeprowadzenia, ma obecnie kluczowe znaczenie dla efektywnego zarządzania dostępną pojemnością oraz efektywnego wykorzystania ograniczonych i kosztownych zasobów data center. W realizacji tego celu trzeba się liczyć z coraz większą migracją klientów w kierunku rozproszonych infrastruktur i środowisk hybrydowych.

VR w centrum danych

Rozwiązania wirtualnej/mieszanej rzeczywistości znajdują zastosowanie w wielu branżach. Korzystają z nich naukowcy, projektanci, inżynierowie, lekarze i szefowie linii produkcyjnych. Od niedawna Beyond.pl świadczy w swoim centrum danych usługę technicznej obsługi infrastruktury – pod nazwą Smart Hands – z wykorzystaniem okularów mieszanej rzeczywistości Microsoft HoloLens 2.0. Dzięki tej technologii, klienci mają możliwość zdalnego zarządzania zasobami IT i podglądu swojego sprzętu w czasie rzeczywistym z dowolnego miejsca. Usługa Smart Hands znacząco usprawnia czynności serwisowe i eliminuje barierę odległości od centrum danych. Dzięki niej klienci mogą z dowolnego miejsca zarządzać infrastrukturą we współpracy z technikami Beyond.pl, bez tracenia cennego czasu na dojazd do serwerowni.