CRN Jaki jest status Centrum Informatycznego Świerk? Czy zajmujecie się obsługą informatyczną całego NCBJ?

Adam Padée Nie pełnimy roli firmowego działu IT. Jesteśmy centrum obliczeniowym. W NCBJ funkcjonuje osobny dział IT, który świadczy usługi informatyczne dla całej organizacji. My zajmujemy się przede wszystkim prowadzeniem obliczeń wielkoskalowych, obsługą superkomputera, obsługą przetwarzania danych. Odpowiadamy też za sieć WAN dla całego instytutu – dla komunikacji z laboratoriami potrzeba dużego pasma i to my zapewniamy obsługę łącza na zewnątrz. Za sieć wewnętrzną odpowiada już jednak dział IT.

Jak w praktyce układają się relacje między waszym Centrum a działem IT?

Podział jest formalny, każdy ma swoją część infrastruktury do obsłużenia, ale te obszary się zazębiają. Komputery i aplikacje biurowe są obsługiwane przez dział IT, my zaś konfigurujemy brzegi sieci i robimy zabezpieczenia. Dział IT wpina się ze swoimi urządzeniami w naszą sieć, zarządzając światłowodami po stronie użytkownika. Jest to więc obustronna interakcja – korzystamy nawzajem ze swoich doświadczeń. W aspekcie sieciowym jesteśmy w zasadzie bardziej jak jeden zespół niż dwa osobne działy. Podział ma więc charakter bardziej formalny niż faktyczny. Współpracujemy też przy usługach kampusowych, gdzie potrzeba więcej infrastruktury. Dział IT nie będzie przecież stawiał osobnej serwerowni na sprzęt wysokiej mocy. Korzysta z już istniejącej, która jest w naszej gestii. My z kolei wykorzystujemy mniejsze serwerownie i rozproszoną infrastrukturę należącą do działu IT. Backup firmowy NCBJ także jest robiony na wydzielonych zasobach CIŚ.

Na czym w praktyce polega funkcjonowanie superkomputera? W jaki sposób ta maszyna jest wykorzystywana w działalności NCBJ?

O superkomputerze faktycznie mówi się jak o jednej maszynie. W praktyce mało jest jednak centrów obliczeniowych, gdzie superkomputery byłyby używane w ten sposób, że każda aplikacja byłaby uruchamiana na całym urządzeniu. Żeby było wygodniej, dzieli się zasoby komputera, co jest też efektywniejsze. Konfiguracja kolejek wsadowych jest różna w zależności od projektów, na potrzeby których wykonywane są obliczenia. Jedni mają potrzebę realizacji dłuższych procesów, inni stosują krótsze procesy, ale szybciej liczone. Konfiguracja nie jest homogeniczna, potrzebny jest logiczny podział superkomputera na kilka części.

Z czego wynika potrzeba dzielenia zasobów superkomputera?

Podział musi być chociażby dlatego, że mamy dwie różne, duże grupy aplikacji. Pierwsza służy do obsługi projektów klientów zewnętrznych, dla których świadczymy usługi. Tutaj dane są często niejawne, stanowią tajemnicę przedsiębiorstwa. Wydzielona więc została część, gdzie połączenia zewnętrzne są dobrze chronione. Druga grupa aplikacji służy do obsługi działalności naukowej NCBJ. Nasi naukowcy biorą między innymi udział w eksperymentach z zakresu fizyki wysokich energii. Projekty te są realizowane we współpracy z CERN-em i innymi laboratoriami. W tym przypadku wykorzystywana infrastruktura jest dobrze skomunikowana ze światem, wystawiona na zewnątrz w formie gridu, nie trzeba jej chronić tak mocno jak w poprzednim przypadku. Te dwie części są rozdzielone galwanicznie, nie ma między nimi połączeń, ale w razie potrzeby jest możliwość przeniesienia mocy – zawsze jednak po czyszczeniu maszyn, ze względu na ochronę danych.

Na jakich zasadach świadczycie usługi podmiotom spoza NCBJ? Kto z nich korzysta?

W zasadzie każda firma może zamówić u nas dostęp do mocy obliczeniowych. Jest jednak kilka branż, które potrzebują specyficznych usług obliczeniowych. Mamy więc ofertę przykrojoną do ich wymagań. Dotyczy to energetyki, lotnictwa czy przemysłu. Wykonujemy obliczenia związane z bezpieczeństwem instalacji przemysłowych, na przykład symulując skutki eksplozji czy rozprzestrzeniania się płynów. Współpraca odbywa się często w modelu mieszanym – nasi naukowcy robią ekspertyzy, a klient w pakiecie, oprócz wiedzy naukowej, dostaje też dostęp do zasobów obliczeniowych superkomputera. Świadczymy też usługi na życzenie – każda firma, która ma taką potrzebę, może wynająć moce obliczeniowe za określoną stawkę. Zakłady energetyczne i przemysłowe to generalnie nasi najwięksi klienci, zarówno w jednym, jak i w drugim modelu współpracy. Niemniej często robimy też symulacje biologiczne czy chemiczne, na przykład na potrzeby projektowania leków czy badania oddziaływania leków. W związku z tym, że nasza działalność jest finansowana z pieniędzy publicznych, mamy jednak ograniczenia w zakresie działalności komercyjnej. Zdecydowana większość naszych usług dotyczy obszaru naukowo-badawczego, głównie w zakresie fizyki cząstek elementarnych.

Realizujecie też projekt „Renderownia Świerk”. Na czym on polega?

Oferujemy usługi renderowania efektów specjalnych na potrzeby przemysłu filmowego. Dla małych firm jest to usługa wystawiona na zewnątrz – grafik instaluje plug-in i korzysta z przydzielonych mocy obliczeniowych. Z kolei więksi producenci potrzebują dedykowanych mocy obliczeniowych. Konfiguracja jest wtedy robiona na życzenie, według zgłoszonych potrzeb. Renderownia to projekt realizowany wspólnie z Polskim Instytutem Sztuki Filmowej (PISF). Jeśli film jest realizowany z dotacją PISF-u, to wtedy studio filmowe dostaje dostęp do superkomputera na preferencyjnych warunkach.

Jak od strony praktycznej wygląda obsługa infrastruktury informatycznej w CIŚ? Ile rzeczy robicie sami, a ile kupujecie gotowych na rynku?

Większość oprogramowania systemowego i narzędziowego superkomputera pochodzi z otwartoźródłowych rozwiązań, które przerabiamy i dostosowujemy do naszych potrzeb. Są to programy powszechnie znane i dostępne w środowisku superkomputerowym. Pracują nad nimi nasi programiści, a więc przetwarzamy je i dostosowujemy do naszych potrzeb własnymi siłami. Nie kupujemy takich rozwiązań na rynku. Jeśli zaś chodzi o oprogramowanie aplikacyjne, to różnie – część jest pisana w NCBJ, część pozyskujemy ze świata. Niektóre specjalistyczne aplikacje obliczeniowe otrzymujemy za darmo do celów naukowych, inne kupujemy na własność, z jeszcze innych korzystamy w modelu subskrypcyjnym. Generalnie nie kupujemy usług programistycznych na zewnątrz, a jeśli już, to bardzo rzadko.

Jakie oferty was interesują?

Na przykład kupiliśmy ostatnio macierze dyskowe i backup taśmowy wraz z oprogramowaniem, w tym ze specjalnymi wtyczkami do danych naukowych. Bezpieczeństwo danych jest dla nas bardzo ważne, niektóre jego aspekty wolimy powierzyć tym, którzy się na tym znają lepiej od nas. Mamy wiele kupionych na rynku rozwiązań związanych z sieciami. Tak jest prościej, nie ma sensu wyważać otwartych drzwi.

Oferty do was spływają, czy sami ich szukacie?

Znamy rynek, który związany jest z superkomputerami. Wciąż jednak natrafiamy na bariery komunikacyjne. Zdarza się, że firmy robią coś ciekawego, co mogłoby nas zainteresować, a my o tym nie wiemy. I odwrotnie, dostawcy, którzy mają ciekawy produkt czy rozwiązanie, nie zdają sobie sprawy, że ich oferta mogłaby być dla nas interesująca i nie zgłaszają się do nas. Takie sytuacje nie zdarzają się często, ale wciąż jednak występują. Mimo tego, że robimy głębokie analizy rynku, wiele ciekawych ofert do nas nie dociera. A niejednokrotnie małe firmy, start-upy mają ciekawsze i bardziej dla nas przydatne rozwiązania niż giganci rynku.

Rozmawiał Andrzej Gontarz

dr inż. Adam Padée  

W 2013 r. na Politechnice Warszawskiej obronił z wyróżnieniem pracę doktorską pt. „Rozproszone algorytmy ewolucyjne optymalizujące klasyfikację danych w eksperymentach fizyki wysokich energii”. Brał udział w eksperymencie COMPASS w CERN oraz w projektach badawczych, które tworzyły ogólnoeuropejską infrastrukturę obliczeniową EGI. Jest także współtwórcą Centrum Informatycznego Świerk. Jego naukowe zainteresowania obejmują m.in. rozproszone architektury komputerowe i metaheurystyczne algorytmy optymalizacji. Obecnie kieruje Zakładem Technologii Informatycznych NCBJ, zajmującym się obliczeniami dużej mocy, bezpieczeństwem IT i rozwijaniem oprogramowania.