Według różnych szacunków około 70 procent cyfrowych zasobów przechowywanych w organizacjach stanowią dane zimne, z których nikt nie korzysta.  Czy rzeczywiście te informacje są bezużyteczne, czy może pracownicy nie mają pojęcia, co one zawierają? Czy architektura Data Fabric ułatwia dostęp do tego rodzaju zasobów?  

Piotr Pietrzak Zadaniem architektury Data Fabric jest rozwiązanie problemu związanego z  tworzeniem się tzw. silosów danych. Zjawisko polega na tym, że organizacje gubią się w gąszczu danych i nie mają pełnej informacji na ich temat. Nie wiedzą również, które działy firmy odpowiedzialne są za zbieranie i udostępnianie informacji oraz w jakiej formie. To właśnie jest te wspomniane 70 procent. Najczęściej wygląda to w ten sposób, że  pracownicy mają dostęp do informacji dotyczących ich działu, ale nie mają pojęcia o tym, co znajduje się w pozostałych. Wiele osób nie wie, w jaki sposób wyłuskać potrzebne informacje i jakie pytania zadać, ponieważ tylko nieliczni znają wszystkie obszary działalności firmy bądź instytucji. Data Fabric oferuje dostęp do pełnego katalogu ze zdefiniowanym wspólnym słownikiem pojęć występujących w organizacji. To od strony biznesowej, natomiast od strony technicznej Data Fabric oferuje wirtualizację dostępu do danych czyli łączy różne silosy w całość. Dodatkowo umożliwia , wprowadzenie ujednoliconego słownika pojęć, maskowanie danych i zarządzanie dostępem oraz wsparcie analityków i użytkowników przez AI.

Andrzej Bugowski Oczywiście, jeśli ktoś zna bazy SQL poradzi sobie bez trudu z zapytaniem i szybko uzyska wymaganą odpowiedź. Jednak architektura Data Fabric pozwala na użycie języka naturalnego. W czasie realizacji projektu musimy zadać pytanie, które pozwali uzyskać na przykład numery karty kredytowej. Dzięki katalogowi szybko otrzymujemy informacje, a narzędzia do wirtualizacji ułatwiają fizyczny dostęp. To ważne, chociażby z tego względu, że 70 proc. danych stanowią zasoby użyteczne, ale nieużywane przez organizacje. Gdyby pracownicy mieli możliwość dostać się do nich, firma mogłaby prowadzić biznes w znacznie bardziej przewidywalny sposób.  

Jak wygląda w praktyce ten proces? Przedstawmy go bardziej obrazowo, chociażby na przykładzie wspomnianej karty kredytowej.    

Piotr Pietrzak Wyobraźmy sobie, że mamy kilka aplikacji korzystających z różnych baz danych. Bardzo często  procesy ETL, czyli ekstrakcji danych transferu i ładowania danych zachodzą pomiędzy różnymi strukturami informacyjnymi. W jednym systemie numer karty kredytowej nosi nazwę num_kart_kredyt, a w innym systemie tworzonym przez zewnętrznego dostawcy nazywa numer karty kredyt. Zastosowanie katalogu, a zatem wspólnego słownika pojęć, pozwala nam zmapować w obrębie całej organizacji nazewnictwo pojawiające się w  różnych systemach. 

Jakość danych jest szczególnie ważna przy tworzeniu modeli AI. Niejednokrotnie się zdarza, że właśnie słaba jakość danych prowadzi do fiaska tego typu projektów.

Na ile Data Fabric pomaga w rozwiązaniu tego problemu?   

Piotr Pietrzak Jednym z zadań realizowanych przez Data Fabric jest właśnie czyszczenie danych za pomocą  konkretnych narzędzi. Zauważamy, że jest to problem występujący w wielu organizacjach, niezależnie od ich wielkości. Proces czyszczenia zaczyna się od arkuszy kalkulacyjnych i podstawowych słowników, gdzie w kilku źródłach można używać różnego rodzaju danych czy też form zapisu.  

Andrzej Bugowski Charakterystyczny jest przykład firmy, która opracowała na podstawie zdjęć algorytm rozpoznawania wilków. W laboratoriach wszystko wyglądało idealnie, ale kiedy model wszedł w życie, jego wydajność spadła do kilku procent. Okazało się, że wszystkie wykorzystane zdjęcia oprócz wilków zawierały śnieg. Tymczasem wraz z architekturą Data Fabric pozbywamy się silosów danych. Każdy pracownik otrzymuje dostęp do różnych źródeł danych i to nie tylko tych pochodzących z jego działu. To sprawia, że jakość danych jest lepsza i dostosowana do naszego konkretnego zapytania biznesowego. Z reguły podczas przygotowania projektu około 80 proc. czasu pochłania przygotowania danych, dzięki Data Fabric jest to 70 procent. Na pierwszy rzut oka może się to wydawać niewiele, ale jeśli przeliczymy to na pieniądze, widać wymierne korzyści.  

Data Fabric jest architekturą czy produktem?  

Andrzej Bugowski Uważam, że jest to architektura, ponieważ żeby skorzystać z funkcjonalności Data Fabric wcale nie trzeba przebudowywać swojego środowiska. Można wybrać elementy, które pozwolą nam zdemokratyzować dane.  Mają do nich dostęp wszyscy pracownicy, oczywiście zgodnie z odpowiednimi regułami i według określonych polityk. Data Fabric jest architekturą znaną i wykorzystywaną od pewno czasu na całym  świecie. Natomiast my oferujemy IBM Cloud Pak for Data – zunifikowaną platformę umożliwiającą łączenie i udostępnianie odizolowanych danych w środowisku lokalnym lub w wielu chmurach bez konieczności ich przenoszenia. W pewnym uproszczeniu jest to zestaw narzędzi pozwalających w łatwy sposób uruchomić u klienta projekty związane z obsługą i zarządzeniem zasobami.  

Jakie są zalety narzędzia IBM? Dlaczego warto skorzystać właśnie z tego rozwiązania, a nie alternatywnych produktów?   

Piotr Pietrzak Mamy kompletny zestaw narzędzi, które integrują się ze sobą. Oferujemy też atrakcyjny system licencjonowania. Umowa licencyjna pakietu IBM Cloud Pak for Data pozwala w sposób dynamiczny korzystać z dowolnych produktów wchodzących w jego skład.  

Andrzej Bugowski Należy dodać, że IBM Cloud Pak for Data jest dostarczany w formie skonteneryzowanej, zaś administracja kontenerów oraz skalowanie wydajnościowe odbywają się w oparciu o OpenShift. Dzięki temu klient nie jest uzależniony od jednego dostawcy. Spotykamy się z różnymi sytuacjami, część firm posiada na przykład katalog danych, a nie ma miejsca na przechowywanie danych nieustrukturyzowanych. Inne mają hurtownie pochodzące od wielu dostawców, takich jak Oracle, IBM czy Microsoft oraz jeziora danych. My dostarczamy narzędzie, które pozwala na ich połączenie i uzyskanie pełnego wglądu we wszystkie dane należące do organizacji.   

Kto najczęściej korzysta z Data Fabric? Jakie konkretnie oszczędności można uzyskać po wdrożeniu tej architektury? 

Piotr Pietrzak Bardzo trudno oszacować korzyści wynikające z zastosowania Data Fabric, bowiem każdy przypadek jest inny. Jednak kiedy spojrzymy na tę architekturę pod kątem podniesienia efektywności procesów sprzedaży, ofertowania, telemarketingu czy upsellingu możemy mówić o dziesiątkach tysięcy, a nawet milionach złotych, jeśli nie zaoszczędzonych, to dodatkowo zarobionych. Architekturę Data Fabric wdrażają najczęściej duże przedsiębiorstwa, instytucje finansowe czy handel detaliczny. Jednakże patrząc poprzez pryzmat wykorzystania pojedynczych narzędzi, wówczas wchodzimy na poziom średnich, a nawet małych firm.  

Czy integratorzy zajmujący się analityką i bazami danych potrzebują dużo czasu, aby poznać narzędzia do wdrażania architektury Data Fabric? Czy mogą liczyć na wsparcie ze strony IBM? 

Piotr Pietrzak Większość partnerów zainteresowanych platformą IBM Cloud Pak for Data posiada wiedzę na temat analityki danych i baz danych. To firmy, które najczęściej chcą poszerzyć swoje kompetencje  i poznać narzędzia pozwalające wdrożyć architekturę  Data Fabric lub jej elementy. Nie mają one na ogół problemów z przyswojeniem tej wiedzy. Natomiast nie jest to łatwe do opanowania rozwiązanie dla firm, które chciałyby się przebranżowić z dnia na dzień i oferować zamiast infrastruktury systemy bazodanowe.   

Andrzej Bugowski Warto w tym miejscu zaznaczyć, że wszyscy nasi partnerzy mogą liczyć na wsparcie zespołu PTS (Partner Technical Specialist), czyli grupy ludzi mających szeroką wiedzę z zakresu Data Fabric i baz danych. Z jednej strony mogą oni pomóc partnerom podnieść kwalifikacje w tym zakresie, a z drugiej wesprzeć firmy, które chcą się przebranżowić i rozpocząć działania w nowym dla nich segmencie rynku. Należy też wspomnieć, że od początku tego roku działa grupa  Client Engineering, czyli zespół fachowców, którzy wspólnie z naszymi partnerami i klientami budują rozwiązanie gotowe do działania na produkcji w modelu MVP. Polega to na tym, że współdziałają z partnerem oraz klientem i w 8 tygodni przygotowują produkt będący prototypem. Na koniec warto dodać, że partnerzy mogą wybrać jeden z dwóch modeli współpracy. Pierwszy to bills, który stanowi propozycję dla partnerów dysponujących własnym produktem, do którego dodają naszą technologię i sprzedają go pod własną marką. Alternatywą jest opcja resell, a więc odsprzedaż naszych produktów, choć tak naprawdę dopiero po dodaniu własnych usług wdrożeniowych firma partnerska może liczyć na profity.