Jakość danych to podstawa

Postępująca cyfryzacja i automatyzacja procesów przetwarzania danych oraz korzystania z informacji zwiększa znaczenie starań na rzecz zapewnienia właściwej jakości danych. Nawet rozwiązania bazujące na sztucznej inteligencji nie zawieszają podstawowej, obowiązującej w informatyce od lat zasady GIGO (Garbage In, Garbage Out – śmieci na wejściu, śmieci na wyjściu). Wprost przeciwnie, trenowanie modeli uczenia maszynowego wymaga przede wszystkim dostępu do dobrej jakości danych.

Jak wykazało badanie grupy naukowców z Politechniki Wrocławskiej, generatywne modele językowe, trenowane na dziedzinowych bazach wiedzy, lepiej radzą sobie z obsługą specjalistycznych zapytań niż ChatGPT, który miał dostęp do olbrzymich, ale bardziej ogólnych zasobów informacji. To może być istotna wskazówka dla przedsiębiorstw, które chcą korzystać w swojej działalności z najnowszych narzędzi bazujących na sztucznej inteligencji. Jeśli chcą mieć w tym zakresie dobre wyniki, muszą przede wszystkim zadbać o jak najlepszą jakość danych, z których modele uczenia maszynowego będą korzystać i jak najlepszą jakość zasobów informacji, do których będą sięgać gotowe narzędzia sztucznej inteligencji.

Sposobów na zapewnienie odpowiedniej jakości danych może być wiele, w zależności od specyfiki, wielkości, sposobu działania czy strategii rynkowej danego przedsiębiorstwa. W wielu dużych firmach wdrażane są horyzontalne programy data governance, wprowadzane generalne reguły polityki zapewnienia jakości danych. W mniejszych mogą wystarczyć odpowiednio opracowane procedury przygotowywania dokumentów i wprowadzania danych do systemów, na przykład przy wystawianiu faktur czy przyjmowaniu zleceń. Tu znowu może być pole do popisu dla integratorów, żeby doradzić optymalne rozwiązanie i w ślad za tym zaproponować system informatyczny adekwatny do zdiagnozowanych uwarunkowań i potrzeb. Są dostępne różne modele mierzenia dojrzałości informacyjnej, z których można skorzystać w ramach konsultowania najlepszych rozwiązań dla klienta.

Coraz częściej w firmach pojawiają się specjalne osoby do zarządzania danymi – Chief Data Officer (CDO). Według raportu Deloitte’a „Chief Data Officer 2022” obecnie rola takich specjalistów skupia się w większości na wspieraniu działalności operacyjnej przedsiębiorstw. Docelowo jednakże współcześni CDO chcą bardziej skoncentrować się na działaniach strategicznych, koordynując wszelkie inicjatywy związane z wykorzystaniem danych na poziomie całej firmy. Nieco ponad 70 proc. uczestniczących w badaniu Deloitte’a CDO przyznało, że niewystarczający poziom umiejętności w zakresie zarządzania danymi w ich przedsiębiorstwach stanowi jeden z największych problemów.

Grupa specjalistów zajmujących się danymi jest już na tyle liczna i w Polsce, że powstało zrzeszające ich stowarzyszenie – DAMA Poland Chapter, jako polski oddział międzynarodowej organizacji DAMA International (The Global Data Management Community). Ta grupa zawodowa powinna stać się dla firm oferujących rozwiązania z zakresu zarządzania informacją jednym z głównych partnerów do rozmów biznesowych, oprócz szefów IT czy menedżerów innych działów merytorycznych, na przykład finansowo-księgowych lub handlowych. Jak bowiem pokazał ubiegłoroczny raport Gartnera, 67 proc. osób zaangażowanych w decyzje dotyczące zakupów nowych technologii nie jest już związanych z IT. Integratorzy powinni z pewnością ten fakt uwzględniać w swoich planach biznesowych.

Zdaniem integratora

Jakub Koba, CTO, Kogifi, ekspert organizacji SoDA Jakub Koba, CTO, Kogifi, ekspert organizacji SoDA  

Obserwujemy skokowy wzrost zainteresowania cyfryzacją obiegu dokumentów w związku z rozwojem pracy hybrydowej. Dzisiaj nakłada się na to dynamiczny rozwój sztucznej inteligencji. Firmy rozumieją, że już wkrótce cyfrowy obieg dokumentów stanie się kluczowy dla odblokowania ich pełnego potencjału informacyjnego. Sztuczna inteligencja przeprowadzi zaawansowane analizy dokumentów lub na ich podstawie będzie generować automatycznie nowe. Przykładowo, na podstawie dokumentów ofertowych dział sprzedaży będzie mógł generować odpowiedzi na zapytania klientów, prosząc o to jedynie sztuczną inteligencję. Dział administracji będzie mógł generować opisy firmowych procesów na podstawie szczątkowych informacji, jakie sztuczna inteligencja odnajdzie w dokumentach finansowych czy operacyjnych. Wszystko to stanie się możliwe dzięki cyfryzacji obiegu dokumentów.