Główny Urząd Statystyczny w moim odczuciu jest… żywicielem z mojego dzieciństwa, gdyż to stamtąd Ojciec przez ponad 30 lat przynosił pensję oraz paczki ze słodyczami od Dziadka Mroza. Mając w domu dostęp do Rocznika Statystycznego i opasłej księgi zakładów przemysłowych, wiedziałem gdzie i ile wyprodukowano węglarek dwu- i czteroosiowych (nie była to informacja poufna!). Co prawda krążył wtedy dowcip, że „podczas pożaru budynku GUS-u krzyczano, żeby ratować sufity, bo nie będzie skąd brać danych”, ale to był brzydki żart.

Potem, w okresie moich początków z elektroniczną techniką obliczeniową, z ogromnym zaciekawieniem oraz i z pewną dumą oglądałem Ośrodek Elektroniczny GUS-u wyposażony w maszyny ICL1902 A i Odra 1304 oraz w klawiaturowy system rejestracji danych MERA 9150, który pozwolił ośrodkowi w 1974 r. pozbyć się kart perforowanych.

W Polsce pierwszy Powszechny Spis Ludności przeprowadzono w 1921 r., starając się policzyć ludność i mieszkania po odzyskaniu niepodległości, co ze względu na znaczne migracje, niezbyt się udało. Do policzenia wyników zakupiono maszyny do dziurkowania kart, sortery i tabulatory. Następny spis w 1931 r. dał już bardziej przybliżony obraz struktury ludności i poziomu analfabetyzmu. Wtedy też skorzystano z maszyn tabulacyjnych Hollerith’a oraz z maszyn rachunkowych.

Po wojnie po raz pierwszy spisywano Polaków w 1946 r. i potem od 1950 co 8–10 lat. W nowej Polsce ważny był spis w 2011 r., przeprowadzany według wytycznych i w terminach określanych przez Komisję Europejską. Spis dotyczył demografii ludności oraz zasobów mieszkaniowych. W tym spisie po raz pierwszy GUS pozyskał kopie danych z ponad 16 systemów teleinformatycznych: podatkowego, PESEL, ZUS, NFZ, PFRON, samorządów oraz dostawców energii i usług telekomunikacyjnych, które zostały zebrane w Bazie Danych NSP 2011. Dane te, dotyczące osób i mieszkań, po zagregowaniu były drogą elektroniczną przedstawiane osobom dokonującym samospisu do korekty i zaakceptowania. Wyeliminowano używanie ankiet papierowych. Spośród wszystkich spisujących się, wylosowano 20 proc. osób, które musiały odpowiedzieć na od 60 do 100 dodatkowych szczegółowych pytań.

Poza krytyką zbyt prostego logowania się samym PESEL-em, agregowanie baz danych z tych systemów oraz ochrona i prywatność danych nie wzbudziła większych niepokojów. Według ustawy dotyczącej tego spisu, wszystkie zebrane dane osobowe miały zostać usunięte z Bazy NSP 2011 po upływie dwóch lat. A część danych była ponoć przechowywana w Izraelu (w tej sprawie zgłoszona została interpelacja sejmowa nr 4894).

USA: silna ochrona pozyskanych danych

W USA spisy ludności (census) odbywają się od 1790 r. co 10 lat. W 1890 r. po raz pierwszy zastosowano maszyny tabulacyjne Hollerith’a, na których wynik liczby ludności policzono w sześć tygodni. Od 1940 r. zebrane dane osobowe obywateli mają być utajniane na 72 lata, po czym są publicznie dostępne. Dane ze spisu 2020 r. będą dostępne po 2092 r. Jednak według danych osobowych ze spisu w 1940 r., na podstawie First War PowersAct z 10 grudnia 1941 r., służby specjalne internowały po Pearl Harbor Amerykanów pochodzenia japońskiego, a potem również niemieckiego i włoskiego. W 1980 r. agenci FBI próbowali skorzystać ze spisanych danych osobowych, ale Sąd Najwyższy stwierdził, że żadna z agencji nie ma do nich prawa dostępu. Jednak Snowden w 2013 r. ujawnił, że służby znalazły inne sposoby masowego pozyskiwania informacji o obywatelach.

Spis roku 2020 (U.S. census) był pierwszym dopuszczającym udzielanie odpowiedzi przez internet i telefon, pozostawiając jednak opcję na formularzu papierowym. U.S. census nie ma prawa korzystać z jakichkolwiek systemów informatycznych administracji publicznej, co było już kwestionowane, ale Sąd Najwyższy zakazał wykorzystania ich w spisie. W odniesieniu do każdego mieszkania pytano o formę prawa do przebywania (własność, najem, wypożyczenie itp.) i liczbę mieszkańców. Następnie dla każdego z mieszkańców trzeba było podać: imię, nazwisko, płeć, datę urodzenia oraz rasę. W żadnym przypadku nie pytano o Social Security Number. W spisie wzięło udział 99 proc. obywateli. Jedyną kontrowersją, którą spowodował prezydent Donald Trump, była kwestia spisywania/wykluczania nielegalnych imigrantów. Ich liczba może wpływać na liczbę mandatów z danego stanu do Kongresu oraz wartość dotacji z funduszy federalnych.

Polska: zastrzeżenia do obecnego spisu

Obecny Polski Powszechny Spis Ludności i Mieszkań opiera się na ustawie NSP 2021 [Dz.U.2019 poz. 1775], znowelizowanej 1 kwietnia już w trakcie jego trwania. Spis ma trwać do 30 września 2021 r. Według ustawy, GUS przejmuje dane z ponad 22 systemów teleinformatycznych administracji publicznej i kilku firm infrastrukturalnych, i to pięciokrotnie – stan z dnia 31 grudnia 2019, 30 czerwca 2020, 31 grudnia 2020, 30 czerwca 2021 i 31 grudnia 2021. Z takim zagregowaniem Big Data oraz z wykorzystaniem Data Science i technik sztucznej inteligencji jest możliwe uzyskanie pełnego profilu każdej osoby oraz każdego mieszkania o wartości informacyjnej większej niż wiedza tych osób o sobie i swoich zasobach mieszkaniowych. Niewielu sobie zdaje sprawę jakimi danymi będzie dysponować GUS, ale teraz odnotowujemy większą liczbę pytań i obaw spowodowanych brakiem dokładniejszych informacji o rzeczywistym przetwarzaniu tego zbioru gigadanych.

Obywatele, po aktywnej promocji reguł RODO, są już obecnie silniej uwrażliwieni na ochronę danych osobowych. Częstym pytaniem jest, jak zostaną zweryfikowane rozbieżności w wartościach danych pomiędzy tymi źródłowymi systemami, w których jest sporo błędów. Ja i żona w systemie PESEL mamy wpisaną datę o dzień późniejszą od rzeczywistej daty ślubu… czyli noc poślubną spędziliśmy nielegalnie. Dobrze, że USC ma poprawną informację…

Zadawane jest też pytanie, czy zgodnie z art. 51 Konstytucji oraz RODO możemy zażądać od GUS-u dostępu do własnego profilu osobowego i mieszkaniowego uzyskanego z przetworzenia tych systemów przez GUS, a także ewentualnie żądać sprostowania błędnych danych. Samospis rozpoczyna się od pustej ankiety – osoby spisujące się mają same podawać wszystkie dane – nawet te podstawowe. Wiele osób zadaje jednak pytanie, dlaczego uzyskane z 22 systemów teleinformatycznych dane nie mogą być podstawową bazą danych spisu? A weryfikację poprawności i korektę danych należy przeprowadzić w tych systemach źródłowych, gdyż tam jest ona potrzebna.

W samym NSP 2021 od poszczególnych osób można wtedy żądać kilku informacji, rzeczywiście nigdzie wcześniej nie zgromadzonych. Natomiast w ustawie o NSP 2021 jest stwierdzenie o etapie kontrolowania poprawności danych w wypełnionych ankietach, według już posiadanych przez GUS danych. Jest też tam informacja o przetwarzaniu przez GUS pozyskanych danych przez następne 100 lat! Aż strach się bać, jak te dane zostałyby nielegalnie przejęte przez jakichś naszych lub obcych hakerów.

Ustawa (w skrócie) NSP 2021 obejmuje osoby fizyczne stale zamieszkałe i czasowo przebywające w mieszkaniach itp. oraz niemające miejsca zamieszkania, a nie obejmuje personelu przedstawicielstw dyplomatycznych. Osoba fizyczna objęta spisem powszechnym jest obowiązana przeprowadzić samospis internetowy oraz dokonać spisu osób nieobecnych i małoletnich wspólnie z nimi zamieszkałych. Możliwe jest też dokonanie spisu metodą wywiadu bezpośredniego lub telefonicznego przeprowadzanego przez rachmistrza spisowego.

W tych zapisach w ustawie nie ma mowy o konieczności dokonywania spisu osób innych niż małoletnich (zapomniano o niepełnosprawnych oraz ubezwłasnowolnionych) czy nieobecnych, a zamieszkałych wspólnie. A taki obowiązek wynika ze struktury wypełnianej ankiety. Wzbudziło to wiele pytań i zastrzeżeń, dlaczego ktoś za innych pełnoletnich ma dokonywać ich spisu podając ich PESEL-e oraz inne dane, w tym te wrażliwe? Nie zawsze inni domownicy będą chętni nawet do ujawnienia swojego numeru PESEL. Istniejące w wielu domach trudne i skomplikowane relacje rodzinne mogą wręcz doprowadzić do awantur. Ja z kolei pytam, dlaczego osoby, które ukończyły 13 lat, mające już ograniczoną zdolność do czynności prawnych nie mogłyby dokonać samospisu (technicznie jest to dla nich wykonalne), zachowując do swojej wiadomości wpisywane swoje dane wrażliwe, nie chcąc się nimi dzielić z opiekunami? Byłaby to też dobra lekcja wychowania obywatelskiego.

Ponad 40 rodzajów ogrzewania

Według już przywołanego art. 51 Konstytucji, ujawnianie informacji dotyczącej osoby fizycznej powinno odbywać się na podstawie ustawy. W ustawie o NSP 2021, w załączniku mamy opisany zakres zbieranych informacji. W charakterystyce demograficznej nie ma numeru PESEL, jest wiek (nie ma pełnej daty) oraz miasto urodzenia. W trakcie spisywania po obowiązkowym podaniu numeru PESEL, wpisanie daty urodzenia i rodzaju płci jest weryfikowane informacjami z PESEL-u. Dla pozostałych pozycji, w załączniku, opis zakresu zbieranych danych jest bardzo uproszczony w stosunku do wymagań ankiety spisowej. W przypadku stanu i charakterystyki zasobów mieszkaniowych spełnienie podania prawidłowych odpowiedzi wymaga często istotnej wiedzy o budowie mieszkania, jego infrastrukturze oraz używanych zasobach (np. podanie, który z ponad 40 podanych rodzajów ogrzewania jest używany). Dla wielu osób może to być bardzo trudnym zadaniem, a bez tych informacji wypełnianie ankiety nie może być kontynuowane.

Ankieta spisu jest wielowariantowa i kolejne pytania wynikają z udzielanych odpowiedzi. Po zatwierdzeniu ankiety nie ma możliwości jej korekty. Skandalem jest, że spisujący nie dostaje kopii wypełnionej ankiety, ani nawet potwierdzenia jej złożenia. Może to utrudnić obronę, gdy zostanie posądzony o udzielanie błędnych odpowiedzi w procedurze weryfikacji spisu. 

W okresie rozwoju cyfryzacji i nowych technik informacyjnych, a także zintensyfikowanego korzystania z pracy i nauki zdalnej, w tym spisie wyraźnie brakuje zbierania danych dotyczących poziomu umiejętności informatycznych, dostępu do internetu oraz posiadania adresu mejlowego i sprzętu cyfrowego. Dla nas, czytelników CRN-a, zbiorczy przegląd tych informacji byłby wielce ciekawy. Ale niestety w okresie konsultacji o zakresie tematycznym spisu, na przełomie lat 2016/2017, takie propozycje padały zbyt enigmatycznie. Nie zadbaliśmy wtedy o nasze potrzeby – warto o tym na przyszłość pamiętać.

Odnotowywane są kłopoty z wpisaniem rodzaju zawodu. Według instrukcji spisowej obowiązuje Rejestr Zawodów prowadzony przez resort rozwoju, ale możliwe jest wpisanie zawodu informatyk/informatyczka (tak, są obie wersje płci), którego to w tym rejestrze nie ma. Nie można wpisać zawodu inżynier informatyk, którego też nie ma w Rejestrze. Powinniśmy wreszcie zadbać o to, aby nasz zawód, jaki uzyskujemy po studiach informatycznych, stał się zawodem oficjalnie uznanym. Bo kto napisał to oprogramowanie NSP 2021? I wreszcie, emerytów w ankiecie spisowej nie pyta się o ich zawód, co jest dziwne, gdyż wielu jeszcze pracuje w swoim zawodzie, dorabiając do skromnych emerytur.

Problemy marketingu NSP 2021  

Zdumiewający jest fakt braku znaczącej aktywności ze strony GUS-u w wyjaśnianiu pojawiających się pytań, zastrzeżeń i wątpliwości. Nie ma też widocznej promocji trwania spisu, a wielu obywateli i obywatelek nawet nie zauważyło, że taki spis właśnie jest przeprowadzany. Wysłanie listu przez prezesa GUS-u, napisanego czcionką o rozmiarze 10 punktów (mało czytelną dla starszych osób), zaczynającego się od zdania: „Termin zakończenia spisu może ulec zmianie (…)”, a potem straszenie karą grzywny, gwarantowanie ochrony danych ślubowaniem przestrzegania tajemnicy statystycznej, jest z marketingowego punktu widzenia mało skutecznym sposobem promocji produktu, jakim jest NSP 2021. Również specjalnie przygotowana strona internetowa https://spis.gov.pl jest mało nośna informacyjnie i trudno znajduje się na niej potrzebne informacje.

Brak efektywnych działań w odniesieniu do przekonywania wątpiących, krytykujących, a wręcz antyspisowców prowadzi do ograniczenia liczby spisanych. Do dnia 7 czerwca br. dopiero 26,4 proc. obywateli dopełniło obowiązku dokonania samospisu. Na forach społecznościowych dominuje stwierdzenie, że lepiej nawet zapłacić 5 tys. zł kary za uchylenie się od spisu, choć nałożenie tej kary wydaje się mało możliwe.

A GUS na promocję spisu ma przewidziane w budżecie 2021 aż 41 mln zł. Całe przedsięwzięcie ma kosztować 386 mln zł. Trzymajmy kciuki za GUS, aby się dobrze spisał i przede wszystkim profesjonalnie zadbał o nasze dane osobowe przez następne 100 lat.

Artykuł powstał na podstawie źródeł z Wikipedii, treści odpowiednich ustaw oraz wybranej literatury.

Dr inż. Wacław Iszkowski Dr inż. Wacław Iszkowski   

W latach 1993 – 2016 był prezesem Polskiej Izby Informatyki i Telekomunikacji. Pracował też w firmach: Oracle, DEC Polska, 2SI, EDS Poland, TP Internet. Obecnie jest senior konsultantem przemysłu teleinformatycznego.