This presentation was made during InternetBeta 2014 by Jan Herbst (Stocznia) and Robert Olejnik (TEONITE). We were speaking about the problem of open data in Poland based on the example of OpenPoland.net portal.
WYBRANE ASPEKTY TECHNOLOGICZNE WALKI Z PRZESTĘPCZOŚCIĄ ZORGANIZOWANĄ
OpenPoland.net - InternetBeta 2014
1. 11-10-2014
Jan Herbst, Robert Olejnik
Co się stanie jak się wszyscy
dowiedzą?
Problem otwartych danych w Polsce na przykładzie
OpenPoland.net
2. Agenda
O czym będzie ta prezentacja?
Otwarte dane – wstęp
Otwartość danych w Polsce
Problemy i zagadnienia otwartych danych
Zapotrzebowanie na otwarte dane – dla kogo?
Problemy technologiczne otwartych danych
Obecny stan faktycznie otwartych danych
Problemy z jakością otwartych danymi
OpenPoland.net
1
5. Otwartość po polsku
Co się dzieje?
Nowelizacja ustawy o dostępie do informacji publicznej;
Ciągła dyskusja o re-use;
próba rozróżnienia między "dostępem" a "ponownym wykorzystaniem" (publikacja,
przetworzenie)
„poza zakresem pojęcia informacji publicznej znajdują się wewnętrzne dokumenty kontrolno-analityczne
oraz opinie prawne sporządzane przez komórkę wewnętrzną organu
państwowego”
Powstaje CRIP;
Ze strony MAiC (29 gru 2011): „Wniosków do składania będzie mniej, gdyż znaczna część
zasobów dostępna będzie na stronie BIP lub w nowo powstałym repozytorium zasobów
informacyjnych o szczególnym znaczeniu dla innowacyjności…”
Wzrost zainteresowania, wiele inicjatyw niepublicznych
4
7. Problemy otwartych danych
Problemy okołoprawne
teoretycznie powinno być pięknie: Dyrektywa 2003/98/WE, jej
implementacje w polskich warunkach (ust. o dost. do inf. Publ, re-use)
nie ma prawdziwych problemów z prawem, są problemy z jego
interpretacją
ustawa o dostępie do informacji – gdzie kończy się re-use, „cel społeczny”,
„ważny interes państwa”; uznaniowość w udostępnianiu danych:
Argumenty: po co? nie jesteśmy dysponentem, nie ma komu tego
zrobić, dane wrażliwe, dane osobowe;
6
8. Problemy otwartych danych
Problemy okołoprawne
ustawa o statystyce publicznej – GUS ma mniejsze możliwości upubliczniania
danych niż każda inna jednostka administracji;
ustawa o bazach danych – status publicznych baz danych i kwestia praw
autorskich oraz licencji;
ustawa o ochronie danych osobowych
ustawy szczegółowe – np. prawo geodezyjne, które narzuca ograniczenia w
udostępnianiu danych geo;
7
9. Praktyka działań administracji
Dlaczego nie możemy udostępnić Wam danych?
Co się stanie jak się wszyscy dowiedzą? Dlaczego dane nie są publiczne:
obawa przed odkryciem błędów
obawa przed kontrolą
obawa przed złamaniem prawa
dodatkowa praca
Interesy
"ostrożność" (czyli - na wszelki wypadek nie)
niekompetencja - „wydobycie danych wymaga pieniędzy bo tak zaprojektowaliśmy
system”
8
10. Deficyt współpracy - Idea a Biznes
* 2 światy: IT i działań społecznych
* utrzymaniem serwisów - model biznesowy
9
11. A jednak się kręci!
Mimo tych różnych problemów, coraz więcej udaje zrobić, czego my jesteśmy
najlepszym przykładem
Zmiany po stronie rządowej (reuse, crip)
Smart City (Poznań, Gdańsk, Warszawa)
Nowe inicjatywy społeczne:
Hackatony: BiHapi, KodujDlaPolski
MojaPolis.pl
NaszaKasa.org.pl
10
12. Droga do upublicznienia danych
Historia OpenPoland.net
System Rozwoju Gospodarczego Regionów
Monitor Rozwoju
Monitorowanie Strategii Miasta Gdynia
eRegion
Alert.Powodz.ngo.pl
MojaPolis.pl
MamZdanie.org.pl
11
13. Zapotrzebowanie na dane
Jestem specjalistą?
Analitycy
Socjologowie
Konsultanci biznesowi
Firmy ratingowe
Samorządy
Organizacje tworzące strategie
Strategia miasta składa się przykładowo z 300 wskaźników złożonych
Każdy z nich to przykładowo 10 wskaźników cząstkowych (np. GUS, Transport)
Każdy wskaźnik to setki tysięcy rekordów danych
13
14. Duuuża ilość danych
Posiadamy dane publiczne z:
GUS – ponad 134 milionów rekordów
Ministerstwa Finansów – prognozy finansowe, sprawozdania
finansowe
Okręgowe Komisje Egzaminacyjne – wyniki egzaminów
Urzędów/Izby Skarbowej – tak, dane z POLTAX
12
15. Skala problemu
POLTAX
Problem prawny
Skrypty SQL uruchamiane w każdym z US z osobna (każde woj. posiada
ich kilkadziesiąt)
Rezultat:
ok 150 płyt CD
Na każdym CD kilkaset plików XLS
Każdy plik w innym formacie
KILKA miesięcy pracy aby zaimportować dane
15
16. Skala problemu
GUS
Przykładowy wskaźnik: „Nowożeńcy”, wymiary:
płeć
grupy wiekowe (ok 5)
stanu cywilnego
miejsca zamieszkania przed ślubem
teryt
lata (2002-2013)
Rezultat: 162 624 - 134 miliony rekordów – ok. 1500 wskaźników
16
17. Otwartość po polsku
Stan technologiczny
Brak interoperacyjności i synchronizacji działań administracji
Skandaliczny poziom kompetencji przy tworzeniu założeń, wytwarzaniu
i wdrażaniu systemów Państwowych
Brak jakichkolwiek interfejsów integracji API systemów
informatycznych Państwa
Szokujący jest stan obecnych systemów informatycznych
17
20. OpenPoland.net
Wiedza, Technologia, Algorytmy, Narzędzia i
Infrastruktura pozwalająca na aktualizację oraz dbanie o
sensowność i spójność danych
20
21. Zapotrzebowanie na dane
Zwykły obywatel?
Czy mój kandydat na prezydenta
miasta mówi prawdę?
Za „mojej” kadencji spadło bezrobocie…
14
22. Proszę oto dane
Naprawdę? Nie spodziewałem się tego.
Upublicznione dane GUS
W drodze Ministerstwo Finansów
Status: beta - ostateczny kształt OP/API powinien być efektem pracy
społeczności skupionej wokół OP i spełniając jej oczekiwania i potrzeby
21
23. Dziękujemy za uwagę ;-)
Robert Olejnik
+48 791 91 91 11
robert@teonite.com
www.teonite.com
Jan Herbst
+48 502 086 412
Jan.herbst@stocznia.org.pl
www.Stocznia.org.pl