SlideShare a Scribd company logo
1 of 23
Download to read offline
ATVĒRTO DATU SAVLAICĪGUMS NACIONĀLAJOS ATVĒRTO DATU
PORTĀLOS AR PANDĒMIJU SAISTĪTIEM DATIEM:
GARŠ DATU CEĻŠ NO DATU PUBLICĒTĀJA LĪDZ DATU LIETOTĀJAM
Latvijas atvērto tehnoloģiju asociācijas 14. konference "KĀ PALIKT ATVĒRTIEM JAUNAJĀ LAIKMETĀ"​
Anastasija Ņikiforova, PhD​
Datorikas Fakultāte, Latvijas Universitāte​
LZP eksperte​
Anastasija.Nikiforova@lu.lv​
Complete
Primary
Accessible
Machine-
processable
Timely
Non-discriminatory
Non-proprietary
Licence-free
KAS IR ATVĒRTO DATU VEIKSMES
FAKTORI?
OGD kvalitāti noteicošie faktori
(pēc European Data Portal)
8 OGD principi
(pēc Open Data Charter)
KĀPĒC IR VĒRTS PĒTĪT?
Kāds ir labums pētniecībai? Kāds labums sabiedrībai?
 Savlaicīgums ir viens no primāriem atvērto datu principiem, kas tiek uzskatīts par vienu no galvenajiem atvērto
datu veiksmes faktoriem, taču vienlaicīgi tiek atzīts par galveno šķēršļi, jo tā neievērošana var samazināt lietotāju
uzticību datiem un pat "iznīcināt" viņu vēlmi izmantot visu atvērto datu portālu.
Sabiedrībai
saprast, vai un cik ātri tiek reaģēts
uz šādiem notikumiem, sabiedrībai
sniedzot aktuālu informāciju,
t.i. veicinot informētību
Pētniecībai
aspekta novērtējums ir ļoti netriviāls
uzdevums, kas vairākuma gadījumos kļūst
neiespējams ārējiem atvērto datu lietotājiem.
Kā rezultāts starptautiskos novērtējumos un indeksos
bieži vien šīs aspekts tiek "ignorēts"​​
KAM UN KĀDIEM NOLŪKIEM ATVĒRTIE DATI VAR
BŪT NODERĪGI?
ü situācijas apzināšanai
 datu virzītai lēmumpieņemšanai
 valdes lēmumu labākai izpratnei
ü slimības izplatīšanas izsekošanai
 plānošanai
 prognozēšanai
 ietekmes, cēloņu-seku un likumsakarību analīzei
 datu virzīto risinājumu izstrādei
 ieviesto lēmumu un ierobežojumu noteikšanai un izsekošanai
 citu datu kopu aktualizēšanai
 caurspīdīguma, uzskaitamības un
 uzticēšanos valdības lēmumiem veicināšanai
 un ļoti daudziem citiem nolūkiem ...
Attēla avots: https://4.bp.blogspot.com/-VA_zM5jXPvk/VxbRtA0U2JI/AAAAAAAACnY/WKvyQnAwvBIQOsjjLF0-TchL3EtD-q-
hQCLcB/s1600/actual%2Becosystem.png
KĀ TO VAR IZPĒTĪT?
2020. gads ir sniedzis iespēju izpētīt šos jautājumus, veicot ar pandēmiju saistītu atvērto datu analīzi,
analizējot attiecīgo atvērto datu kopu publicēšanos datumu pret konkrētājā valstī 1. noteikto
saslimšanas gadījumu.
Cik ātri OGD portāli reaģē uz ārkārtējām situācijām, atverot un atjaunojot datus
to turpmākai atkalizmantošanai, kas ir visai būtiski datu-virzītā pasaulē???
Pirmais gadījums, kad ir iespējams veikt vairāku valsts publicēto datu savlaicīguma savstarpējo
salīdzinājumu​
ANALĪZE
60 valstis un to nacionālo atvērto datu portālu analīze, nosakot:
0) vai valstij ir savs OGD portāls?
1) vai OGD portālā ir pieejami ar Covid-19 saistīties atvērtie dati?
2) vai tie tika nopublicēti savlaicīgi? - nosaka, salīdzinot 1. saslimšanas gadījuma datumu** dotajā valstī ar 1. datu
kopas publicēšanas datumu,
3) vai šie dati tiek regulāri atjaunināti?
4) vai dati ir pieejami mašīnlasāmā formātā?
5) vai dati ir pieejami European data portal (analizēts tikai ES valstīm)?
6) kuri portāli sniedz datus par datu kopu popularitāti un atkalizmantošanu?
7) ko šī informācija "saka" par atvērto datu vērtību?
Cik ātri OGD portāli reaģē uz ārkārtējām situācijām, atverot un atjaunojot COVID-19 datus
[kā vienu no augstās vērtības datu (High-value data) piemēriem]???​*
** COVID-19 pandemic by country and territory
*Pilnteksts: Nikiforova, A. (2020, October). Timeliness of Open Data in Open Government Data Portals Through
Pandemic-related Data: a long data way from the publisher to the user IEEE.
JAUTĀJUMI #0, #1
Sākotnējā datu kopa
60 valstis
Q0: vai valstij ir
savs OGD
portāls?
52 valstis
32 valstis
Q1: vai OGD
portālā ir pieejami
ar Covid-19
saistītie atvērtie
dati?
0) vai valstij ir savs OGD portāls?
1) vai OGD portālā ir pieejami ar Covid-19 saistītie atvērtie dati?
!!! Papildus šīs datu kopām piemīt tendence būt populārākām datu kopām
OGD portālos, tā kā tās aptver, iespējams, svarīgāko un aktuālāko tēmu
60 valsts sadalījums pēc OGD portālu esamības
un COVID-19 datu pieejamības tajos
Plašāk par OGD portālu lietojamību:
*Nikiforova, A. (2020). Comparative analysis of
national open data portals or whether your portal
is ready to bring benefits from open data. In
IADIS International Conference on ICT, Society and
Human Beings
*(raksta paplašinātā versija) Nikiforova, A., &
McBride, K. Open government data portal
usability: A user-centred usability analysis of 41
open government data portals. Telematics and
Informatics.
*A. Nikiforova, Latvijas Atvērto datu lietojamība,
LATA Informātīvais ziņojums
Pētījuma pilnteksts:
Nikiforova, A. (2020, October). Timeliness of
Open Data in Open Government Data Portals
Throug Pandemic-related Data: a long data way
from the publisher to the user IEEE.
Valsts
Publicēšanas
datums un
atjaunošanas
biežums *
Mašīn-
lasamība
*
Pirmais
Covid-19
gadījums
(FC)
Atvērto
datu
pieeja-
mība
Pirmais
pieminēju
ms
(DD/MM/YYY
Y)
Publicē-
šanas
datums
(ODA)
(DD/MM/20
20)
datu
kopu
skaits
FC/ODA
(-1,0,1)**
Bieži?
Mašīn-
lasāmi?
Francija 3,00 2,97 24.02. 1 09.09.2014 29.02. 106 1 jā jā
Spānija 2,91 2,09 31.01. 1 26.06.2018 n/a,marts 97 0 jā jā
Īrija 2,55 2,36 29.02. 1 31.03.2020 31.03. 11 -1 jā pamatā
Kipra 2,84 2,69 09.03. 1 18.12.2017 07.04. 19 0 jā jā
Somija 2,85 2,24 29.01. 0
Slovēnija 3,00 2,94 04.03. 0
Austrija 2,97 2,84 25.02. 1 25.02.2020 25.02. 16 1 nē jā
Rumānija 2,13 2,03 26.02. 0
Luksemburga 2,91 2,00 29.02. 1 02.04.2020 23.04. 29 -1 jā jā
Nīderlande 2,13 2,00 27.02. 1 n/a n/a 12 n/a jā ne
vienmēr
Latvija 2,90 2,10 02.03. 1 27.03.2020 6.04. 2 [-> 5] 0 jā jā
Polija 2,94 2,00 04.03. 1 20.05.2020 - 1 - no jā
Itālija 2,15 2,18 30.01. 1 01.03.2020 n/a, 01.03. 29 0 jā jā
Vācija 2,88 2,00 27.01. 1 25.03.2020 25.03. 11 -1 jā jā
Grieķija 2,28 2,00 26.02. 0
Horvātija 2,00 2,03 25.02. 1 28.04.2020 28.04. 1 -1 jā jā
Beļģija 1,94 2,00 04.02. 1 n/a n/a 17 n/a jā jā
Igaunija 3,00 2,06 27.02. 1 14.03.2020 14.03. 3 0 jā jā
Dānija 1,19 2,06 27.02. 1 16.03.2020 - 1 - nē nē
ANALĪZES REZULTĀTI (PART#1: 19 no 52)
Piezīmes:
dati uz 2020. gada augustu;
** FC/ODA - datu publicēšanas ātrums, kur
-1 - vairāk kā mēnesis, 0 - mazāk kā mēnesis,
1 – divu nedēļu laikā
PIEZĪMES#1
 14 valstis ir publicējušas dažas datu kopas, kas ir daļēji saistītas ar pandēmiju
(piemēram, informātīvie materiāli) pirms datu kopas, kas sniedz aktuālus datus par esošo
situāciju, kas var rādīt pievienoto vērtību
 4 valstis - Spānija, Francija Kipra un Šveice pielāgoja vai atjaunināja jau esošās datu kopas
ar Covid-19 datiem, tā kā pandēmija ir skarusi daudzus citus dzīves aspektus, un dažreiz
tādi dati kā publiskās vietas (to apmeklējums un apmeklējuma laiki), satiksme un citas arī
tika ietekmētas.
 Lai gan tā ir pozitīva iezīme vairākumam valstīm (ne tikai statistiskie, bet arī citi vērtīgi
datu avoti tika publicēti), 3 gadījumos – Polija, Dānija, Jaunzēlande – šie dati ir vienīgie, t.i.
Covid-19-specifiskie dati netika publicēti
JAUTĀJUMI #2, #3
Q3: Vai šie dati tiek regulāri atjaunināti?
Q2: vai tie tika nopublicēti savlaicīgi?
nosaka, salīdzinot 1. saslimšanas gadījuma datumu* dotajā
valstī ar 1. datu kopas publicēšanas datumu
Kopumā, ņemot vērā, ka šīs aspekts parasti ir
visproblemātiskākais gandrīz visiem atvērtajiem datiem, iegūtie
rezultāti ir relatīvi labi
nevar veikt secinājumus par datu aktualitāti ->
var negatīvi ietekmēt lietotāju interese un uzticība datiem
JAUTĀJUMS #4: vai dati ir pieejami mašīnlasāmā formātā?
 24 valstis sniedz datus mašīnlasāmā formātā, t.i. datiem var ātri un ērti piekļūt un apstrādāt tos bez papilddarbībām;
 Salīdzinot ar iepriekšējiem pētījumiem, tikai Šveice un Kanāda tika novērtēti augstāk nekā dotāja pētījumā, taču citām
valstīm šī tendence tika noteikta arī iepriekš.
 Daži portāli - ASV, Igaunijas, Kolombijas, Latvijas, Lietuvas, Luksemburgas, Zviedrijas, Vācijas, Horvātijas, Austrālijas,
Taivānas un Jauzelandes Covid-19 saistīto datu publicēšanā ir nodemonstrējuši vēl augstākus rezultātus!!!
BET! Šie portāli ir nopublicējuši ne tikai datus, bet arī
ārējās saites, likumus un ziņas, lai informētu savu
valsts iedzīvotājus pēc iespējas labāk
 7 valstis - Austrālija, Šveice, ASV, Kanāda, Nīderlande,
Irlande, Dienvidkoreja - reizēm sastopas ar dažiem
sarežģījumiem;
 2 valstīm šī ir lielāka problēma - .html uz citiem resursiem un
.pdf (tikai!), kas būtiski apgrūtina datu atkalizmantošanu
 30 portāli sniedz datu atkalizmantošanas piemeŗus, t.i. uz atvērtajiem datiem
balstītas lietotnes, pakalpojumi utt.
 Luksemburgai un Nīderlandei 6 datu kopas no 12 pieejamām tika
atkalizmantotas dažu nedēļu laikā pēc to publicēšanās
Viena no valstīm, kas sniedz ar Covid-19
saistītus datus tik ātri, cik vien ir iespējams – 5
dienas pēc 1. saslimšanas gadījumā valstī.
Augsts atvērto datu atkalizmantošanas skaits
var tikt vienkārši pamatojams ar lielisko iespēju,
kas ir sniegta visiem portāla lietotājiem – rīks,
kas ļauj interesentiem augšupielādēt viņu
lietošanas piemērus (angl. showcase, use-case),
tādējādi veicinot lietotāju iesaisti.
Franču, Austrijas un Šveices dati tika atvērti ļoti laicīgi, taču Taivānas un Luksemburgas dati kļuva pieejami
ar aizkāvi -> pandēmijas gadījumā, ņemot vērā tās “raksturu”, lietotājus pievelk un interese arī tie dati, kas
kļūst pieejami ar kavēšanām. Datu atjaunināšanas biežumam ir lielāka nozīme!
JAUTĀJUMS #4: kuri portāli sniedz datus par
datu kopu popularitāti un atkalizmantošanu?
Francija ir līderis, kura dati tika atkalizmantoti 129 169 (!!!)
risinājumu izstrādei
Kas ir tās veiksmes stāsts?​
VEIKSMES STĀSTI: FRANCIJA
Saite
VEIKSMES STĀSTI: SPĀNIJA
Saite
Saite
Kritiskais klausītājs: "nav brīnums! Viņu atvērto datu portāls jau
vairākus gadus ieņem līderpozīcijas EU27+ atvērto datu portālu
salīdzinājumā"
Saite
VEIKSMES STĀSTI: IGAUNIJA
Saite
KAS TRAUCĒ MUMS?
Q: Varbūt nav datu, ko vizualizēt?
A: Nē!
Q: Varbūt atvērtie dati sabiedrībai nav interesanti? Varbūt neviens
nenojauš, ka tie vispār ir?
A: Nē
Q: Varbūt tie neatbilst atvērto datu principiem? Nav mašīnlasāmie,
laicīgi utt.?
A: Nē!
Q: Varbūt tie nav aktuāli, t.i. netiek pastāvīgi atjaunināti?
A: Nē!
TOP-5 POPULĀRĀKAS ATVĒRTO DATU KOPAS LATVIJAS ATVĒRTO
DATU PORTĀLĀ​
KAS TRAUCĒ MUMS?
VAI TAD TIEŠĀM NAV ATKALIZMANTOŠANAS PIEMĒRU?
KĀPĒC?
Saite
Q: Vai tiešām nav neviena atkalizmantošanas piemēra? Vismaz Latvijas atvērto datu portālā
nevar atrast.
A: Ir! Piemēram, valsts kancelejas izstrādātājā vietnē https://covid19.gov.lv/ ir pieejami daži...
Q: Kāpēc mums ir mazāk kā citiem? Kam būtu jāizstrādā tie? Valdībai?
A: MUMS PAŠIEM!!! Atvērto datu* būtība paredz (un pasaules prakse liecina), ka atvērtos
datus drīkst izmantot ikviens interesents, t.sk. izstrādājot šādus risinājumus (vizualizācijas,
interaktīvās kartes, uz datiem balstītie palīgi utt.). Ir jāiesaistās pašiem!
Q: Kas būtu nepieciešams?
A: Dati, ideja (problēmas definīcija un ideja kā to risināt), iemaņas, radošums
** 28.01. dati par 13.01
Saite
* un Latvijas Atvērto datu portāla
datiem piemērojama licence​
KOPSAVILKUMS
Analīzes secinājumi
No 52 OGD portāliem tikai 32 sniedz ar Covid-19 saistītus datus ✓
4 valstis ir publicējušas datus 2 nedēļu laikā, vēl sešas atvēra tos mēneša laikā, savukārt vēl 14 portāliem
vajadzēja vairāk kā mēnesi, lai publicētu šos datus (parējās valstis nesniedz datus par datu kopas
publicēšanas datumiem)
✓
Vairākums portālu nodrošina datu mašīnlasāmību, taču dažām valstīm tas vēl joprojām sagādā problēmas ✓
Vairākums portālu regulāri atjauno datus, kamēr 6 valstīm tas sagādā problēmas, savukārt vēl joprojām
daudzas valstis nesniedz datus par datu kopu atjaunošanas biežumiem un pēdējo atjaunināšanas datumu,
kas var ietekmēt lietotāju vēlmi un gatavību izmantot datus
✓
Daži OGD portāli pandēmijas laikā reaģē lēnāk nekā ārpus ārkārtējām situācijām ✓
Dažos aspektos, piem., mašīnlasāmībā, vairākums OGD portālu demonstrē ievērojami labākus rezultātus
Ar Covid-19 saistītie dati izraisa lielu interesi portālu lietotājiem ✓
Ar Covid-19 saistītie dati tiek ļoti aktīvi izmantoti ???
 Atvērtie dati, kas tiek laicīgi publicēti un regulāri atjaunināti, izraisa lielāku interesi lietotājiem
un tiek izmantoti ne tikai situācijas apzināšanai, bet arī, lai rādītu labumus sabiedrībai kā to arī
paredz atvērtie dati.
 Datu atvēršanai tiek veikta [ir jātiek veiktai] ne tikai tāpēc ka tā ir mūsdienīgā tendence (trends),
bet arī tāpēc ka atvērto datu esamība ļauj sabiedrībai, zinātniekiem, pētniekiem un entuziastiem,
atkalizmantot tos, pārveidojot datus zināšanās un vērtībā, rādot risinājumus, kas maina un
uzlabo pasauli!!!
SECINĀJUMI
Laiks domāt! Laiks risināt! Laiks rādīt! Laiks mainīties un mainīt!
Palīdz atvērtajiem datiem izmainīt pasauli!
PALDIES PAR UZMANĪBU!
Vairāk informācijas par šo un citiem pētījumiem
sk. ResearchGate un anastasijanikiforova.com
Jautājumu vai neskaidrību gadījumā rakstiet
PhD Anastasijai Ņikiforovai
Anastasija.Nikiforova@lu.lv
Latvijas Universitātes Datorikas fakultātes pētniece,
Programmēšanas katedras docente
Latvijas Atvērto Tehnoloģiju Asociācijas asociētā biedre
Latvijas Zinātnes padomes eksperte

More Related Content

More from Anastasija Nikiforova

Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...
Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...
Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...Anastasija Nikiforova
 
Putting FAIR Principles in the Context of Research Information: FAIRness for ...
Putting FAIR Principles in the Context of Research Information: FAIRness for ...Putting FAIR Principles in the Context of Research Information: FAIRness for ...
Putting FAIR Principles in the Context of Research Information: FAIRness for ...Anastasija Nikiforova
 
Open data hackathon as a tool for increased engagement of Generation Z: to h...
Open data hackathon as a tool for increased engagement of Generation Z:  to h...Open data hackathon as a tool for increased engagement of Generation Z:  to h...
Open data hackathon as a tool for increased engagement of Generation Z: to h...Anastasija Nikiforova
 
Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...
Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...
Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...Anastasija Nikiforova
 
Combining Data Lake and Data Wrangling for Ensuring Data Quality in CRIS
Combining Data Lake and Data Wrangling for Ensuring Data Quality in CRISCombining Data Lake and Data Wrangling for Ensuring Data Quality in CRIS
Combining Data Lake and Data Wrangling for Ensuring Data Quality in CRISAnastasija Nikiforova
 
The role of open data in the development of sustainable smart cities and smar...
The role of open data in the development of sustainable smart cities and smar...The role of open data in the development of sustainable smart cities and smar...
The role of open data in the development of sustainable smart cities and smar...Anastasija Nikiforova
 
Data security as a top priority in the digital world: preserve data value by ...
Data security as a top priority in the digital world: preserve data value by ...Data security as a top priority in the digital world: preserve data value by ...
Data security as a top priority in the digital world: preserve data value by ...Anastasija Nikiforova
 
IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...
IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...
IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...Anastasija Nikiforova
 
Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...
Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...
Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...Anastasija Nikiforova
 
ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...
ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...
ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...Anastasija Nikiforova
 
OPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERS
OPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERSOPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERS
OPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERSAnastasija Nikiforova
 
Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...
Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...
Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...Anastasija Nikiforova
 
Towards enrichment of the open government data: a stakeholder-centered determ...
Towards enrichment of the open government data: a stakeholder-centered determ...Towards enrichment of the open government data: a stakeholder-centered determ...
Towards enrichment of the open government data: a stakeholder-centered determ...Anastasija Nikiforova
 
TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...
TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...
TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...Anastasija Nikiforova
 
Towards a Concurrence Analysis in Business Processes
Towards a Concurrence Analysis in Business ProcessesTowards a Concurrence Analysis in Business Processes
Towards a Concurrence Analysis in Business ProcessesAnastasija Nikiforova
 
DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...
DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...
DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...Anastasija Nikiforova
 
Assessment of the usability of Latvia’s open data portal or how close are we ...
Assessment of the usability of Latvia’s open data portal or how close are we ...Assessment of the usability of Latvia’s open data portal or how close are we ...
Assessment of the usability of Latvia’s open data portal or how close are we ...Anastasija Nikiforova
 
Comparative analysis of national open data portals or whether your portal is ...
Comparative analysis of national open data portals or whether your portal is ...Comparative analysis of national open data portals or whether your portal is ...
Comparative analysis of national open data portals or whether your portal is ...Anastasija Nikiforova
 
A step towards a data quality theory
 A step towards a data quality theory A step towards a data quality theory
A step towards a data quality theoryAnastasija Nikiforova
 
Analysis of open health data quality using data object-driven approach to dat...
Analysis of open health data quality using data object-driven approach to dat...Analysis of open health data quality using data object-driven approach to dat...
Analysis of open health data quality using data object-driven approach to dat...Anastasija Nikiforova
 

More from Anastasija Nikiforova (20)

Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...
Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...
Data Lake or Data Warehouse? Data Cleaning or Data Wrangling? How to Ensure t...
 
Putting FAIR Principles in the Context of Research Information: FAIRness for ...
Putting FAIR Principles in the Context of Research Information: FAIRness for ...Putting FAIR Principles in the Context of Research Information: FAIRness for ...
Putting FAIR Principles in the Context of Research Information: FAIRness for ...
 
Open data hackathon as a tool for increased engagement of Generation Z: to h...
Open data hackathon as a tool for increased engagement of Generation Z:  to h...Open data hackathon as a tool for increased engagement of Generation Z:  to h...
Open data hackathon as a tool for increased engagement of Generation Z: to h...
 
Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...
Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...
Barriers to Openly Sharing Government Data: Towards an Open Data-adapted Inno...
 
Combining Data Lake and Data Wrangling for Ensuring Data Quality in CRIS
Combining Data Lake and Data Wrangling for Ensuring Data Quality in CRISCombining Data Lake and Data Wrangling for Ensuring Data Quality in CRIS
Combining Data Lake and Data Wrangling for Ensuring Data Quality in CRIS
 
The role of open data in the development of sustainable smart cities and smar...
The role of open data in the development of sustainable smart cities and smar...The role of open data in the development of sustainable smart cities and smar...
The role of open data in the development of sustainable smart cities and smar...
 
Data security as a top priority in the digital world: preserve data value by ...
Data security as a top priority in the digital world: preserve data value by ...Data security as a top priority in the digital world: preserve data value by ...
Data security as a top priority in the digital world: preserve data value by ...
 
IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...
IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...
IoTSE-based Open Database Vulnerability inspection in three Baltic Countries:...
 
Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...
Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...
Stakeholder-centred Identification of Data Quality Issues: Knowledge that Can...
 
ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...
ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...
ShoBeVODSDT: Shodan and Binary Edge based vulnerable open data sources detect...
 
OPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERS
OPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERSOPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERS
OPEN DATA: ECOSYSTEM, CURRENT AND FUTURE TRENDS, SUCCESS STORIES AND BARRIERS
 
Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...
Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...
Invited talk "Open Data as a driver of Society 5.0: how you and your scientif...
 
Towards enrichment of the open government data: a stakeholder-centered determ...
Towards enrichment of the open government data: a stakeholder-centered determ...Towards enrichment of the open government data: a stakeholder-centered determ...
Towards enrichment of the open government data: a stakeholder-centered determ...
 
TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...
TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...
TIMELINESS OF OPEN DATA IN OPEN GOVERNMENT DATA PORTALS THROUGH PANDEMIC-RELA...
 
Towards a Concurrence Analysis in Business Processes
Towards a Concurrence Analysis in Business ProcessesTowards a Concurrence Analysis in Business Processes
Towards a Concurrence Analysis in Business Processes
 
DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...
DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...
DATA QUALITY MODEL-BASED TESTING OF INFORMATION SYSTEMS: THE USE-CASE OF E-SC...
 
Assessment of the usability of Latvia’s open data portal or how close are we ...
Assessment of the usability of Latvia’s open data portal or how close are we ...Assessment of the usability of Latvia’s open data portal or how close are we ...
Assessment of the usability of Latvia’s open data portal or how close are we ...
 
Comparative analysis of national open data portals or whether your portal is ...
Comparative analysis of national open data portals or whether your portal is ...Comparative analysis of national open data portals or whether your portal is ...
Comparative analysis of national open data portals or whether your portal is ...
 
A step towards a data quality theory
 A step towards a data quality theory A step towards a data quality theory
A step towards a data quality theory
 
Analysis of open health data quality using data object-driven approach to dat...
Analysis of open health data quality using data object-driven approach to dat...Analysis of open health data quality using data object-driven approach to dat...
Analysis of open health data quality using data object-driven approach to dat...
 

ATVĒRTO DATU SAVLAICĪGUMS NACIONĀLAJOS ATVĒRTO DATU PORTĀLOS AR PANDĒMIJU SAISTĪTIEM DATIEM: GARŠ DATU CEĻŠ NO DATU PUBLICĒTĀJA LĪDZ DATU LIETOTĀJAM

  • 1. ATVĒRTO DATU SAVLAICĪGUMS NACIONĀLAJOS ATVĒRTO DATU PORTĀLOS AR PANDĒMIJU SAISTĪTIEM DATIEM: GARŠ DATU CEĻŠ NO DATU PUBLICĒTĀJA LĪDZ DATU LIETOTĀJAM Latvijas atvērto tehnoloģiju asociācijas 14. konference "KĀ PALIKT ATVĒRTIEM JAUNAJĀ LAIKMETĀ"​ Anastasija Ņikiforova, PhD​ Datorikas Fakultāte, Latvijas Universitāte​ LZP eksperte​ Anastasija.Nikiforova@lu.lv​
  • 2. Complete Primary Accessible Machine- processable Timely Non-discriminatory Non-proprietary Licence-free KAS IR ATVĒRTO DATU VEIKSMES FAKTORI? OGD kvalitāti noteicošie faktori (pēc European Data Portal) 8 OGD principi (pēc Open Data Charter)
  • 3. KĀPĒC IR VĒRTS PĒTĪT? Kāds ir labums pētniecībai? Kāds labums sabiedrībai?  Savlaicīgums ir viens no primāriem atvērto datu principiem, kas tiek uzskatīts par vienu no galvenajiem atvērto datu veiksmes faktoriem, taču vienlaicīgi tiek atzīts par galveno šķēršļi, jo tā neievērošana var samazināt lietotāju uzticību datiem un pat "iznīcināt" viņu vēlmi izmantot visu atvērto datu portālu. Sabiedrībai saprast, vai un cik ātri tiek reaģēts uz šādiem notikumiem, sabiedrībai sniedzot aktuālu informāciju, t.i. veicinot informētību Pētniecībai aspekta novērtējums ir ļoti netriviāls uzdevums, kas vairākuma gadījumos kļūst neiespējams ārējiem atvērto datu lietotājiem. Kā rezultāts starptautiskos novērtējumos un indeksos bieži vien šīs aspekts tiek "ignorēts"​​
  • 4. KAM UN KĀDIEM NOLŪKIEM ATVĒRTIE DATI VAR BŪT NODERĪGI? ü situācijas apzināšanai  datu virzītai lēmumpieņemšanai  valdes lēmumu labākai izpratnei ü slimības izplatīšanas izsekošanai  plānošanai  prognozēšanai  ietekmes, cēloņu-seku un likumsakarību analīzei  datu virzīto risinājumu izstrādei  ieviesto lēmumu un ierobežojumu noteikšanai un izsekošanai  citu datu kopu aktualizēšanai  caurspīdīguma, uzskaitamības un  uzticēšanos valdības lēmumiem veicināšanai  un ļoti daudziem citiem nolūkiem ... Attēla avots: https://4.bp.blogspot.com/-VA_zM5jXPvk/VxbRtA0U2JI/AAAAAAAACnY/WKvyQnAwvBIQOsjjLF0-TchL3EtD-q- hQCLcB/s1600/actual%2Becosystem.png
  • 5. KĀ TO VAR IZPĒTĪT? 2020. gads ir sniedzis iespēju izpētīt šos jautājumus, veicot ar pandēmiju saistītu atvērto datu analīzi, analizējot attiecīgo atvērto datu kopu publicēšanos datumu pret konkrētājā valstī 1. noteikto saslimšanas gadījumu. Cik ātri OGD portāli reaģē uz ārkārtējām situācijām, atverot un atjaunojot datus to turpmākai atkalizmantošanai, kas ir visai būtiski datu-virzītā pasaulē??? Pirmais gadījums, kad ir iespējams veikt vairāku valsts publicēto datu savlaicīguma savstarpējo salīdzinājumu​
  • 6. ANALĪZE 60 valstis un to nacionālo atvērto datu portālu analīze, nosakot: 0) vai valstij ir savs OGD portāls? 1) vai OGD portālā ir pieejami ar Covid-19 saistīties atvērtie dati? 2) vai tie tika nopublicēti savlaicīgi? - nosaka, salīdzinot 1. saslimšanas gadījuma datumu** dotajā valstī ar 1. datu kopas publicēšanas datumu, 3) vai šie dati tiek regulāri atjaunināti? 4) vai dati ir pieejami mašīnlasāmā formātā? 5) vai dati ir pieejami European data portal (analizēts tikai ES valstīm)? 6) kuri portāli sniedz datus par datu kopu popularitāti un atkalizmantošanu? 7) ko šī informācija "saka" par atvērto datu vērtību? Cik ātri OGD portāli reaģē uz ārkārtējām situācijām, atverot un atjaunojot COVID-19 datus [kā vienu no augstās vērtības datu (High-value data) piemēriem]???​* ** COVID-19 pandemic by country and territory *Pilnteksts: Nikiforova, A. (2020, October). Timeliness of Open Data in Open Government Data Portals Through Pandemic-related Data: a long data way from the publisher to the user IEEE.
  • 7. JAUTĀJUMI #0, #1 Sākotnējā datu kopa 60 valstis Q0: vai valstij ir savs OGD portāls? 52 valstis 32 valstis Q1: vai OGD portālā ir pieejami ar Covid-19 saistītie atvērtie dati? 0) vai valstij ir savs OGD portāls? 1) vai OGD portālā ir pieejami ar Covid-19 saistītie atvērtie dati? !!! Papildus šīs datu kopām piemīt tendence būt populārākām datu kopām OGD portālos, tā kā tās aptver, iespējams, svarīgāko un aktuālāko tēmu 60 valsts sadalījums pēc OGD portālu esamības un COVID-19 datu pieejamības tajos
  • 8. Plašāk par OGD portālu lietojamību: *Nikiforova, A. (2020). Comparative analysis of national open data portals or whether your portal is ready to bring benefits from open data. In IADIS International Conference on ICT, Society and Human Beings *(raksta paplašinātā versija) Nikiforova, A., & McBride, K. Open government data portal usability: A user-centred usability analysis of 41 open government data portals. Telematics and Informatics. *A. Nikiforova, Latvijas Atvērto datu lietojamība, LATA Informātīvais ziņojums Pētījuma pilnteksts: Nikiforova, A. (2020, October). Timeliness of Open Data in Open Government Data Portals Throug Pandemic-related Data: a long data way from the publisher to the user IEEE. Valsts Publicēšanas datums un atjaunošanas biežums * Mašīn- lasamība * Pirmais Covid-19 gadījums (FC) Atvērto datu pieeja- mība Pirmais pieminēju ms (DD/MM/YYY Y) Publicē- šanas datums (ODA) (DD/MM/20 20) datu kopu skaits FC/ODA (-1,0,1)** Bieži? Mašīn- lasāmi? Francija 3,00 2,97 24.02. 1 09.09.2014 29.02. 106 1 jā jā Spānija 2,91 2,09 31.01. 1 26.06.2018 n/a,marts 97 0 jā jā Īrija 2,55 2,36 29.02. 1 31.03.2020 31.03. 11 -1 jā pamatā Kipra 2,84 2,69 09.03. 1 18.12.2017 07.04. 19 0 jā jā Somija 2,85 2,24 29.01. 0 Slovēnija 3,00 2,94 04.03. 0 Austrija 2,97 2,84 25.02. 1 25.02.2020 25.02. 16 1 nē jā Rumānija 2,13 2,03 26.02. 0 Luksemburga 2,91 2,00 29.02. 1 02.04.2020 23.04. 29 -1 jā jā Nīderlande 2,13 2,00 27.02. 1 n/a n/a 12 n/a jā ne vienmēr Latvija 2,90 2,10 02.03. 1 27.03.2020 6.04. 2 [-> 5] 0 jā jā Polija 2,94 2,00 04.03. 1 20.05.2020 - 1 - no jā Itālija 2,15 2,18 30.01. 1 01.03.2020 n/a, 01.03. 29 0 jā jā Vācija 2,88 2,00 27.01. 1 25.03.2020 25.03. 11 -1 jā jā Grieķija 2,28 2,00 26.02. 0 Horvātija 2,00 2,03 25.02. 1 28.04.2020 28.04. 1 -1 jā jā Beļģija 1,94 2,00 04.02. 1 n/a n/a 17 n/a jā jā Igaunija 3,00 2,06 27.02. 1 14.03.2020 14.03. 3 0 jā jā Dānija 1,19 2,06 27.02. 1 16.03.2020 - 1 - nē nē ANALĪZES REZULTĀTI (PART#1: 19 no 52) Piezīmes: dati uz 2020. gada augustu; ** FC/ODA - datu publicēšanas ātrums, kur -1 - vairāk kā mēnesis, 0 - mazāk kā mēnesis, 1 – divu nedēļu laikā
  • 9. PIEZĪMES#1  14 valstis ir publicējušas dažas datu kopas, kas ir daļēji saistītas ar pandēmiju (piemēram, informātīvie materiāli) pirms datu kopas, kas sniedz aktuālus datus par esošo situāciju, kas var rādīt pievienoto vērtību  4 valstis - Spānija, Francija Kipra un Šveice pielāgoja vai atjaunināja jau esošās datu kopas ar Covid-19 datiem, tā kā pandēmija ir skarusi daudzus citus dzīves aspektus, un dažreiz tādi dati kā publiskās vietas (to apmeklējums un apmeklējuma laiki), satiksme un citas arī tika ietekmētas.  Lai gan tā ir pozitīva iezīme vairākumam valstīm (ne tikai statistiskie, bet arī citi vērtīgi datu avoti tika publicēti), 3 gadījumos – Polija, Dānija, Jaunzēlande – šie dati ir vienīgie, t.i. Covid-19-specifiskie dati netika publicēti
  • 10. JAUTĀJUMI #2, #3 Q3: Vai šie dati tiek regulāri atjaunināti? Q2: vai tie tika nopublicēti savlaicīgi? nosaka, salīdzinot 1. saslimšanas gadījuma datumu* dotajā valstī ar 1. datu kopas publicēšanas datumu Kopumā, ņemot vērā, ka šīs aspekts parasti ir visproblemātiskākais gandrīz visiem atvērtajiem datiem, iegūtie rezultāti ir relatīvi labi nevar veikt secinājumus par datu aktualitāti -> var negatīvi ietekmēt lietotāju interese un uzticība datiem
  • 11. JAUTĀJUMS #4: vai dati ir pieejami mašīnlasāmā formātā?  24 valstis sniedz datus mašīnlasāmā formātā, t.i. datiem var ātri un ērti piekļūt un apstrādāt tos bez papilddarbībām;  Salīdzinot ar iepriekšējiem pētījumiem, tikai Šveice un Kanāda tika novērtēti augstāk nekā dotāja pētījumā, taču citām valstīm šī tendence tika noteikta arī iepriekš.  Daži portāli - ASV, Igaunijas, Kolombijas, Latvijas, Lietuvas, Luksemburgas, Zviedrijas, Vācijas, Horvātijas, Austrālijas, Taivānas un Jauzelandes Covid-19 saistīto datu publicēšanā ir nodemonstrējuši vēl augstākus rezultātus!!! BET! Šie portāli ir nopublicējuši ne tikai datus, bet arī ārējās saites, likumus un ziņas, lai informētu savu valsts iedzīvotājus pēc iespējas labāk  7 valstis - Austrālija, Šveice, ASV, Kanāda, Nīderlande, Irlande, Dienvidkoreja - reizēm sastopas ar dažiem sarežģījumiem;  2 valstīm šī ir lielāka problēma - .html uz citiem resursiem un .pdf (tikai!), kas būtiski apgrūtina datu atkalizmantošanu
  • 12.  30 portāli sniedz datu atkalizmantošanas piemeŗus, t.i. uz atvērtajiem datiem balstītas lietotnes, pakalpojumi utt.  Luksemburgai un Nīderlandei 6 datu kopas no 12 pieejamām tika atkalizmantotas dažu nedēļu laikā pēc to publicēšanās Viena no valstīm, kas sniedz ar Covid-19 saistītus datus tik ātri, cik vien ir iespējams – 5 dienas pēc 1. saslimšanas gadījumā valstī. Augsts atvērto datu atkalizmantošanas skaits var tikt vienkārši pamatojams ar lielisko iespēju, kas ir sniegta visiem portāla lietotājiem – rīks, kas ļauj interesentiem augšupielādēt viņu lietošanas piemērus (angl. showcase, use-case), tādējādi veicinot lietotāju iesaisti. Franču, Austrijas un Šveices dati tika atvērti ļoti laicīgi, taču Taivānas un Luksemburgas dati kļuva pieejami ar aizkāvi -> pandēmijas gadījumā, ņemot vērā tās “raksturu”, lietotājus pievelk un interese arī tie dati, kas kļūst pieejami ar kavēšanām. Datu atjaunināšanas biežumam ir lielāka nozīme! JAUTĀJUMS #4: kuri portāli sniedz datus par datu kopu popularitāti un atkalizmantošanu? Francija ir līderis, kura dati tika atkalizmantoti 129 169 (!!!) risinājumu izstrādei Kas ir tās veiksmes stāsts?​
  • 14. VEIKSMES STĀSTI: SPĀNIJA Saite Saite Kritiskais klausītājs: "nav brīnums! Viņu atvērto datu portāls jau vairākus gadus ieņem līderpozīcijas EU27+ atvērto datu portālu salīdzinājumā" Saite
  • 16.
  • 17.
  • 18. KAS TRAUCĒ MUMS? Q: Varbūt nav datu, ko vizualizēt? A: Nē! Q: Varbūt atvērtie dati sabiedrībai nav interesanti? Varbūt neviens nenojauš, ka tie vispār ir? A: Nē Q: Varbūt tie neatbilst atvērto datu principiem? Nav mašīnlasāmie, laicīgi utt.? A: Nē! Q: Varbūt tie nav aktuāli, t.i. netiek pastāvīgi atjaunināti? A: Nē! TOP-5 POPULĀRĀKAS ATVĒRTO DATU KOPAS LATVIJAS ATVĒRTO DATU PORTĀLĀ​
  • 20. VAI TAD TIEŠĀM NAV ATKALIZMANTOŠANAS PIEMĒRU? KĀPĒC? Saite Q: Vai tiešām nav neviena atkalizmantošanas piemēra? Vismaz Latvijas atvērto datu portālā nevar atrast. A: Ir! Piemēram, valsts kancelejas izstrādātājā vietnē https://covid19.gov.lv/ ir pieejami daži... Q: Kāpēc mums ir mazāk kā citiem? Kam būtu jāizstrādā tie? Valdībai? A: MUMS PAŠIEM!!! Atvērto datu* būtība paredz (un pasaules prakse liecina), ka atvērtos datus drīkst izmantot ikviens interesents, t.sk. izstrādājot šādus risinājumus (vizualizācijas, interaktīvās kartes, uz datiem balstītie palīgi utt.). Ir jāiesaistās pašiem! Q: Kas būtu nepieciešams? A: Dati, ideja (problēmas definīcija un ideja kā to risināt), iemaņas, radošums ** 28.01. dati par 13.01 Saite * un Latvijas Atvērto datu portāla datiem piemērojama licence​
  • 21. KOPSAVILKUMS Analīzes secinājumi No 52 OGD portāliem tikai 32 sniedz ar Covid-19 saistītus datus ✓ 4 valstis ir publicējušas datus 2 nedēļu laikā, vēl sešas atvēra tos mēneša laikā, savukārt vēl 14 portāliem vajadzēja vairāk kā mēnesi, lai publicētu šos datus (parējās valstis nesniedz datus par datu kopas publicēšanas datumiem) ✓ Vairākums portālu nodrošina datu mašīnlasāmību, taču dažām valstīm tas vēl joprojām sagādā problēmas ✓ Vairākums portālu regulāri atjauno datus, kamēr 6 valstīm tas sagādā problēmas, savukārt vēl joprojām daudzas valstis nesniedz datus par datu kopu atjaunošanas biežumiem un pēdējo atjaunināšanas datumu, kas var ietekmēt lietotāju vēlmi un gatavību izmantot datus ✓ Daži OGD portāli pandēmijas laikā reaģē lēnāk nekā ārpus ārkārtējām situācijām ✓ Dažos aspektos, piem., mašīnlasāmībā, vairākums OGD portālu demonstrē ievērojami labākus rezultātus Ar Covid-19 saistītie dati izraisa lielu interesi portālu lietotājiem ✓ Ar Covid-19 saistītie dati tiek ļoti aktīvi izmantoti ???
  • 22.  Atvērtie dati, kas tiek laicīgi publicēti un regulāri atjaunināti, izraisa lielāku interesi lietotājiem un tiek izmantoti ne tikai situācijas apzināšanai, bet arī, lai rādītu labumus sabiedrībai kā to arī paredz atvērtie dati.  Datu atvēršanai tiek veikta [ir jātiek veiktai] ne tikai tāpēc ka tā ir mūsdienīgā tendence (trends), bet arī tāpēc ka atvērto datu esamība ļauj sabiedrībai, zinātniekiem, pētniekiem un entuziastiem, atkalizmantot tos, pārveidojot datus zināšanās un vērtībā, rādot risinājumus, kas maina un uzlabo pasauli!!! SECINĀJUMI Laiks domāt! Laiks risināt! Laiks rādīt! Laiks mainīties un mainīt! Palīdz atvērtajiem datiem izmainīt pasauli!
  • 23. PALDIES PAR UZMANĪBU! Vairāk informācijas par šo un citiem pētījumiem sk. ResearchGate un anastasijanikiforova.com Jautājumu vai neskaidrību gadījumā rakstiet PhD Anastasijai Ņikiforovai Anastasija.Nikiforova@lu.lv Latvijas Universitātes Datorikas fakultātes pētniece, Programmēšanas katedras docente Latvijas Atvērto Tehnoloģiju Asociācijas asociētā biedre Latvijas Zinātnes padomes eksperte