Open Data - zarządzanie danymi w projektach badawczych NCN
Open Access – rewolucja w dostępie? prof. Marek Niezgódka, ICM UW
1. Open Access – rewolucja
w dostępie?
Marek Niezgódka
ICM, Uniwersytet Warszawski
marekn@icm.edu.pl
Politechnika Wrocławska, 14 listopada 2014
2. Zamiast genezy:
Kant (1795): ~ globalizacja promuje dyfuzję idei demokratycznych
Henri Bergson (1932): koncepcja Otwartego Społeczeństwa
Karl Popper (1945): The Open Society and its Enemies
Joseph Stiglitz (Nobel 2001): wiedza jako globalne dobro publiczne
Prezentacja jest dostępna na licencji Creative Commons – Uznanie autorstwa 3.0
Polska (http://creativecommons.org/licenses/by/3.0/pl/legalcode)
2
3. Joseph Stiglitz (Nobel ekonomia, 2001)
Joseph Stiglitz and the World Bank: The Rebel Within
• … The worry is that open discussions will inhibit free expression of ideas …
• Triada: Scientific communication and Open Society & impact of electronic forms
Economics Commons (Digital Commons Network: Social and Behavioral Sciences)
Wykład 11.11.2014: On knowledge, scholarly open access and copyright
(Central European University, Budapeszt)
Właściwy tytuł: “Can Illiberal Democracies Create Shared and Sustained Prosperity?”
• Miejsce tradycyjnych wydawnictw naukowych
• Copyright (70 lat ochrony – powód: Mickey Mouse)
• “we ought to think about knowledge as a global public good,” a wszelkie ograniczenia jej wolnego
przepływu powinny być postrzegane jako ekonomicznie szkodliwe
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
3
4. Otwarty dostęp – gdzie jesteśmy
• Peter Suber w książce „Otwarty dostęp” (The
MIT Press, Cambridge–London 2012), nazwał
Open Access rewolucją w dostępie.
• Dziś otwarty dostęp nie stanowi już rewolucji –
staje się sukcesywnie standardem komunikacji
naukowej na świecie
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 4
5. Open Access: wczesne stadium
1994 US Digital Libraries Initiative
(PL: 1996 Biblioteka Wirtualna Nauki)
1999 Deklaracja: Science and the Use of Scientific Knowledge (UNESCO)
2001 Deklaracja Public Library of Science
2002 Budapest Open Access Initiative & Creative Commons
2003 Bethesda Statement on Open Access Publishing
Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities
US Act on Public Access to Science
2004 OECD: Declaration on Access to Research Data from Public Funding
2005 NIH: Policy on Enhancing Public Access to Archived Publications
2006: UK Research Council: Statement on Open Access
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
5
6. Z preambuły Deklaracji Berlińskiej:
… The Internet has fundamentally changed the practical and economic
realities of distributing scientific knowledge and cultural heritage. For
the first time ever, the Internet now offers the chance to constitute a
global and interactive representation of human knowledge, including
cultural heritage and the guarantee of worldwide access …
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
6
7. Dylemat: Open czy Free?
• Open: access, source, courseware, education, …
• Free: określa swobodę użytkowania
• Richard Stallman:
• Open software: metodologia rozwoju
• Free software: ruch społeczny
Punkt widzenia: publikacje naukowe - rodzaj danych naukowych
- integralny element kompletnego cyklu badawczego
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
7
8. Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
9. Wspieranie otwartego dostępu przez KE
• Neelie Kroes – wiceprzewodnicząca Komisji Europejskiej i komisarz ds.
agendy cyfrowej, marzec 2013:
„[…] we will require open access to all publications stemming from EU-funded
research. […] we will progressively open access to the research
data, too. And […] we're asking national funding bodies to do the same.”
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 9
10. Raport na zamówienie KE (sierpień 2013):
Máire Geoghegan-Quinn – komisarz ds.
badań, innowacji i nauki:
„Analiza ta potwierdza, że otwarty dostęp na
dobre zakorzenił się w dzisiejszym świecie.”
:
„Europejski podatnik nie powinien płacić dwa razy za badania opłacone ze środków
publicznych. Dlatego uznaliśmy za oczywisty wymóg otwartego dostępu do publikacji,
które powstały przy wykorzystaniu środków z programu Horyzont 2020 – kolejnego
programu unijnego wspierającego badania i innowacje.”
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
10
11. Otwarty dostęp w politykach uczelni
• Polityki otwartości są wdrażane przez najlepsze uczelnie:
• Harvard University,
• Princeton University,
• Massachusetts Institute of Technology
• Politechnika Federalna w Zurychu
• …………
• Dziś do grona Otwartych Uczelni dołącza Politechnika Wrocławska
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
11
12. Repozytoria instytucjonalne – rola
w dystrybucji wiedzy naukowej
• Realizacja społecznej misji uczelni, jaką jest tworzenie i
upowszechnianie wiedzy, która jest dobrem publicznym
• Umożliwienie realizacji „zielonej drogi” otwartego dostępu
• Wpływ na ekonomiczne aspekty komunikacji naukowej –
przeciwdziałania barierze dostępności
• Sukcesywna zmiana układu sił w globalnym systemie produkcji i
dystrybucji wiedzy naukowej
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
12
13. Repozytoria na świecie - wyzwania
• Konsolidacja roli repozytoriów instytucjonalnych w komunikacji
naukowej (green Open Access vs. gold Open Access)
• Kształtowanie wspólnej wizji dotyczącej widoczności zasobów, roli,
interoperacyjności i kierunków rozwoju e-infrastruktury
repozytoryjnej na świecie
• Tworzenie i upowszechnianie wspólnych standardów dotyczących
udostępniania otwartych danych
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
13
14. Tradycyjny model nauki
Mechanizmy funkcjonowania, finansowania i ewaluacji promują „zamkniętą” naukę
zinstytucjonalizowaną
Twórczość naukowa mierzona:
liczbą publikacji w wydawnictwach komercyjnych o wysokim indeksie oddziaływania
(impact factor)
indeksami cytowań
Przykłady działań nie objętych ewaluacją:
budowanie kolekcji danych badawczych
tworzenie oprogramowania naukowego
tworzenie innych form dokumentacji naukowej
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
14
15. Otwarta Nauka: atrybuty
Otwartość i przejrzystość systemu komunikacji naukowej (publikacje, inne
formy dokumentacji)
Otwartość i możliwość wtórnego użycia danych badawczych
Internetowe mechanizmy umożliwiające współpracę naukową
Działalność finansowana ze środków publicznych ↔ zobowiązanie
publiczne
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
15
16. Nowe modele komunikacji naukowej
• Otwartość, wyrażająca usuwanie ograniczeń i barier ekonomicznych, politycznych i
administracyjnych
• Przejrzystość, a w ślad za nią demokratyzacja
• Normy prawne czasu komunikacji elektronicznej podejmują zmiany aż do poziomu
podstawowych paradygmatów
• Nowe technologie w formule born digital
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
16
17. Rozwój e-infrastruktur: konsekwencje
Wielkie infrastruktury badawcze:
• programy międzynarodowe (ESFRI, ESA, PR UE)
• krajowe (USA, WB, RFN, … , Polska)
• Rewolucja e-infrastruktur:
• transformacja całego systemu komunikacji naukowej
• możliwość pozainstytucjonalnych form współpracy
• rewolucja paradygmatów obliczeń i przetwarzania danych
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
17
18. Europa: Agenda Cyfrowa 2020
17.07.2012: Rekomendacja Komisji Europejskiej dot. dostępu do treści i danych
naukowych --- przełom
Horyzont 2020: publikacyjny mandat otwarty
Okres testowo-demonstracyjny: otwarte dane badawcze
UWAGA: sama koncepcja danych badawczych!!!
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
18
19. Otwarty dostęp do zasobów
edukacyjnych – kolejny krok w stronę
otwartości
• W serwisie Komisji Europejskiej Open Education Europa zarejestrowanych
jest już ponad 350 MOOC z krajów UE
• We Francji powstał Francuski Uniwersytet Cyfrowy, utworzona ze środków
publicznych platforma oferująca kursy online
• Dynamiczny rozwój Massive Open Online Courses na amerykańskich
uniwersytetach – dziesiątki studentów z całego świata
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
19
20. Otwarty dostęp w Polsce
• Wg danych z raportu „Otwarta nauka w Polsce 2014.
Diagnoza”, prawie połowa (49%) spośród niemal 2000
czasopism punktowanych z wykazu MNiSW udostępnia
swoje bieżące numery bezpłatnie w Internecie.
• Wzrasta popularność praktyk otwartościowych wśród
badaczy: 59% przebadanych naukowców przynajmniej raz
udostępniło w sposób otwarty swoją pracę, choć tylko
niespełna 12% z nich robi to regularnie.
• 74% respondentów popiera udostępnianie w sposób
otwarty wyników wszystkich badań naukowych
finansowanych ze środków publicznych.
• Powstają pierwsze repozytoria instytucjonalne i
dziedzinowe, w których naukowcy mogą umieszczać swoje
prace (artykuły, książki, rozprawy doktorskie czy raporty) –
jest ich obecnie 22.
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 20
21. Otwarty dostęp w Polsce – wyzwania
• Polityki instytucji naukowych – repozytoria powstają na niewielką
skalę, jeszcze rzadszym rozwiązaniem jest wdrażanie polityk
otwartości
• Wspólna wizja instytucji finansujących badania i rządowych, która
wzmocniłyby lokalne i oddolne inicjatywy, włączając je w
systematyczne działania na skalę krajową.
• Centralna infrastruktura otwartego dostępu, która będzie działała na
skalę ogólnopolską zapewniając z jednego miejsca dostęp do
wszystkich otwartych zasobów
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
21
22. Inicjatywy ICM na rzecz
wspierania Otwartej Nauki
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 22
23. Infona – system komunikacji naukowej
• Umożliwia dostęp do publikacji z różnych obszarów wiedzy – zawiera
zarówno publikacje z istniejących już kolekcji (np. baz czasopism oraz
zasoby licencjonowane), jak i treści zdeponowane i udostępnione przez
samych naukowców – użytkowników serwisu
• Dzięki funkcjom komunikacyjnym ułatwia także współpracę, wymianę
wiedzy, opinii i doświadczeń w środowisku naukowym
• Treści dostępne w serwisie to zebrane w jednym miejscu otwarte polskie
treści naukowe oraz licencjonowane zasoby zagraniczne, w tym 10 mln.
artykułów naukowych i 13 tys. książek
• Przydatne funkcjonalności usprawniają pracę naukową (deponowanie i
przeszukiwanie tekstowe treści wideo, Wirtualne Laboratorium
Transkrypcji, praca grupowa, tworzenie kolekcji publikacji i list „do
przeczytania”)
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
23
24. Platforma Otwartej Nauki
• Platforma Otwartej Nauki to centrum kompetencji w zakresie otwartych modeli
komunikacji naukowej i dystrybucji wiedzy, ośrodek oferujący rozwiązania i
narzędzia umożliwiające wdrażanie tych modeli, a także cyfrowa kolekcja polskich
publikacji naukowych.
• Wsparcie dla uczelni i instytucji we wdrażaniu otwartych modeli komunikacji:
doradztwo, pakiet repozytoryjny dla uczelni zawierający polską wersję
oprogramowania DSpace oraz wzory dokumentów ułatwiających wdrażanie
polityki otwartości
• Zasoby udostępniane w serwisach Platformy Otwartej Nauki to polskie
czasopisma naukowe (Biblioteka Nauki), książki naukowe (Otwórz Książkę) oraz
różnego rodzaju prace naukowe – przede wszystkim artykuły – deponowane przez
ich autorów (Repozytorium CeON).
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
24
25. Biblioteka Nauki – polskie otwarte czasopisma
• Biblioteka Nauki to serwis, w
którym we współpracy z bazami
bibliograficznymi (BazTech, Agro,
CEJSH, PSJD i DML PL)
udostępniane są polskie,
otwarte czasopisma naukowe.
• Obecnie w serwisie dostępne są
w wersji pełnotekstowej
392 czasopisma naukowe
(70723 artykuły), a umowami
objętych jest 409 czasopism.
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 25
26. Otwórz Książkę – książki naukowe w otwartym
dostępie
• „Otwórz Książkę” to cyfrowa
kolekcja publikacji naukowych.
• Już 212 autorów udostępniło w
niej swoje książki
• Obecnie kolekcja liczy
316 książek, które można pobrać
lub przeczytać w serwisie.
• Najbardziej popularne mają
ponad 10 000 pobrań
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 26
27. Repozytorium Centrum Otwartej Nauki (CeON)
• Zapewnia polskim naukowcom
możliwość prostego i szybkiego
umieszczenia prac naukowych w
otwartym dostępie.
• Z tej możliwości skorzystało już
3268 autorów, którzy udostępnili
4541 prac, w tym:
• 3407 artykułów,
• 668 książek,
• 18 doktoratów,
• 117 materiałów konferencyjnych
• 50 raportów.
• Dzięki temu ich publikacje są lepiej
widoczne, łatwiejsze do wyszukiwania
oraz częściej czytane i cytowane.
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 27
28. Serwis Otwartanauka.pl
• Serwis powstał z myślą o wszystkich
zainteresowanych problematyką
otwartości w badaniach naukowych i
edukacji.
• Został objęty patronatem KRASP, MNiSW,
PAN
• Publikuje artykuły, analizy, wywiady z
istotnymi postaciami otwartej nauki w
Polsce i na świecie
• Dla Otwartej Nauki wywiadów udzielili
m.in.: prof. Włodzisław Duch, prof.
Włodzimierz Bolecki, prof. Stevan Harnad
z Universite du Quebec a Montreal, prof.
John Willinski, ze Stanford Graduate
School of Education, prof. Nicholas Canny
z ERC.
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 28
29. Pomocnik Prawny PON
• Interaktywne narzędzie, które
pozwala uzyskać rekomendacje
dotyczące kwestii prawnych
związanych z udostępnianiem treści
naukowych.
• Podzielony jest na osobne części
dedykowane autorom, wydawcom,
jednostkom naukowym oraz
instytucjom finansującym badania
naukowe.
• Serwis dostarcza rekomendacje
dostosowane do profilu i potrzeb
użytkownika.
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 29
30. Projekty europejskie
• W ramach projektów DRIVER i DRIVER-II oraz OpenAIRE i OpenAIREplus
Komisja Europejska stale od roku 2006 aż do chwili obecnej – finansuje
rozwój ogólnoeuropejskiej infrastruktury repozytoryjnej.
• Jednocześnie, w ramach tych samych projektów, KE zapewnia wsparcie
dla społeczności naukowej w Europie we wdrażaniu otwartego dostępu
do zasobów naukowych.
• KE wspiera również rozwój wiedzy na temat otwartego dostępu w
Europie - FOSTER (Facilitate Open Science Training for European
Research)
• ICM jest partnerem dotychczasowych europejskich projektów
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
30
31. Najnowsze
publikacje
ICM
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
31
32. Czego potrzebuje Otwarta Nauka w Polsce?
• Wspólna wizja modelu otwartości oraz infrastruktura, która umożliwi
realizację otwartości każdej instytucji oraz naukowcom w Polsce.
• Zaangażowanie naukowców i instytucji, które pokaże decydentom, że
otwartość w nauce jest oczekiwanym standardem
• Przekonanie instytucji finansujących badania, że otwartość służy
lepszemu wykorzystaniu funduszy przeznaczanych na rozwój nauki
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
32
33. Zintegrowana infrastruktura sieciowa wiedzy
w Polsce:
rola projektu SyNaT
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
33
34. SyNaT: wykładnia programowa
• Forma: strategicznyprojekt badawczy NCBiR
• Zadanie: stworzenie uniwersalnej, otwartej, repozytoryjnej platformy
hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla nauki, edukacji
i otwartego społeczeństwa wiedzy
• Realizacja:
– Szeroki zakres zadań o charakterze badawczym, podporządkowanych głównemu celowi –
stworzeniu kompleksowego systemu informacji naukowej
– Projekt został zrealizowany z rozszerzeniami
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
34
35. Cel
Stworzenie otwartej infrastruktury pozwalającej na:
● Efektywny i jednolity dostęp polskich badaczy do szerokiego wachlarza zróżnicowanych zasobów
naukowych
● Rozwój współpracujących ze sobą usług i narzędzi korzystających z tych zasobów
● Poprawę widoczności i dostępności polskich publikacji naukowych na świecie
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 35
36. System SyNaT
Wspólna platforma systemowa INFONA dostępu do zasobów treści, danych oraz repozytoriów
dziedzinowych i instytucjonalnych uczelni i instytucji naukowych:
Dostęp do zasobów krajowej infrastruktury zasobów wiedzy SyNaT
Wprowadzanie zasobów publikacyjnych i danych naukowych do systemu POL-on (PBN,
Pol-Index)
Bogaty zbiór udostępnianych funkcjonalności informatycznych
Stan obecny:
Przygotowana integracja szeregu baz bibliograficznych polskich (w tym Agro, BazTech, BazEkon,
CEJSH, BazHum, … )
Umowy z ponad 2000 tytułami czasopism (metadane)dane), w tym ponad 390 tytułów
(pełne teksty)
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
Architektura otwarta, skalowalna
36
37. System SyNaT – schemat funkcjonalny
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
37
38. Oferta
Dla użytkowników instytucjonalnych:
●Indeksowanie repozytoriów instytucjonalnych
●Indeksowanie wydawanych przez jednostkę czasopism
●Zwiększenie światowej widoczności publikacji poprzez indeksowanie
przez Google i Google Scholar
●Zwiększenie widoczności instytucjonalnych materiałów wideo
Dla użytkowników indywidualnych:
●Dostęp do zróżnicowanych treści
●Widoczność profilu naukowca
●Platforma komunikacji naukowej Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 38
39. Infona - metadane
Zbiór narzędzi do automatycznego wzbogacania metadanych:
●Klasyfikacja dokumentów
●Generowanie słów kluczowych
●Wyszukiwanie stron domowych czasopism i autorów
●Dysambiguacja autorów
●Podobieństwo dokumentów
●Na podstawie analizy skupień
●Podobieństwa obrazów
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode) 39
40. Dane publiczne
- zasady wtórnego użycia
- Centralne Repozytorium Informacji Publicznej
Prezentacja jest dostępna na licencji Creative Commons –
Uznanie autorstwa 3.0 Polska
(http://creativecommons.org/licenses/by/3.0/pl/legalcode)
40