Poszukiwanie
surowych danych
badawczych online
DR SABINA CISEK
UNIWERSYTET JAGIELLOŃSKI
WYDZIAŁ ZARZADZANIA I KOMUNIKACJI SPOŁECZNEJ
INSTYTUT INFORMACJI NAUKOWEJ I BIBLIOTEKOZNAWSTWA
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 1
Spis treści
• Czym są surowe dane badawcze?
• Po co archiwizować i udostępniać dane
badawcze?
• Jak znaleźć dane badawcze?
• Więcej na ten temat – wybrana
bibliografia
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 2
Czym są surowe dane
badawcze?
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 3
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 4
W internecie występują różne typy zasobów
naukowych, m.in.:
• bazy danych,
• katalogi biblioteczne,
• naukowe serwisy wyszukiwawcze, w tym –
wyszukiwarki naukowe,
• publikacje i ich kolekcje (archiwa, repozytoria,
biblioteki cyfrowe),
• przewodniki dziedzinowe,
• zbiory danych badawczych
• i inne.
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 5
Otwarte
dane
Dane
publiczne
Dane badawcze
(dane pochodzące z
badań empirycznych)
DANE ONLINE
Dane
statystyczne
Big Data
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 6
Surowe dane badawcze są to dane (materiały)
powstałe intencjonalnie w wyniku badań
empirycznych w różnych przedsięwzięciach
naukowych lub też zgromadzone na potrzeby
konkretnych projektów badawczych.
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 7
Dane badawcze uzyskujemy w wyniku
zastosowania różnych technik badawczych, jak:
• ankieta,
• dokumenty,
• dyskusja,
• eksperyment,
• obserwacja,
• test,
• wywiad
• i inne.
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 8
Przykłady (surowych) danych badawczych:
• filmy rejestrujące – np. przebieg eksperymentu, wybuch
wulkanu albo zwyczaje ludowe,
• materiały audio, np. zapis odgłosów wielorybów,
• nagrania i transkrypcje wywiadów,
• notatki z obserwacji,
• protokoły laboratoryjne,
• rysunki dzieci wykonane na prośbę badacza,
• wyniki pomiarów temperatury wody w oceanach albo ilości
dwutlenku węgla w powietrzu,
• wypełnione ankiety,
• zapisy monitoringu,
• zdjęcia – galaktyk, lodowców, murali, osób …
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 9
DLACZEGO DANE SUROWE?
Dane badawcze (empiryczne)
versus
opracowania naukowe (publikacje, teksty –
artykuły, dysertacje, książki, raporty)
Udostępniane dane
mogą być bardziej lub
mniej „surowe”, czyli
w różnym stopniu
przetworzone.
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 10
Przykład danych 1: Surowe dane badawcze dotyczące plastiku,
morza i zanieczyszczeń
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 11
Przykład danych 2: Surowe dane badawcze dotyczące liczby
neutronów
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 12
Przykład danych 3: Zdjęcia Księżyca
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 13
Dane badawcze,
zebrane w kolekcje (datasets),
udostępniane są online w archiwach
(repozytoriach) danych
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 14
Archiwa (repozytoria) danych badawczych są to intencjonalnie
stworzone zbiory danych/materiałów, powstałych w wyniku
badań empirycznych w różnych przedsięwzięciach naukowych
lub też zgromadzonych na potrzeby konkretnych projektów
badawczych.
(…) termin ten nie określa wszystkich istniejących kolekcji
danych, które ewentualnie mogłyby „przydać się” w
dociekaniach naukowych (…), lecz tylko te, które obejmują
materiały uzyskane w rezultacie badań, a także zostały
zorganizowane celowo, odpowiednio uporządkowane, opisane
metadanymi i przygotowane do udostępniania.
Cisek, Sabina (2014). Archiwa jakościowych danych badawczych …
https://www.researchgate.net/publication/272489192_Archiwa_jakosciowych_danyc
h_badawczych_w_internecie
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 15
Przykład 1: Archiwum badań nad życiem codziennym IS
UAM http://archiwum.edu.pl/
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 16
Przykład 2: Archiwum Danych Jakościowych PAN
http://www.adj.ifispan.pl/o_archiwum IFS PAN
Po co archiwizować
i udostępniać dane badawcze?
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 17
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 18
Obecnie chodzi przede wszystkim o OTWARTE dane
badawcze, które są dostępne w postaci cyfrowej w
domenie publicznej, (…) czyli mogą być dowolnie
używane, rozpowszechniane i przetwarzane przez
kogokolwiek, gdziekolwiek w dowolnym celu
[Strzelczyk 2017, s. 4]
Można je:
• odnaleźć,
• przejrzeć,
• wykorzystać dla celów naukowych albo
praktycznych
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 19
1) Podniesienie jakości (wyników) badań
naukowych
• udoskonalenie publikacji naukowych – m.in.
poprzez powiązanie ich z wyjściowymi danymi
empirycznymi – wzmocnione publikacje
(enhanced publications)
• zapobieganie fałszowaniu wyników
• zwiększenie intersubiektywnej sprawdzalności
(przejrzystość procesu badawczego, samo-
kontrola nauki)
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 20
2) Powtórne wykorzystanie raz zdobytych, już
zgromadzonych danych empirycznych (re-use) –
w nauce, biznesie, innowacjach …
• Plusy
• korzyści poznawcze
• niepowielanie pracy, oszczędność czasu, pieniędzy i wysiłku
• Minusy
• problemy metodologiczne, etyczne, finansowe, organizacyjne,
prawne, techniczne, z zakresu zarządzania informacją
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 21
Program europejski Horyzon 2020
Open Research Data Pilot (ORD Pilot)
https://ec.europa.eu/research/openscie
nce/index.cfm?section=monitor&pg=res
earchdata
https://data.europa.eu/euodp/pl/data/d
ataset/open-research-data-the-uptake-
of-the-pilot-in-the-first-calls-of-horizon-
2020
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 22
Archiwum badań nad życiem codziennym IS UAM http://archiwum.edu.pl/
Jak znaleźć dane badawcze?
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 23
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 24
1) Zidentyfikuj odpowiednie
archiwum (repozytorium)
danych badawczych i w nim
poszukaj
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 25
Dedykowany serwis wyszukiwawczy re3data.org
Registry of Research Data Repositories
https://www.re3data.org/
Rejestruje ponad 2000 repozytoriów danych badawczych z całego świata,
uwzględnia wszystkie dziedziny nauki.
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 27
Katalog Data Repositories
http://oad.simmons.edu/oadwiki/Data_repositories
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 28
Katalog archiwów/repozytoriów danych medycznych
NIH Data Sharing Repositories – U.S. National Libraries of Medicine
https://www.nlm.nih.gov/NIHbmic/nih_data_sharing_repositories.
html
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 29
Narodowe wykazy archiwów danych badawczych, np. ADA
Australian Data Archive https://ada.edu.au/, zawiera
ponad 6000 datasets z różnych dziedzin nauki
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 30
2) Znajdź kolekcję danych
badawczych w naukowych
portalach
społecznościowych
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 31
Figshare https://figshare.com/
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 32
Zenodo https://zenodo.org/
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 33
3) Zidentyfikuj zbiory danych
o wysokiej jakości
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 34
Data Seal of Approval https://www.datasealofapproval.org/en/
Kryteria, wykaz archiwów (repozytoriów), które uzyskały znak
jakości
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 35
4) Wykorzystaj data journals
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 36
Data journals = czasopisma publikujące dane
badawcze lub informacje o zbiorach danych
badawczych (ze wskazaniem repozytoriów, w
których dane są przechowywane)
These journals publish peer reviewed articles describing openly accessible datasets
for future reuse [https://www.fosteropenscience.eu/foster-taxonomy/open-data-
journals?page=1]
Informacje na ten temat i wykazy data journals, zob. m.in.
• Data Journals Guide http://ands.org.au/guides/data-journals.html
• Open Data Journals https://www.fosteropenscience.eu/foster-
taxonomy/open-data-journals
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 37
Journal of Open Archaeology Data
https://openarchaeologydata.metajnl.com/
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 38
Przykłady data journals – wydawcy
• Data in Brief http://www.journals.elsevier.com/data-in-
brief/,
http://www.sciencedirect.com/science/journal/235234
09/1
• Geoscience Data Journal
http://onlinelibrary.wiley.com/journal/10.1002/%28ISS
N%292049-6060
• Journal of Open Psychology Data (JOPD)
http://openpsychologydata.metajnl.com/
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 39
5) Skorzystaj ze
specjalistycznych baz danych
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 40
Data Citation Index, udostępniany (komercyjnie) na platformie
Web of Science przez Clarivate Analytics
Więcej na ten temat – wybrana
bibliografia
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 41
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 42
Zobacz:
Wyszukiwanie zasobów naukowych -
zbiory danych empirycznych
(badawczych) w Internecie, data
repositories, datasets
http://sabinacisek.blogspot.com/2016/
11/wyszukiwanie-zasobow-
naukowych-zbiory.html
III WARSZTAT PRACY INFOBROKERA, KRAKÓW 21 MAJA 2018 R. 43
1. Cisek, Sabina (2014). Archiwa jakościowych danych badawczych w internecie. W:
Korycińska-Huras, Agnieszka; Janiak, Małgorzata red. Komunikacja naukowa w
środowisku cyfrowym. Badania, zasoby, użytkownicy. Warszawa: Wydaw. SBP, s. 68-
80.
http://www.researchgate.net/publication/272489192_Archiwa_jakociowych_danych
_badawczych_w_internecie
2. Jachimczyk, Adam (2015). Otwarte dane badawcze. Casus polskich instytutów
badawczych. Zagadnienia Naukoznawstwa, nr 4 (206), s. 409-424.
3. Kamińska, Anna Małgorzata (2017). Dobre praktyki publikowania danych badawczych.
Biuletyn EBIB, nr 177. http://open.ebib.pl/ojs/index.php/ebib/article/view/569
4. Open Research Data
https://ec.europa.eu/research/openscience/index.cfm?section=monitor&pg=researc
hdata
5. Open research data resources https://www.nature.com/collections/cgdtjtbpjn
6. Strzelczyk, Edyta (2017). Otwarte dane badawcze – kolejny krok do otwierania nauki.
Materiały konferencyjne EBIB, nr 25.
http://open.ebib.pl/ojs/index.php/Mat_konf/article/view/599
7. Wyszukiwanie zasobów naukowych - zbiory danych empirycznych (badawczych) w
Internecie, data repositories, datasets
http://sabinacisek.blogspot.com/2016/11/wyszukiwanie-zasobow-naukowych-
zbiory.html