Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty na Cenu PARTSIP)

1,071 views

Published on

Konference PARTSIP 2011

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,071
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty na Cenu PARTSIP)

  1. 1. Česká digit ální matematická knihovna Miroslav Bartošek Masarykova univerzita Ústav výpočetní techniky
  2. 2. <ul><li>Kdyby se někomu podařilo zničit knihovny a všechny knihy, o třicet let později by žádný zámečník neuměl ani utáhnout šroub. </li></ul><ul><li>Thomas Alva Edison </li></ul><ul><li>Hromada knih ještě není knihovna, disk plný digitálních dokumentů ještě není digitální knihovna. Anonym </li></ul>Motivace
  3. 3. Matematická literatura „nestárne “ <ul><li>matematika víc než jiné obory spoléhá na předchozí literaturu </li></ul><ul><li>50 % odkazů směřuje 10 let zpět </li></ul><ul><li>25 % odkazů směřuje 20 let zpět </li></ul>
  4. 4. Matematická literatura <ul><li>má smysl pouze jako celek propojený širokou sítí referencí </li></ul><ul><li>je nadčasově užitečná ostatním vědním oborům </li></ul><ul><li>musí být pečlivě archivována, indexována a uchovávána </li></ul><ul><li>musí být dlouhodobě přístupná </li></ul><ul><li>národní DML - > sv ětová WDML </li></ul>
  5. 5. Co je DML-CZ
  6. 6. Co je DML-CZ <ul><li>1. Projekt </li></ul><ul><ul><li>pokročilá digitalizace </li></ul></ul><ul><ul><li>grant - Informační společnost, AV ČR </li></ul></ul><ul><ul><li>2005-2009 </li></ul></ul><ul><li>2. Digitální knihovna </li></ul><ul><ul><li>špičková česká matematická literatura </li></ul></ul><ul><ul><li>fulltexty + metadata - volně dostupné </li></ul></ul><ul><ul><li>30 .000 článků, 320.000 stran </li></ul></ul><ul><ul><li>2010-trvale </li></ul></ul>
  7. 7. 1.1 Projekt: cíle <ul><li>1. zkoumání/vývoj technologií </li></ul><ul><ul><li>OCR matematiky </li></ul></ul><ul><ul><li>nástroje pro tvorbu metadat – metadatový editor </li></ul></ul><ul><li>2. digitalizace </li></ul><ul><ul><li>časopisy, monografie, sborníky </li></ul></ul><ul><ul><li>článkově orientovaná národní DML </li></ul></ul><ul><li>3. začlenění do světové WDML </li></ul><ul><ul><li>mezinárodní standardy </li></ul></ul><ul><ul><li>interoperabilita </li></ul></ul><ul><li>http:// project. dml.cz </li></ul>
  8. 8. 1.2 Projekt: partneři <ul><li>AV – Matematický ústav </li></ul><ul><ul><li>vedení, autorsko-právní, uživatelské požadavky </li></ul></ul><ul><li>MFF UK </li></ul><ul><ul><li>matematika, metadata </li></ul></ul><ul><li>AV – Knihovna </li></ul><ul><ul><li>digitalizace </li></ul></ul><ul><li>MU – FI </li></ul><ul><ul><li>OCR + vyhledávání matematiky, podobnost </li></ul></ul><ul><li>MU – ÚVT </li></ul><ul><ul><li>integrace, implementace digitální knihovny </li></ul></ul><ul><ul><li>provoz a rozšiřování </li></ul></ul>
  9. 9. 2.1 Knihovna: obsah <ul><li>časopisy </li></ul><ul><ul><li>12 titulů (11 českých, 1 slovenský) </li></ul></ul><ul><ul><li>od počátku do současnosti </li></ul></ul><ul><ul><li>moving wall (0-24 měsícu) </li></ul></ul><ul><ul><li>27.000 článků, 276.000 stran, 2.443 čísel </li></ul></ul><ul><li>sborníky </li></ul><ul><ul><li>6 vybraných konferenčních řad (Equadiff, …) </li></ul></ul><ul><ul><li>2.390 článků, 19.000 stran, 100 svazků </li></ul></ul><ul><li>monografie </li></ul><ul><ul><li>kolekce prací Bernarda Bolzana </li></ul></ul><ul><ul><li>vybrané monografie předních matematiků </li></ul></ul><ul><ul><li>653 článků/kapitol, 10.000 stran, 44 monografií </li></ul></ul><ul><li>http://dml.cz </li></ul>- osobnosti
  10. 11. 2.2 Knihovna: materiály <ul><li>tištěné dokumenty </li></ul><ul><ul><li>19.století – 1990 </li></ul></ul><ul><ul><li>předlohy pouze v tištěné podobě </li></ul></ul><ul><ul><li>klasická digitalizace </li></ul></ul><ul><li>retro-born-digital </li></ul><ul><ul><li>1991 – 2007 </li></ul></ul><ul><ul><li>předlohy v (částečně) digitální formě </li></ul></ul><ul><ul><li>různé formáty - konverze </li></ul></ul><ul><li>digital-online </li></ul><ul><ul><li>2008 – </li></ul></ul><ul><ul><li>automatizované přebírání nových čísel do DML-CZ </li></ul></ul>
  11. 12. 2.3 Knihovna: nabízí <ul><li>320.000 stran odborných textů od 10.000 autorů </li></ul><ul><li>plné texty článků a kapitol ve formátu PDF </li></ul><ul><li>metadata včetně bibliografických referencí </li></ul><ul><li>propojení článků i referencí do recenzních DB </li></ul><ul><ul><li>MathSciNet + Zentralblatt MATH </li></ul></ul><ul><li>procházení podle rejstříků </li></ul><ul><ul><li>kolekce, názvy, autoři, MSC </li></ul></ul><ul><li>jednoduché i pokročilé vyhledávání </li></ul><ul><ul><li>v metadatech / v plných textech </li></ul></ul><ul><li>podobné články </li></ul>
  12. 13. DML-CZ workflow stránky.tiff skenování EuDML MR/Zbl Tištěný dokument stránková MD 1 10 příprava 2 sken časopis.xml stránky.tiff úpravy obr ázků stránky.pdf stránky.txt popis OCR 3 ocr digitalizov. dokument (stránky) Archiv časopisu TeX, ps Redakce časopisu TeX, pdf 5 born-digital 6 aktuální číslo Metadatový editor konverze retro-born-digital číslo export DMLCZ born-digital číslo MR/ZBL m etadata MR/Zbl sklízení normalizace 4 prolinkov ání editor metadat editor referencí math corpus DSpace DML-CZ NUMDAM JSTOR d igit ální dokument similarities výpočet podobností 7 8 rozšíření metadat archiv 9 digitální knihovna archivace export MD end-users 11 statistiky 12 http://dml.cz integrace m etadata MR /Zbl články editace © DML-CZ, 2009 články.pdf metadata články.pdf metadata články.pdf metadata struktura
  13. 14. 3. DML-CZ workflow <ul><li>Příprava materi álů </li></ul><ul><li>Digitalizace </li></ul><ul><li>OCR </li></ul><ul><li>Referenční metadata (MathSciNet, Zbl MATH) </li></ul><ul><li>Retro-born-digital </li></ul><ul><li>Aktuální čísla </li></ul><ul><li>Integrace, tvorba metadat </li></ul><ul><li>Podobné články </li></ul><ul><li>Digitální knihovna </li></ul><ul><li>Archivace </li></ul><ul><li>Exporty metadat do EuDML, MR/ZBL </li></ul><ul><li>Statistiky vyu žívání (Google Analytics, log DSpace) </li></ul>
  14. 15. 4. Hlavní výstupy <ul><li>digitální knihovna DML-CZ </li></ul><ul><li>nástroje použitelné v dalších projektech </li></ul><ul><ul><li>Metadatový editor </li></ul></ul><ul><ul><li>nadstavba DSpace/Manakin </li></ul></ul><ul><li>projekt FFdigi </li></ul>
  15. 16. Digitální knihovna ukázky
  16. 30. Děkuji za pozornost

×