Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Travel Europeana - Suomen Vanhat Matkailukirja

902 views

Published on

Tiina Ison,
EuropeanaLocal, Finnish National Meeting
13 September 2010

Published in: Education
  • Be the first to comment

  • Be the first to like this

Travel Europeana - Suomen Vanhat Matkailukirja

  1. 1. Travel Europeana Suomen Vanhat Matkailukirjat Kansalliskirjasto Tiina Ison, pääsunnittelija - [email_address] Konservointi ja Digittointikeskus Giuseppe Acerbi Travels through Sweden, Finland and Lappland to the North Cape in the years 1798 and 1799
  2. 2. Jäsennys <ul><li>Kansalliskirjaston digtioitnipolitiikka 2010 </li></ul><ul><li>Kansalliskirjasaton aineistojen käyttöönsaattaminen </li></ul><ul><li>Travel Europeana digtitointi hanke 2008-2010 </li></ul><ul><li>Kansalliskirjaston aineisto – Vanhat Matkailukirjat </li></ul><ul><li>Kansalliskirjaston digitointiprosessit ja metadata </li></ul><ul><li>Digitointiprosessit ja kehityskokeiluja.. </li></ul>
  3. 3. 1. Kansalliskirjaston digitointipolitiikka 2010 <ul><li>Kansalliskirjaston strategisen tavoitteena on saattaa kulttuuriperintöaineisto laajaan verkkojakeluun edistäen mm :   </li></ul><ul><li>Aineistojen mahdollisimman vapaan tutkimus-, opetus- ja kansalaiskäytön </li></ul><ul><li>Digitoitujen aineistojen luotettavuuden ja autenttisuuden turvaamisen </li></ul><ul><li>Digitoitujen aineistojen pysyvän ja kestävän saatavuuden, haettavuuden ja käytettävyyden </li></ul><ul><li>Digitoitujen aineistojen laaja verkkojakelu </li></ul><ul><li>Kansalliskirjasto luo uusia prosesseja ja toimintamalleja.... </li></ul><ul><li>perinteisen analogisen aineiston hallinnoimisen ja säilyttämisen rinnalle digitaalisen aineiston tuottamiseen, käyttöön saattamiseen ja pitkäaikaissäilytykseen. </li></ul>
  4. 4. … .kansalliskirjaston digitoitavia aineistoja <ul><li>Aikakausilehdet </li></ul><ul><li>Historialliset sanomalehdet </li></ul><ul><li>Monografiat (mm Pelasta Kirja) </li></ul><ul><li>Pergamentit </li></ul><ul><li>Turun Väitöskirjat </li></ul><ul><li>Äänitteet (C-kasettia) </li></ul><ul><li>Peinpainatteeta </li></ul><ul><li>Travel Europeana (100 teosta Europeanaan 2010) </li></ul>
  5. 5. …… digitointipolitiikan operationalisointi <ul><li>Autenttisuus – lähdeaineistoa vastaava korvike (ID ’ t, seuranta). </li></ul><ul><li>Tunnistettavissa Kansalliskirjaston tuottamaksi - tuottajan maine </li></ul><ul><li>massa- ja erikoisdigitiointiprosessit – ylläpito ja kehittäminen </li></ul><ul><li>digitoinnin- ja jälkikäsittelyn tuotannon hallinnointi (eri linjat) </li></ul><ul><li>provenienssitietojen keruu, liittäminen ja tallennus (METS/PREMIS) – fyysinen ja digitaalinen provenienssi </li></ul><ul><li>METS profiilit eri aineistoille(monografiat) kuvaileva, rakenteellinen ja hallinnollinen metadata (määritys, metatyöryhmät) </li></ul><ul><li>rakenteistamisen laatutasot ja mittarit (osakohteet) </li></ul><ul><li>kahden tietueen malli, minimiluettelointi, luetteloinnin rikastaminen </li></ul><ul><li>PAS kelpoisia säilytyspakettien tuottaminen </li></ul><ul><li>yksilölliset tunnisteet, tekijänoikeus metadata sekä käyttöoikeus </li></ul>
  6. 6. …… .digitoinnin tietotuotteet <ul><li>Kansalliskirjatonlinjaa digitointipolitiikassa tietotuotteita digitointituotannon tuottamina: </li></ul><ul><li>Digitoidut aineistot </li></ul><ul><li>Rakenteistetut aineistot sekä osakohteet </li></ul><ul><li>Yhteisöllinen rikastaminen </li></ul><ul><li>Digitoidut kokoelmat tutkimuskäyttöön </li></ul><ul><li>Digitoitujen aineistojen metadata ja rikastaminen </li></ul><ul><li>Digitoitujen aineistojen pitkäaikaissäilytys </li></ul>
  7. 7. 2. Kansalliskirjaston digitoitujen aineistojen käyttöönsaattaminen <ul><li>Kansalliskirjaston tavoitteena on tuottaa dataa standardi- sekä vaihtokelpoisessa muodossa jota voidaan saattaa käyttöön mahdollisimman laajaan jakeluun </li></ul><ul><li>Digitointituotannon taustajärjestelmät (Kansalliskirjaston digitoinitikeskus) tuottavaen digitoituja aineistoja joita voidaan saattaa käyttöön sekä: </li></ul><ul><ul><li>Digitool ( 50 Travel Eu teosta Kansalliskirjston Digitool Monogratiat) </li></ul></ul><ul><ul><li>KDK </li></ul></ul><ul><ul><li>Europeana (Marraksuu 2010) </li></ul></ul><ul><ul><li>WDL </li></ul></ul><ul><ul><li>Kulttuuri Sampo ? </li></ul></ul><ul><ul><li>Yksi aineisto, maksimi saatavuus, haettavuus ja käytettävyys. </li></ul></ul>
  8. 8. 3. Travel Europeana digitointi hanke 2009-2010 <ul><li>Päätävoite: digitoida matkailuun ja turismiin liittyvää aineistoa ja saattaa käyttöön Europeaanan kautta. </li></ul><ul><li>Hanke rahoitus: European Commission: ‘ Digital Libraries ’ of the eContentplus Programme </li></ul><ul><li>Hanketta tukevat: EDL Foundation, CENL - The Conference of European National Librarians - ja LIBER - Association of European Research Libraries </li></ul><ul><li>Hankkeen aloitus 1 st Toukokuuta 2009. Hanke on 2-vuotinen. </li></ul><ul><li>Hankeen tavoitteen on 1 miljoonaa objektia. </li></ul><ul><li>Hankkeen tavoitteita on lisäksi. ‘luoda malliesimerkkejä digitoinnin ‘best practice’ prosesseista sekä syventää LIBER ja CENL (tutkimuskirjastojen) tukea Europeanalle. </li></ul>
  9. 9. ....travel Europeana hankkeeseen osallistuvat <ul><li>National Library of Estonia  Coordinator </li></ul><ul><li>Austrian National Library EDL Foundation Eremo srl Lund University Library Moravian Library in Brno National Library of Finland National Library of Latvia National Library of Poland National and University Library of Slovenia </li></ul><ul><li>Kriittinen massa digitoituja aneistoja... </li></ul>National Library of The Netherlands National Library of Wales Trinity College Library Slovak National Library Goettingen State and University Library University College London University of Innsbruck University Library of Regensburg University and National Library of Debrecen WP 3: UCL London – LIBER organisaationiden aggregaatti. Digitool – ESE – Europeana. Paul Eyers.
  10. 10. 4. Kansalliskirjaston Travel EU matkailuaineisto <ul><li>Kansalliskirjaston aineisto on n 100 matkailuun liittyvää teosta, suomalaisten julkaisemaa tai keskittyy Suomeen ja etenkin Lappiin. </li></ul><ul><li>Materiaali on kansainvälisesti kiinnostavaa sisältäen ensimmäisiä matkakertomuksia Suomesta 1600–1800-luvuilta enimmäkseen Ruotsin vallan ajalta. kirjoja ja niihin liittyviä (avokkaita) kuvia, kuvauksia ja karttoja. ....Tekijänoikeusvapaata. </li></ul><ul><li>Matkailukirjat: monikielisiä kokteksti versioita - eri versiot, painokset mm Acerbi ja Topelius (suomi, ruotsi, saksa, englanti, venäjä, ranska). </li></ul><ul><li>Kokotekstit mielenkiintoisia myös ontologisoinnin kannalta koska sisältävät paikannimiä eri kielillä sekä historiallisessa kontekstissa. </li></ul>
  11. 11. .... matkailu aineisto esimerkkinä Acerbi <ul><li>Jos mun tuttuni tulisi, (goethe käänsi 1810) </li></ul><ul><li>Ennen nähtyni näkyisi, Sille kättä käppäjäisin, Vaikk ois käärme kämmenpäässä, Sille suuta suikkajaisin, Vaikk ois suu suden veressä, Siitä kaulahan kapuisin, Vaikk ois kalma kaulan päällä, Vielä vierehen kävisin, Vaikk ois vierus verta täynnä. </li></ul><ul><li>1799 Acerbi Grand Tour </li></ul><ul><li>Kuvaukset ja Kuvitukset </li></ul><ul><li>Globaali toursimsi </li></ul><ul><li>Kulttuurimatkailijat </li></ul><ul><li>Kartat, reitit, paikannimet... </li></ul><ul><li>Konteksti (i was here 1799 :) </li></ul>
  12. 12. 5. Kansalliskirjaston taustajärjestelmä: digitointiprosessit <ul><li>Digitoinnin tuotantoprosessin EXPORT tiedostot sisältävät </li></ul><ul><li>- :JPEG2000, lossless, PDF, OCR TXT, ALTO XML, METSXML ja MARCXML. </li></ul><ul><li>METS export paketit laadittu monographioille määrittäen yhteensopivat standardit ja OAI-PMH vaihtokelpoisuuden </li></ul><ul><li>- kuvailevaa, hallinnollista, rakenteellista sekä pitkäaikaista metadatalle. </li></ul><ul><li>- Mets Rights kehitystyö aloitettu (käyttö-näyttörajoitteet) </li></ul>
  13. 13. … .travel europeana projektin hallinnointi
  14. 14. … METS profiilit: metadatan liittääminen <ul><li>1. Kuvaileva metadata (Travel Eu:ssa kehitetty) </li></ul><ul><ul><li>luetteloiinti – Fennica (suomalaisille) </li></ul></ul><ul><ul><li>ISBD (International Standard Bibliographic Description) sääntöjä ’ for older monographic resources ’ . Luotu tietue joka toiimii globaalilla tasolla </li></ul></ul><ul><ul><li>asiasanat ja YSO (englanti) </li></ul></ul><ul><ul><li>Abstrakti (englanti) </li></ul></ul><ul><ul><li>Povenienssi tiedot lisätty (alkuperä) </li></ul></ul><ul><li>2. Tekninen metadata </li></ul><ul><li>3. Hallinnollinen metadata (tunnisteet) </li></ul><ul><li>4. Rakenteellinen metadata (osakohteet) </li></ul><ul><li>Europeana Semantic Elements (Europeana Semantic Model) ? DC ? </li></ul>
  15. 15. … .digitointiin liittyviä haasteita – Wanha teksti <ul><li>Vanhat kirjainmuodot ongelma OCR:lle, vanhat nimimuodot </li></ul><ul><li>Teemojen ja relaatioiden tunnistaminen edellyttää automatisoinnin ja asiantuntijatyön yhdistämistä </li></ul><ul><li>Mahdollisia ratkaisuja: </li></ul><ul><li>Ohjelmistojen luominen jälkikäsittelyn automatisoimiseksi ja manuaalisen jälkikäsittelyn helpottamiseksi. </li></ul><ul><li>Ontologioiden ja valmiiden aihesanastojen hyödyntäminen </li></ul>
  16. 16. 6. Digitointiprosessit ja kehityskokeilua …Acerbia prototyyppi kokeilua… (Mika Nyman & Eeva Murotmaa) <ul><li>Tuottaa lisäarvoa massadigitoituun aineistoon </li></ul><ul><li>Verkkojulkaisemisen mahdollistaminen </li></ul><ul><li>Menetelmien kehittäminen ja prototyypin toteutus </li></ul><ul><li>TEI:n ja kieliteknologian käyttömahdollisuuksien selvittely </li></ul><ul><li>Sisällön muokkaaminen soveltuvaksi jakeluun semanttisessa webissä </li></ul>
  17. 17. …… käytettyjä menetelmiä <ul><li>Lähtökohtana OCR-digitointiprosessissa automaattisesti syntyneet Alto-tiedostot </li></ul><ul><li>Välineiden luominen OCR-korjailua varten: – virheiden silmämääräinen tunnistaminen ja korjailu automaattisesti luodusta konkordanssista – Alto-tiedostojen automaattinen korjailu </li></ul><ul><li>Tunnistamisen kohteita: nimetyt entiteetit, teemat, suhteet </li></ul><ul><li>Sisällönkuvailun välineitä: Outline of Cultural Materials, CIDOC CRM </li></ul>
  18. 18. … ..Acerbi Projektin toteutuksen viitekehys Tallenne Acerbin teos Tarkoitteet Henkilöt, Paikat, Teemat Metadataskeema TEI Käsitemallit CIDOC CRM, FRBR, FRAD, FRSAD Luettelointisääntö RDA Aiheauktoriteetti OCM
  19. 19. …… TEI:n käyttö Acerbi-hankkeessa <ul><li>Automaattisesti muodostetut TEI-dokumentit </li></ul><ul><li>Jokaisella sivulla ja sanalla oma tunniste </li></ul><ul><li>Mahdollisuus viitata mihin tahansa sanaan tai sanojen yhdistelmään (segmenttiin) </li></ul><ul><li>Sanoihin tai segmentteihin voidaan viitata tekstin ulkopuolelle sijoittuvista annotaatioista </li></ul><ul><li>Annotaatiot voivat viitata ristikkäisiin segmentteihin </li></ul><ul><li>Annotaatiot voivat muodostaa erilaisia temaattisia kokonaisuuksia (esim. luonnon- kuvaukset, kansanelämä, mineraalit, kasvit) </li></ul>TEI = Text Encoding Initiative
  20. 20. Kansalliskirjaston digitointi keskus (Mikkeli)

×