Gögn og gaman

1,604 views

Published on

Fyrirlestur Hjálmars Gíslasonar um aðgengi að opinberum gögnum á málþingi Íslenskrar málnefndar um framtíð íslenskunnar í upplýsingatækni 7. mars 2008

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,604
On SlideShare
0
From Embeds
0
Number of Embeds
16
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Gögn og gaman

  1. 1. Gögn og gaman Jarðvegur nýsköpunar í tungutækni
  2. 2. Efnistök • Mikilvægi góðra gagna við þróun tungutæknilausna • Staða og aðgengi að gögnum á Íslandi • Opnum kisturnar
  3. 3. Tungutæknin og ég • Skrifaði beygingarforrit í menntaskóla • Leikjapakki Lon&Don 1997 • Embla og Já.is 2005-2006 • Ýmis verkefni með KB, SH og ER
  4. 4. Leikjapakkinn • Stærsti vandinn að finna gott orðasafn • 100þús orðmynda skrá á Háskólanetinu • Vissulega takmörkuð, en hafði margt til að bera • Hentugt form, aðgengileg, uppruninn skýr og ókeypis
  5. 5. Embla • Fyrsta leitarvélin í sögunni sem tók tillit til íslenskra beygingarmynda • Beygingarlýsingin ómetanleg • 2,7 milljónir ólíkra orðmynda • Góð gögn: • Umfangsmikil, á hentugu formi, áreiðanleg, stöðugt viðhald, hófstillt gjaldtaka, ágætlega aðgengileg
  6. 6. Leitarstarfsemi Já • Embla og Já.is nota einnig • Tíðnitöflur orðmynda (Morgunblaðið) • Nafnaskrár þekktra einstaklinga (Edda) • Bókatitla (Edda) • Skammstafanaskrár (heimasmíðað) • Tæknihugtök (mbl.is) • o.m.fl
  7. 7. Mikilvægi gagna • Ekkert þessarra verkefna hefði orðið að veruleika án góðra gagna • Unnið af litlum fyrirtækjum með lítil fjárráð en mikinn áhuga • Leystu úr læðingi mikil verðmæti
  8. 8. Staða gagna • Gríðarlega mikið til af “gagnlegum gögnum” hjá opinberum aðilum • Tungutækni: Orðabókin (og aðrir hlutar SÁMÍF), Minningarsjóður ÞÞ, ýmis ríkisstyrkt verkefni, RÚV, o.fl. • Önnur svið: Hagstofan, Landmælingar, Seðlabankinn, Alþingi, Háskólarnir, Þjóðskjalasafnið,Veðurstofan, RÚV, o.s.frv.
  9. 9. Staða gagna (2) • Oft á tíðum mjög óaðgengileg • Ekki til á stafrænu formi • Leyfismál óljós • Erfitt að nálgast þau og finna • “Ormar á gulli” • Gjaldtaka
  10. 10. Jarðvegur nýsköpunar • Góð gögn eru grundvöllur allrar nýsköpunar í tungutækni • Mikið af þessum gögnum er til, en ýmsar hindranir fyrir því að nálgast þau
  11. 11. Jarðvegur nýsköpunar (2) • Nýsköpun er í eðli sínu áhættusöm • Allar hindranir draga úr nýsköpun, líka hjá stórum fyrirtækjum • Stór hluti nýsköpunar fer fram af áhuga frekar en vísindalega útreiknaðri hagnaðarvon
  12. 12. Opnum kisturnar • Þjóðhagslegur ávinningur af því að tryggja opið aðgengi að opinberum gögnum er margfaldur á við mögulegar leyfistekjur og kostnað • Ekki síst í tungutækni! • Næg vandamál samt
  13. 13. Opnum kisturnar • Bretland: Office of Public Sector Information • Partur af National Archives • Opin Gögn • Nýleg skýrsla: 1ma punda á ári í glötuðum þjóðartekjum • Samsvarar 700 m.kr. á ári á Íslandi
  14. 14. Opin gögn skilgreind • 11 atriði: • Aðgangur (þ.m.t. verð), dreifingarréttur, notkunarréttur, tæknilegt hlutleysi, eignun, heilleiki, hlutleysi m.t.t. eðlis starfsemi, hlutleysi m.t.t. notenda, framvirkni leyfis í afleiddum verkum, óháð öðrum verkum, takmarki ekki dreifingu afleiddra verka • http://opendefinition.org/1.0
  15. 15. Sköpum skilning • Aukið fjármagn í verkefni viðkomandi stofnanna: • “Opnun” fyrirliggjandi gagna • Meiri skilningur fyrir nýjum verkefnum • Aukin nýsköpun • Nauðsynlegt til að tungutækni hér standist samanburð
  16. 16. Gögn og gaman Jarðvegur nýsköpunar í tungutækni hjalli@ja.is

×