This session will not only showcase excellent examples of participation and user generated content in the GLAM (Galleries, Libraries, Archives, Museums) domain, but it will also examine the underlying managerial and operational dimensions to distributed community empowerment.
The mass digitisation of analogue holdings is key to heritage organizations becoming an integral part of the web. In the case of fragile carriers, digitisation is a means to ensure long-term preservation of the information. Digitisation is also a precondition for creating new access routes to collections. Once cultural artefacts are digital and part of an open network, they can be shared, recommended, remixed, mashed, embedded and cited. In this way even the most obscure artefacts can command attention. GLAMs and their users are now beginning to inhabit the same, shared information space.
Innovative new services are being launched that explore this fundamentally new paradigm of participation in the GLAM domain. Participation can have a big impact on the workflows of heritage institutions, for instance, by inviting users to assist in the selection, cataloguing, contextualisation and curation of collections. These new forms of interaction can also lead to a deeper level of involvement of users with the collections. Furthermore, the adaptation of usage tracking tools can be applied not only for evaluation purposes, but also as basis for more personalised services. This session will demonstrate what has been done in this field.
Introduction to Multilingual Retrieval Augmented Generation (RAG)
EuropeanaTECH Conference ~ Distributed Community Empowerment
1. Distributed Community
empowerment
Arfon Smith
Börje Lewin
Michiel Hildebrand
Roger Bamkin
Alun Edwards
Sarah Eloy
Simon Rainer
Chair: Johan Oomen
Netherlands Institute for Sound and Vision and VU University
@johanoomen
Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-GelijkDelen 3.0 Nederland licentie
2. "The wiring of humanity lets us treat
free time as a shared global
resource”
[the web allows the] "design new kinds
of participation and sharing that take
advantage of that resource."
date Venue
3.
4. ...challenges
• quite a few...
• simple interaction interfaces
• complex background knowledge
• distribution of user contributions in collections
• intellectial property rights
• managing multilingual information
• extensive provenance information
• open & clear reviewing procedures
• scalable & robust solutions
• ...
5. ...two main challenges
• Quality and completeness
• of contributions
• built and expand reputations
• motivate end-users
• users with specific knowledge
• loyality
6. ...typology of Crowdsourcing in the
GLAM domain
1. Tagging and Classification
2. Correction and Transcription
3. Contextualisation
4. Collection Acquisition
5. Co-curation
6. Crowdfunding
13. Collection Acquisition
Great War Archive
Four collection days (in Frankfurt, Berlin, München en Stuttgart)
Hundreds of people
14.000 pages and objects photographed
Personal stories
bron: http://www.europeana1914-1918.eu/en/contributions/868
14. Collection Acquisition
Proud of my Car
Over 700 pictures collected
http://www.huisvanalijn.be/collection/uit-het-fotoalbum-afl-4-trots-op-mijn-auto
18. Correction
Classification and
and
Tagging
Transcription
Collection
acquisition
Co-curation Contextualisation
date Venue
19. ...motivational factors
1. Connectedness and community
collaborating
fun (earning points, badges, prizes)
2. Sharing and Generosity
Altruïsm
3. Financial rewards*
* http://www.quora.com/What-are-some-crowdsourcing-services-similar-to-Amazon-Mechanical-Turk/answer/Luca-Hammer
20. • See you tomorrow!
(1/3 of)
• follow me @johanoomen
Pedro Vezini (CC BY-NC 2.0)
Editor's Notes
agora project\n
\nThe so-called “cognitive surplus” that used to be spent on passive activities (notably watching television) can now be\nused in a profoundly different way, for new kinds of creativity and problem-solving. \n\n35 hours of videos are uploaded to YouTube every minute\n6 billion photos are uploaded to Facebook every month\n35% of Internet users have contributed a piece of user-generated content at least once.\n
Wikipedia as a compelling example --> calculating that creating Wikipedia as it stands today has taken one hundred million hours of cumulative thought, he juxtaposes this to the astounding 200 billion hours people watch TV in the US alone. 200 billion hours would amount to two thousand Wikipedia projects-worth of free time, annually. \n1.How GLAM’s* currently use crowdsourcing\n•Challenges\n•Crowdsourcing and the ‘Digital Content Life Cycle’\n1.Case: Video labeling game\n
uitgebreide informatie over afzender (provenance)\n
Key to the success of initiatives\n(1) bootstrap the process with sufficient knowledgeable and loyal-over-time users, and to\n(2) maintain a reasonable level of quality, in order to sustain the existing levels of reputation, or to expand it.\n\nCrowdsourcing is only crowdsourcing if there is a crowd which is involved. \n\nSuccessful projects have managed to address these two challenges\n
We hebben naar uiteenlopende voorbeelden gekeken binnen de sector en deze geclusterd\n\ncriterium - voorname/leidende rol erfgoed. Uiteraard zijn er ook veel grassroots initiatieven. \n\nEen van mijn favoriete voorbeelden is de International Amateur Scanning league.\nDigitaliseren van historische video’s in het publieke domein.\n\n\nwe komen vervolgens op een indeling in zes categorieen. \n\nwe hebben al goede voorbeelden gezien vandaag - ik zal met name voorbeelden noemen uit categorieen die niet in andere presentaties aan bod komen.\n\n
Een bekend voorbeeld van Tagging\n\nSinds 2008\n\nnu 51 collecties - duizenden foto’s\n\nal veel evaluaties beschikbaar\n\n\nEen van de succesfacturen is het feit dat de deelneem\n
\n
Een bijzondere vermelding voor Old Weather van onder meer het maritime museum.\n\nIn deze interface worden logboeken van Britse Oorlogsschepen getranscribeerd\n\nDat gaat met een enorme snelheid - sinds oktober meer dan half miljoen pagina’s\n\nMaakt gebruik van een bestaande community - 400k users\n\n
hoe was de sfeer aan boord?\n
Sinds vorige zomer zijn er steeds meer zogenaamde GLAM-WIKI samenwerkingen geïnitieerd\n\nGoed voorbeeld: Editathon, waar experts van instellingen samenwerken met wikipedianen (i.e. kan iedereen zijn) om pagina’s te verrijken.\n\nDeze projecten zijn successvol omdat ze voorbouwen op reeds bestaande communities. Bezoekers van musea PLUS Wikipedia community.\n\n
\n
Een tweede mooi voorbeeld is het project van Europeana rondom de eerste wereldoorlog\n\n\nEr zijn verzameldagen, waar mensen hun objecten laten categoriseren en digitaliseren. Hier komen mensen samen die verhalen uitwisselen over hereniieringen. Zo komt een nieuwe community tot stand.\n\ndeze worden toegevoegd aan Europeana\n\nModel wordt in meerdere landen ingezet\n
Een tweede mooi voorbeeld is het project van Europeana rondom de eerste wereldoorlog\n\n\nEr zijn verzameldagen, waar mensen hun objecten laten categoriseren en digitaliseren. Hier komen mensen samen die verhalen uitwisselen over hereniieringen. Zo komt een nieuwe community tot stand.\n\ndeze worden toegevoegd aan Europeana\n\nModel wordt in meerdere landen ingezet\n
Smithsonian American Art museum\n
\n
we willen graag een overzicht geven van mogelijke inzet in de werkprocessen.\n\nWe gebruiken hiervoor een bestaand model, het digital content life cycle model. Hierin worden verschillende stappen besproken binnen een digitaliseringsproject.\n\nDit is een geschikt model om in bredere zin te kijken naar werkprocessen bij erfgoedinstellingen. \n\nHet model beschrijft stappen van Creatie, metadateren, opslag, ontdekken (bijvoorbeeld organiseren), hergebruik faciliteren. \n\n\n
vervolgens hebben we onze classificatie vergeleken met het digital content management life cycle.\n\nHet beeld dat hier naar voren komt is dat crowdsourcing nu al een rol speelt in uiteenlopende activiteiten binnen erfgoedinstellingen.\n\nAlleen Opslag en beheer wordt nog niet gecrowdsourced. (Al is het peer to peer distribueren van content een geschikt model voor de toekomst.\n