Do it ourselves : Social Technologies for Information Retrieval

Loading...

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

0 comments

Post a comment

    Post a comment
    Embed Video
    Edit your comment Cancel

    Favorites, Groups & Events

    Do it ourselves : Social Technologies for Information Retrieval - Presentation Transcript

    1. Workshop Do It Ourselves: Social Technologies for Information Retrieval 2008 ELISAD MEETING Gruppo Abele Torino – 9/10 ottobre 2008
    2. Program
      • Little intro to Web 2.0 concepts and information scenario
      • Tools to select and filter information online -> Customised Search Engines
      • How Google CSE works
      • Y O U and Google CSE
      • Outcomes sharing
    3. Web 2.0 = Read/Write Web
      • Il Web di seconda generazione (che in realtà invera il Web 1.0)‏
      • Non più spettatori isolati che isolatamente fruiscono e consumano informazione
      • Ma collaboratori nella creazione di conoscenza online (blog, wiki, social network, folksonomy etc.)‏
      • Tutte le attività umane sono toccate da questo cambiamento: il giornalismo, la politica, l'economia etc. ma è chiaramente il mondo dell'informazione che subisce i contraccolpi più evidenti
    4. Qualità dalla quantità
      • Uno degli inconvenienti del Read/Write Web è la crescita indiscriminata e incontrollabile di siti che porta all' information overload
      • Essere sovrastati da così tanta informazione da non riuscire a trovare le risorse di interesse
      • Il modello della directory che categorizza (v. Yahoo!) ha dovuto lasciare il posto agli indici dei motori di ricerca
      • Il cui processo, che determina una rilevanza generale basata su algortimi, non riesce però a determinare la rilevanza per ognuno dei ricercanti
    5. Collaborative Filtering
      • Invece di (oltre che) affidarsi ai soli algoritmi, il social web ha puntato sulla capitalizzazione delle conoscenze implicite ed esplicite delle masse
      • Harness collective intelligence, Wisdom of crowds, Long Tail, Architecture of Participation etc.
      • Attraverso strumenti di selezione collaborativa delle informazioni, gli utenti hanno cominciato a trarre vantaggio dalla proprie stesse esperienze e conoscenze
    6. Collaborative Filtering
      • La comunicazione è il più valido strumento contro l' information overload !
      • Socializzare la qualità, condividere le responsabilità di una navigazione consapevole
      • Reputation/recommendation systems
      • Social tagging/bookmarking (folksonomy)‏
      • Newsmastering (RSS feeds)‏
      • Customised Search Engines (CSEs)‏
    7. Informazione medico-sociale
      • “ The healthcare knowledge base is expanding at an unprecedented rate
      • Approximately 50,000 new records are added annually to Medline database alone
      • Open Access publishers such as BioMed Central have growing collections of full-text scientific articles
      • Only 20% of biological knowledge and data is available in structured format or database
      • The remaining 80% is hidden in the unstructured, free text of scientific publications”
      • Il Deep Web nuoce al reperimento di conoscenza e dunque alla generazione di nuova conoscenza (alla formazione corretta degli operatori, alla scoperta di nuovi farmaci, alla sperimentazione di cure più efficaci etc.).
      • Di conseguenza la perdita di informazione può essere intesa come una perdita per l'intera società
      • citations from C. Galvez, Knowledge management for biomedical literature
      “ a) Information Retrieval (IR)‏ to gather, select and filter documents that may prove useful b) Natural Language Processing (NLP)‏ c) Information Extraction (IE) ”
    8. Informazione medico-sociale
      • Grande varietà di fonti – da quelle governative ai siti personali
      • Grande varietà di formati: pagine Web, schede di database, bibliografie su pdf, video, cataloghi online, statistiche, articoli in Word etc.
      • Grande varietà di modalità di ricerca, ognuna dedicata a un sito o a un segmento
      • Rischio elevatissmo di informazioni distorte o non correttamente dimensionate rispetto all'utenza, bufale, spam, siti “canaglia” (vendita di prodotti o servizi contraffatti o inesistenti)‏
      • Necessità di strumenti di IR che aiutino i professionisti a vagliare l'immane letteratura pubblicata sul Web
      • Necessità di portali affidabili e certificati che espongano informazioni specialistiche e di qualità ma in grado di soddisfare anche le esigenze dei profani
      Ruolo delle biblioteche e dei centri di doumentazione
    9. Customised Search Engines
      • Elenco di siti e risorse accreditati
      • Ricerca full-text nei documenti (.pdf, .doc etc.)‏
      • Indicizzazione di (meta)repertori (directory, enciclopedie online, basi di dati, open archive etc.)‏
      • Risorse ad integrazione nel tempo (censimento continuo)‏
      • Selezione collaborativa
      • Possibilità di (dis)approvare i risultati
      • Inclusione delle maschere di ricerca in siti Web e blog
      • Tag/Label per restringere il focus della ricerca
      • Upload/download del knowledge base
    10. Customised Search Engines
      • Swicki
      • Rollyo
      • Live Search Macros
      • Altri servizi disponibili online ( Yahoo! BOSS , per esempio!)‏
      • Grandi siti fanno uso abitualmente, da qualche anno, di motori specializzati invece del vecchio Google Search sul sito
      • Il gadget è utile per “spread the search”
    11. Google CSE
      • Librarian's E-library (Google CSE) - Selected resources on Libraries and Librarianship from the American Library Association (ALA) Library and a growing list of volunteers
      • Addiction Search Engine - Designed to help people find the information (...) relating to addiction and drug related issues
      • LIS-ITA-EJ - LIS italian electronic journals
      • SO-LIB Social software for libraries (Google CSE) - Online resources and information on social software applications in libraries
    12. Google CSE - Funzionalità
      • Configurazione (interfaccia, scelta tipologia, collaboratori etc.)‏
      • Elenchi di siti preferiti
      • Pattern URL per specificare siti (e parti di essi) da includere nel knowledge base
      • Perfezionamenti: label utili a restringere la ricerca su alcuni siti + possibilità di aggiungere parole alla stringa di ricerca
      • Import/export siti (“annotazioni”) e configurazioni (“contesto”) via TSV e XML (anche feed RSS, OPML, file .html)‏
      • Attribuzione di uno score di rilevanza tra -1 e +1 per stabilire una gerarichia delle fonti
      • Possibilità di embeddare il motore di ricerca in pagine Web come un qualsiasi gadget
      • Stored o Linked CSE
    13. Google CSE - Funzionalità
      • Google Marker per aggiungere on the fly un sito al knowledge base
      • Statistiche
      • Esclusione di annunci pubblicitari (enti non profit) o guadagno con Google Ads
      • Messa a punto di parole chiave, punteggio, redirect e gestione dei sinonimi (solo) nel file XML di contesto
      • API e Ajax
      • Subscribed links: funzionalità utile a creare risultati integrati che vengono presentati in testa all‘elenco dei risultati della query. Possono essere associati e quindi richiamati (triggered) da specifiche parole chiave
      • Integrazione con terze parti per aumentare le funzionalità (es.: upload bookmark da del.icio.us)‏
      In definitiva Google CSE è molto semplice ma anche sufficientemente elaborato da costituire un ottimo (il migliore IMHO) strumento per la ricerca in biblioteca o in un centro di documentazione Drawback: la ricerca viene effettuata solo in Google Web e Scholar (a parte i “redirect”); disallineamenti con Google; funzioni “sinonimi”, “score”, upload file .hmtl, redirect vanno effettuate attraverso il file XML
    14. Creazione di un repertorio di risorse utili
      • Per i vostri colleghi
        • che lavorano nello stesso ente
        • che lavorano in altri enti ma sulle stesse tematiche
        • con cui partecipate a determinati progetti
      • Per gli utenti
        • come motore di partenza per interrogare tutte le vostre risorse
        • per information literacy e reference
        • come knowledge base di una disciplina o di un percorso tematico
        • come strumento metodologico generale da sostituire a Google per una navigazione consapevole (siti anti-bufale etc.)‏
      • L'elenco potrebbe essere collaborativo, aggiornato nel corso del tempo, condiviso con altri utenti Internet etc.
    15. Valutazioni parallele
      • Target di riferimento
      • Livello di approfondimento
      • Obiettivi (v. slide precedente)‏
      • Criteri di inclusione ed esclusione dei siti e delle altre risorse
      • Valenza interna alla biblioteca, all'ente, nazionale, internazionale (-> relativamente a ciò sceglierete anche la lingua)‏
      • Tipologia dei contenuti (solo siti o anche video, podcast etc.)‏
      • Apertura ai collaboratori:
        • Sì -> chi (policy chiara: solo colleghi, solo utenti, libero etc.)‏
        • No
      • ...
    16. Sitografia
      • Google CSE
      • Google CSE Blog
      • Google CSE Forum
      • Directory dei CSE
      • Swicki
      • Rollyo
      • Live Search Macros
      • Comparazione dei software per creare motori personalizzati
    17. Bonaria Biancu Biblioteca Università di Milano-Bicocca Web: http://www.biblio.unimib.it/ Blog: http//bonariabiancu.wordpress.com Email: bonariabiancu@gmail.com Grazie e buon lavoro!

    + bonariabonaria, 2 years ago

    custom

    990 views, 0 favs, 2 embeds more stats

    More info about this document

    © All Rights Reserved

    Go to text version

    • Total Views 990
      • 979 on SlideShare
      • 11 from embeds
    • Comments 0
    • Favorites 0
    • Downloads 5
    Most viewed embeds
    • 10 views on http://bonariabiancu.wordpress.com
    • 1 views on http://wildfire.gigya.com

    more

    All embeds
    • 10 views on http://bonariabiancu.wordpress.com
    • 1 views on http://wildfire.gigya.com

    less

    Flagged as inappropriate Flag as inappropriate
    Flag as inappropriate

    Select your reason for flagging this presentation as inappropriate. If needed, use the feedback form to let us know more details.

    Cancel
    File a copyright complaint
    Having problems? Go to our helpdesk?

    Categories