Motori di ricerca - non c'è solo Google

3,444 views
3,176 views

Published on

Published in: Technology, Design
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,444
On SlideShare
0
From Embeds
0
Number of Embeds
354
Actions
Shares
0
Downloads
44
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Motori di ricerca - non c'è solo Google

  1. 1. Motori di ricerca non c’è solo Google Formazione Volontari SCN 2011 Centro Linguistico di Ateneo - Mediateca
  2. 2. <ul><li>cosa faremo oggi </li></ul><ul><li>cos’è e come funziona un motore di ricerca </li></ul><ul><li>cos’è e come funziona una web directory </li></ul><ul><li>cos’è il web invisibile o profondo </li></ul><ul><li>motori di ricerca specialistici, semantici, visuali... </li></ul><ul><li>cosa NON faremo oggi </li></ul><ul><li>tecniche di ricerca </li></ul><ul><li>utilizzo avanzato di specifici motori di ricerca (es. Google) </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  3. 3. <ul><li>che cos’è un motore di ricerca </li></ul><ul><li>il termine ricerca (search) in informatica significa esaminare il contenuto di un pc, di un disco, di un file o di una rete di computer per trovare informazioni volute </li></ul><ul><li>il termine motore sta ad indicare qualcosa che fornisce la forza per un movimento, un sistema, una azione... </li></ul><ul><li>un motore di ricerca è qualcosa che in base a termini che noi inseriamo (motore di ricerca per parola) restituisce una serie di informazioni / documenti </li></ul><ul><li>un motore di ricerca su Internet è un software che raccoglie informazioni, le organizza in database e in base ai termini della domanda restituisce elenchi di pagine web in un certo ordine </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  4. 4. <ul><li>tipi di motori di ricerca </li></ul><ul><li>motori di ricerca generali, basati su indici automatici, senza intervento umano (es. Google) </li></ul><ul><li>motori di ricerca generali basati su indici controllati dall’uomo, web directory (es. Dmoz) </li></ul><ul><li>motori di ricerca specialistici, basati su indici in parte creati in modo automatico e in parte creati dall’uomo (es. Scirus) </li></ul><ul><li>motori di ricerca basati su indici semantici (es. Hakia) </li></ul><ul><li>metamotori (es. Metacrawler) </li></ul><ul><li>motori di ricerca personalizzati </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  5. 5. <ul><li>motori di ricerca (automatici) </li></ul><ul><li>gli spiders girano 24 ore su 24 per la rete cercando contenuti: come un ragno su una ragnatela seguono i link da un sito a un altro, entrano nei siti e raccolgono informazioni da, di e su singole pagine statiche </li></ul><ul><li>le pagine vengono indicizzate e classificate in archivi dagli indexer in base alle parole rilevate e ai metadati delle singole pagine </li></ul><ul><li>gli archivi vengono interrogati e viene fornita una lista di siti organizzata in base a determinati criteri (page ranking) per dare le risposte più adeguate </li></ul><ul><ul><li>http://it.bing.com/ http://www.google.com/ http://it.yahoo.com/ </li></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  6. 6. <ul><li>web directory </li></ul><ul><li>elenchi creati e curati da esseri umani (non in automatico) </li></ul><ul><li>vengono indicizzati siti , non pagine </li></ul><ul><li>si usano classificazioni controllate, in forma gerarchica </li></ul><ul><li>grande attendibilità e qualità ma... </li></ul><ul><li>... i siti invecchiano e i controlli non sono automatici </li></ul><ul><li>un esempio per tutti: </li></ul><ul><ul><li>http://www.dmoz.org </li></ul></ul><ul><li>sono possibili web directory automatiche? </li></ul><ul><ul><li>http://www.alexa.com/ http://www.google.com/dirhp </li></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  7. 7. <ul><li>il web invisibile </li></ul><ul><li>è quello che i motori di ricerca non vedono </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca dati da Juanicó - Environmental Consultants Ltd .
  8. 8. <ul><li>il web invisibile (opaco, nascosto, profondo...) </li></ul><ul><li>è quello che Google e gli altri non vedono perché: </li></ul><ul><ul><li>non sono pagine statiche, vengono create in base a singole richieste (le singole richieste però possono avere dei link) </li></ul></ul><ul><ul><li>non sono presenti nei link di nessun altro sito o pagina </li></ul></ul><ul><ul><li>si tratta di reti interne o comunque riservate </li></ul></ul><ul><ul><li>si tratta di documenti troppo profondi </li></ul></ul><ul><ul><li>gli spider trovano degli sbarramenti tipo: </li></ul></ul><ul><ul><ul><li>siti controllati (password, captcha, ...) </li></ul></ul></ul><ul><ul><ul><li>siti con opzioni per la navigazione </li></ul></ul></ul><ul><ul><ul><li>siti con blocchi dichiarati </li></ul></ul></ul><ul><ul><ul><li>ecc. </li></ul></ul></ul><ul><ul><li>altri motivi ancora </li></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  9. 9. dati da Brightplanet Centro Linguistico di Ateneo – Mediateca motori di ricerca una web directory per il web invisibile: CompletePlanet /
  10. 10. Centro Linguistico di Ateneo – Mediateca motori di ricerca <ul><li>il web profondo è 500 volte più grande del web di superficie </li></ul><ul><li>la qualità del web profondo è di 1000/2000 volte superiore al web di superficie </li></ul><ul><li>le risorse del web profondo sono più specialistiche </li></ul><ul><li>quali materiali si possono trovare: </li></ul><ul><ul><li>materiali conservati in archivi e repository </li></ul></ul><ul><ul><li>materiali interni a portali, banche dati, siti aziendali, biblioteche, librerie, ... </li></ul></ul><ul><ul><li>il contenuto di database, cataloghi, negozi online, ecc. </li></ul></ul><ul><ul><li>materiali ad accesso riservato o controllato </li></ul></ul><ul><ul><li>tutto l’universo –incalcolabile- dei sistemi peer-to-peer o di risorse comunque condivise </li></ul></ul><ul><ul><li>... (e il 95 per cento di queste risorse è di libero accesso!) </li></ul></ul>
  11. 11. Centro Linguistico di Ateneo – Mediateca motori di ricerca dati da Brightplanet
  12. 12. <ul><li>cos’è un motore di ricerca specialistico </li></ul><ul><li>cerca singole pagine e documenti di aree o settori specifici </li></ul><ul><li>funziona come un motore di ricerca automatico i siti dove cercare sono scelti dall’uomo </li></ul><ul><li>qualità e attendibilità sono garantite in proporzione alle presenza o meno di controlli sui siti </li></ul><ul><li>spesso sono commerciali o hanno fini commerciali </li></ul><ul><li>spesso indicizzano parte del web invisibile </li></ul><ul><li>spesso hanno classificazioni / indicizzazioni </li></ul><ul><li>es. area scientifica Scirus www.scirus.com </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  13. 13. <ul><li>motori di ricerca semantici </li></ul><ul><li>generalizzano le parole di ricerca e le contestualizzano </li></ul><ul><li>permettono di inquadrare la parola nell’ambito che ci interessa </li></ul><ul><li>cercano di dare risposte “logiche” e organizzare i risultati </li></ul><ul><li>ricerca della qualità contro la quantità </li></ul><ul><li>differenti sistemi per selezionare i siti: core sites, page vector, ecc. </li></ul><ul><li>spesso interagiscono con strumenti di social web / folksonomies </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  14. 14. <ul><li>motori di ricerca “semantici” </li></ul><ul><li>Hakia - http://hakia.com/ </li></ul><ul><ul><li>basato su una tecnologia “core” su diversi segmenti (web, news, blog, siti affidabili, video, ecc. I </li></ul></ul><ul><li>Teoma - http://www.teoma.com/ </li></ul><ul><ul><li>prova ad aggiungere ai normali risultati di un motore di ricerca i siti più popolari tra gli esperti e in base alle domande già poste </li></ul></ul><ul><li>Wolfram Alpha - http://www.wolframalpha.com/ </li></ul><ul><ul><li>non un motore di ricerca vero e proprio ma un repository (sempre aggiornato) che utilizza algoritmi basati sul linguaggio naturale </li></ul></ul><ul><li>Credo – http://credo.fub.it/ </li></ul><ul><ul><li>Conceptual REorganization of Documents, basato sul motore di ricerca di Yahoo organizza le risposte per aree tematiche </li></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  15. 15. <ul><li>Metamotori </li></ul><ul><li>interrogano diversi motori, integrano le risposte </li></ul><ul><li>generici: la qualità arriva dal confronto, es.: http://www.metacrawler.com/ </li></ul><ul><li>visuali e/o intuitivi </li></ul><ul><li>http://beta.simploos.com/ http://www.yometa.com/ </li></ul><ul><li>http://www.search-cube.com </li></ul><ul><ul><ul><li>http://www.touchgraph.com </li></ul></ul></ul><ul><li>specialistici: mettono filtri in base a criteri predefiniti, ad es.: di contenuto (settoriali, geografici, scientifici, ...) di utilizzo (tipi di file, di risorse, di utenti, di copyright, ...) </li></ul><ul><ul><ul><li>http://www.blinkx.com/ </li></ul></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  16. 16. <ul><li>motori fatelo da voi </li></ul><ul><li>ricerca personalizzata in base ad esigenze specifiche </li></ul><ul><li>alto grado di soddisfazione, ricerca non esaustiva </li></ul><ul><li>anche folksonomies condivisibili (web 2.0) </li></ul><ul><li> http://webbrain.com/ </li></ul><ul><li> http://www.eurekster.com/ </li></ul><ul><li>... risorse linguistiche ;-) </li></ul><ul><li>directory di motori / portali / metamotori </li></ul><ul><li> http://www.thesearchenginelist.com/ </li></ul><ul><li> http://www.segnalidivita.com/motoridiricerca/index.htm </li></ul><ul><li> h ttp://www.noodletools.com/debbie/literacies/information/5locate/adviceengine.html </li></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  17. 17. <ul><li>per chi vuole approfondire: </li></ul><ul><li>Pandia Search Central – http://www.pandia.com </li></ul><ul><ul><li>portale con raffinati strumenti di ricerca, web directory, aggiornamenti, guide, tutorial, newsletter, statistiche, ecc. Da vedere. </li></ul></ul><ul><li>in mediateca </li></ul><ul><ul><li>The invisible web : searching the hidden parts of the internet / Paul Pedley </li></ul></ul><ul><ul><li>Effective information retrieval from the Internet : an advanced users guide / Alison Stacey and Adrian Stacey </li></ul></ul><ul><ul><li>The librarian’s internet survival guide : strategies for the high-tech reference desk / Irene E. McDermott ; ed. by Barbara Quint </li></ul></ul><ul><ul><li>A guide to finding quality information on the Internet / Alison Cooke </li></ul></ul><ul><ul><li>The invisible Web : uncovering information sources search engines can’t see / Chris Sherman and Gary Price </li></ul></ul><ul><ul><li>Using the Internet as a reference tool : a how-to-do-it manual for librarians / Michael P. Sauers </li></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca
  18. 18. <ul><li>l’ultimo esperimento di Google: What do you love? </li></ul><ul><li>dalla homepage personalizzata verso un vero e proprio portale individuale unificando diversi servizi </li></ul><ul><ul><li>risposte per tipologie risorse (immagini, video, libri, ecc....) </li></ul></ul><ul><ul><li>interazioni 2.0 (forum, sondaggi, blog, ecc.) </li></ul></ul><ul><ul><li>strumenti (traduttore, disegno 3D, iPod Apps, sistema di alert, ecc.) </li></ul></ul><ul><ul><li>dal momento che Google tiene traccia delle ricerche fatte: potrebbe diventare un portale individuale! </li></ul></ul><ul><ul><li>http://www.wdyl.com </li></ul></ul>Centro Linguistico di Ateneo – Mediateca motori di ricerca

×