• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Tesi - Presentazione
 

Tesi - Presentazione

on

  • 1,772 views

Sistema configurabile per il collegamento assistito di documenti non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca

Sistema configurabile per il collegamento assistito di documenti non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca

Statistics

Views

Total Views
1,772
Views on SlideShare
1,761
Embed Views
11

Actions

Likes
0
Downloads
13
Comments
0

2 Embeds 11

http://www.slideshare.net 9
http://www.linkedin.com 2

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Tesi - Presentazione Tesi - Presentazione Presentation Transcript

    • Alma Mater Studiorum - Università di Bologna SISTEMA CONFIGURABILE PER IL COLLEGAMENTO ASSISTITO DI DOCUMENTI NON STRUTTURATI A DOCUMENTI STRUTTURATI IN UN EDMS ATTRAVERSO L’UTILIZZO DEI MOTORI DI RICERCA Tesi di Laurea in BASI DI DATI E SISTEMI INFORMATIVI Relatore Presentata da PROF. DANILO MONTESI ALESSANDRO BONDI Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Gestione documentale Documenti non strutturati meta dati markup Documenti strutturati classi di documento Sistemi di gestione documentale (RMS) Catalogazione dei documenti Architettura client-server-repository (FS, DBMS, Link) Workflow: 3R (routes, rules, roles) Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Collegamento documenti strutturati/non strutturati Indicizzazione manuale Sistemi di auto classificazione/estrazione Vantaggio nell'utilizzo di documenti strutturati: rendere il contenuto del documento facilmente recuperabile ed interpretabile efficacia ed efficienza nella gestione la strutturazione delle informazioni è un processo naturale della mente umana! Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Information Retrieval Componenti di un sistema di IR: (D, Q, F, R) Indicizzazione della collezione Dizionario, Posting [Termine, Documento, Occorrenze] Processo di reperimento Query, Risultati, Valutazione Criteri di valutazione Precision/Recall, Contesti, Semplicità Web Information retrieval Creazione collezione, Interazione utente Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Meta motori di ricerca Processo di reperimento Query Formulazione (traduzione?) delle query per i singoli motori Processo di reperimento sui singoli motori Raggruppamento dei risultati relevance/rank? training data? Eliminazione dei duplicati Risultati Valutazione Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Sistemi di voto Sistemi di voto & Meta motori? Definiscono regole di aggregazione Elettori: singoli motori Candidati: i documenti (recuperati) ma abbiamo tanti candidati di fronte a pochi elettori! Metodo Borda-Count ogni elettore classifica un insieme n di candidati in ordine di preferenza; per ogni votante, al primo della lista vengono assegnati n punti, al secondo n-1, al terzo n-2 e così via; i candidati non in classifica si dividono i punti non assegnati dall’elettore; sommando i punti viene determinata la classifica finale. Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Proposta di soluzione DESTRUTTURIAMO I DOCUMENTI! Ad ogni classe di documento associamo dei query pattern Ad ogni query pattern associamo un coefficiente di rilevanza e un elenco di motori di ricerca su cui vanno eseguite Ad ogni motore di ricerca associamo un coefficiente di rilevanza A partire da un documento strutturato possiamo quindi ottenere dei “documenti non strutturati” (le istanze delle query relative al documento stesso) Eseguendo il processo di reperimento a partire da queste query possiamo associare dei documenti non strutturati ai nostri documenti strutturati. Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Algoritmo generale Processo di reperimento Per ogni query pattern associato alla classe di documento, creo l’istanza della query relativa al singolo documento grazie ai dati contenuti nelle meta informazioni Per ogni motore di ricerca associato al query pattern, eseguo il singolo processo di reperimento Genero l’elenco dei candidati (unisco tutti gli URL) (con i sistemi di voto tradizionali conosco prima i candidati!) Per ogni lista di risultati, calcolo il punteggio col metodo Borda-Count Per ogni punteggio, applico il calcolo dei coefficienti di rilevanza (query, motori) Sommo tutti i punteggi e restituisco la classifica finale Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Sviluppi Configurazioni e test sperimentali Query pattern e coefficienti di rilevanza Motori di ricerca e coefficienti di affidabilità Esecuzione della procedura Gestione della formattazione delle informazioni Controllo di accesso Sviluppi di ricerca Sistemi informativi diversi Configurazione dei query pattern (usabilità) Relevance scores Interazioni con l’utente / Collaborative filtering Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca
    • Conclusioni Forte implicazione del lato umano Struttura flessibile, configurabile, indipendente Peculiarità del contesto di riferimento Difficoltà nella valutazione formale del sistema Non si può mettere la parola fine! Università degli Studi di Bologna – Tesi di Laurea in Informatica di Alessandro Bondi Sistema configurabile per il collegamento assistito di documento non strutturati a documenti strutturati in un EDMS attraverso l'utilizzo dei motori di ricerca