SlideShare a Scribd company logo
1 of 116
Download to read offline
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ
ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ
Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήµατα
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ
Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής
Συµπεριφοράς των Χρηστών του Διαδικτύου
Γεώργιος Π. Αµπαρτζίδης
Επιβλέπουσα: Μαρία Ρήγκου
Πάτρα
Σεπτέµβριος 2014
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 2
Διπλωµατική Εργασία
Information Foraging Theory: Αλγόριθµοι,
Τεχνολογίες και Προοπτικές στην Παρατήρηση
της Πλοηγητικής Συµπεριφοράς των Χρηστών
του Διαδικτύου
Γεώργιος Π. Αµπαρτζίδης
Επιβλέπουσα: Μαρία Ρήγκου
Ακαδηµαϊκό Έτος 2013 – 2014
Πάτρα, Σεπτέµβριος 2014
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 3
© ΕΑΠ, 2014
Η παρούσα διατριβή, η οποία εκπονήθηκε στα πλαίσια της ΘΕ “Διπλωµατική
Εργασία”, και τα λοιπά αποτελέσµατα της Διπλωµατικής Εργασίας (ΔΕ) αποτελούν
συνιδιοκτησία του ΕΑΠ και του φοιτητή, ο καθένας από τους οποίους έχει το
δικαίωµα ανεξάρτητης χρήσης και αναπαραγωγής τους (στο σύνολο ή τµηµατικά) για
διδακτικούς και ερευνητικούς λόγους, σε κάθε περίπτωση αναφέροντας τον τίτλο και
το συγγραφέα και το ΕΑΠ όπου εκπονήθηκε η ΔΕ καθώς και τον επιβλέποντα και τον
επιβλέποντα και την επιτροπή κρίσης.
Γεώργιος Π. Αµπαρτζίδης
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 4
Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής
Συµπεριφοράς των Χρηστών του Διαδικτύου
Γεώργιος Π. Αµπαρτζίδης
Ονοµατεπώνυµο
Επιβλέποντα
Ρήγκου Μαρία
Ονοµατεπώνυµο
Μέλους 1
Σακκόπουλος Ευάγγελος
Περίληψη
Αντικείµενο της παρούσας διπλωµατικής εργασίας είναι η βιβλιογραφική µελέτη, ο
εντοπισµός και η καταγραφή των πρακτικών εφαρµογών στο θέµα της θεωρίας του
Information Foraging. Σύµφωνα µε τη θεωρία αυτή, οι άνθρωποι µπορούν να
χαρακτηριστούν σαν ένα είδος «πληροφοριοβόρων» (informavores): αναζητούν,
συλλέγουν, χρησιµοποιούν, καταναλώνουν και διαµοιράζονται πληροφορίες µε
τέτοιο τρόπο ώστε να µεγιστοποιούν το λόγο της αξίας των προσλαµβανόµενων
πληροφοριών προς το κόστος εντοπισµού τους. Η παρούσα εργασία παρουσιάζει και
αναλύει τη θεωρία του Information Foraging, συµπεριλαµβάνοντας τόσο την αρχική
της µορφή όσο και τις δυνατότητες εξέλιξης και εµπλουτισµού της ώστε να
συµβαδίζει µε την τωρινή µορφή του Παγκόσµιου Ιστού. Στη συνέχεια, γίνεται
καταγραφή της χρήσης της θεωρίας σε τεχνικές µοντελοποίησης της πλοηγητικής
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 5
συµπεριφοράς του χρήστη και γίνεται παρουσίαση και σύγκριση µε άλλες διαθέσιµες
τεχνικές. Επιπρόσθετα, παρουσιάζονται οι διάφορες µεθόδοι υποβοήθησης του
χρήστη κατά τη διαδικασία αναζήτησης πληροφορίας και οι εφαρµογές στο
σχεδιασµό των ιστοσελίδων και του τρόπου παρουσίασης των περιεχοµένων τους
ώστε να είναι φιλικές προς το χρήστη, καθώς και τα σηµεία στα οποία η έννοια του
information scent (της πιο σηµαντικής, γνωστής και ευρέως χρησιµοποιούµενης
έννοιας του Information Foraging) βρίσκει εφαρµογή στις παραπάνω µεθόδους και
εφαρµογές.
Τέλος, γίνεται αποτύπωση των σύγχρονων τάσεων και των διαφαινόµενων
προοπτικών στον χώρο της Αλληλεπίδρασης Ανθρώπου – Υπολογιστή.
Λέξεις – κλειδιά: Information Foraging, information scent, informavores, web
navigation behavior, web usage mining.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 6
Information Foraging Theory: Algorithms, Technologies
and Future Prospects Regarding the Observation of the
Navigational Behavior of Internet Users
George P. Ampartzidis
Supervisor’s First Member’s
fullname fullname
Rigkou Maria Sakkopoulos Enangelos
Summary
The subject of this Postgraduate Thesis is the bibliographical study, the tracking and
recording of the practical applications of the Information Foraging Theory. According
to the literature, people can be characterized as “informavores”, searching, collecting,
using, consuming and sharing information in such a way that maximizes the rate of
gaining valuable information. In the present Thesis, the theory of Information
Foraging is presented and analyzed, including not only its original form, but also its
potential evolution and enrichment in order to keep up with the current form of the
World Wide Web. Furthermore, the Thesis presents the application of the theory in
cognitive models of web navigation behavior and compares them with other available
techniques. Moreover, the available methods in assisting Internet users while
searching for information are outlined, in addition to applications in web page design
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 7
that aim at presenting webpage content in a user-friendly manner. Additionally, the
Thesis draws upon the implementation of the concept of information scent (the most
significant, well-known and widely used concept of the Information Foraging Theory)
on the aforementioned methods and applications.
Finally, the latest trends and future prospects in the field of Human–Computer
Interaction are presented.
Key–words: Information Foraging, information scent, informavores, web navigation
behavior, web usage mining.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 8
Ευχαριστίες
Θα ήθελα να ευχαριστήσω την καθηγήτριά µου, Μαρία Ρήγκου, για την ευκαιρία να
ασχοληθώ στη διπλωµατική µου εργασία µε αυτό το πολύ ενδιαφέρον θέµα, καθώς
και για την άψογη συνεργασία µας. Επίσης, θα ήθελα να ευχαριστήσω βαθιά τους
γονείς µου, Πάρι και Νατάσσα, οι οποίοι µου συµπαραστάθηκαν σταθερά και µε
οποιοδήποτε τρόπο µπορούσαν καθ’ όλη τη διάρκεια των σπουδών µου. Ακόµη, τους
φίλους Κωνσταντίνο Χανόπουλο, Γωγώ Κώνστα και Στέλλα Κοτζαµπασάκη, οι
οποίοι µε την εµπειρία τους µε βοήθησαν σε µια σειρά πρακτικών προβληµάτων.
Τέλος, θα ήθελα να ευχαριστήσω θερµά τη σύζυγό µου Κατερίνα, η οποία υπέµενε τα
τελευταία τέσσερα χρόνια τον εκνευρισµό και το άγχος που κατά διαστήµατα µού
δηµιούργησαν οι σπουδές µου, καθώς και το τετράποδο µέλος της οικογένειάς µας,
ένα γλυκύτατο Γερµανικό Ποιµενικό που ακούει στο όνοµα Πέρσα.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 9
Σχήµατα
Σχήµα 2.1: Διάγραµµα χρόνου- κέρδους- ρυθµού µεταβολής κέρδους……………..13
Σχήµα 2.2: Διάγραµµα βέλτιστου χρόνου παραµονής εντός µιας περιοχής………...16
Σχήµα 2.3: Διάγραµµα εµπλουτισµού περιοχών…………………………………….18
Σχήµα 2.4: Δενδρική δοµή ενός ιστότοπου………………………………………….25
Σχήµα 3.1: Διάγραµµα χρόνου πρώτου περάσµατος………………………………..33
Σχήµα 3.2: Κατανοµή συχνότητας των χρηστών, συναρτήσει του αριθµού των
συνδέσµων που επισκέπτονται…………………………………………..34
Σχήµα 3.3: Διάγραµα της αρχιτεκτονικής του µοντέλου SNIF-ACT……………….36
Σχήµα 3.4: Παράδειγµα προσοµοίωσης µε το µοντέλο MESA..................................41
Σχήµα 3.5: Παράδειγµα προσοµοίωσης µε το µοντέλο CoLiDeS…………………..45
Σχήµα 3.6: Διάγραµµα του αλγορίθµου που χρησιµοποιεί το µοντέλο CoLiDeS+…48
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 10
Εικόνες
Εικόνα 5.1: Χάρτης απεικόνισης (heatmap) των σηµείων στα οποία εστίασαν οι
χρήστες τριών διαφορετικών ιστοσελίδων...............................................65
Εικόνα 5.2: Παράδειγµα χρήσης του Responsive Web Design……………………..73
Εικόνα 5.3: Παράδειγµα εµφάνισης ιστοσελίδας σε υπολογιστή και σε κινητό….....76
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 11
Περιεχόµενα
1.Εισαγωγή .................................................................................................................13	
  
1.1 Προέλευση της θεωρίας......................................................................................13	
  
1.2 Από το Optimal Foraging στο Information Foraging.........................................14	
  
1.3 Σηµασία και εφαρµογή της θεωρίας του Information Foraging.........................15	
  
2.Παρουσίαση και επεξήγηση του Information Foraging......................................16	
  
2.1 Αρχικές- βασικές έννοιες....................................................................................16	
  
2.1.1. Patch Model.................................................................................................16	
  
2.1.2. Diet Model...................................................................................................25	
  
2.1.3. Information scent.........................................................................................28	
  
2.2 Information Foraging και δοµή του Παγκόσµιου Ιστού.....................................28	
  
3.Τεχνικές µοντελοποίησης της πλοηγητικής συµπεριφοράς των χρηστών.........33	
  
3.1 Ανάλυση Bayes ..................................................................................................33	
  
3.2 Εξαπλούµενη ενεργοποίηση- Spreading activation............................................35	
  
3.3 Random Utility Model........................................................................................35	
  
3.4 Ο νόµος της περιήγησης.....................................................................................37	
  
3.5 Μοντέλο SNIF-ACT...........................................................................................40	
  
3.6 MESA.................................................................................................................46	
  
3.7 CoLiDeS.............................................................................................................48	
  
3.7.1 CoLiDeS+.....................................................................................................52	
  
3.7.2 CoLiDeS + Pic .............................................................................................54	
  
4. Μέθοδοι υποβοήθησης του χρήστη κατά τη διαδικασία αναζήτησης
πληροφορίας ...............................................................................................................56	
  
4.1 Μέθοδοι υποβοήθησης και Δεδοµένα Δοµής – Link Analysis ..........................56	
  
4.1.1 Αρχική µέθοδος LAR...................................................................................57	
  
4.1.2 Μέθοδος PageRank......................................................................................58	
  
4.1.3 HITS.............................................................................................................60	
  
4.1.4 Αλγόριθµοι LAR σχετιζόµενοι µε το spam..................................................60	
  
4.2 Μέθοδοι υποβοήθησης και Δεδοµένα Περιεχοµένου ........................................62	
  
4.2.1 Μέθοδοι προεπεξεργασίας δεδοµένων.........................................................62	
  
4.2.2 Αναπαράσταση του περιεχοµένου σε µορφή διανύσµατος..........................63	
  
4.3 Εξατοµικευµένη αναζήτηση στον Ιστό ..............................................................64	
  
4.3.1 Μειονεκτήµατα της εξατοµικευµένης αναζήτησης .....................................66	
  
5. Εφαρµογές στο σχεδιασµό ιστοσελίδων φιλικών προς το χρήστη ....................68	
  
5.1 Σχεδιασµός µε βάση το information scent..........................................................69	
  
5.2 Πλοηγητική συµπεριφορά και πρακτικές των χρηστών.....................................70	
  
5.3 Σχεδιάζοντας ιστοσελίδες φιλικές προς το χρήστη ............................................72	
  
5.3.1 Έµφαση στο information scent ....................................................................75	
  
5.3.2 Απλότητα στο σχεδιασµό και τη γλώσσα ....................................................76	
  
5.3.3 Χρόνος φόρτωσης της ιστοσελίδας..............................................................77	
  
5.3.4 Responsive Design (Αποκριτικός Σχεδιασµός) ...........................................77	
  
5.3.5 Adaptive Web Design ..................................................................................80	
  
5.3.6 Εφαρµογές για κινητές συσκευές (mobile applications)..............................81	
  
6. Προοπτικές και διαφαινόµενες τάσεις .................................................................83	
  
6.1 Social Computing ...............................................................................................83	
  
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 12
6.1.1 Social Computing και Information Foraging ...............................................87	
  
6.2 Web Intelligence.................................................................................................87	
  
6.3. Οντολογία..........................................................................................................87	
  
6.4 Semantic Web.....................................................................................................88	
  
6.5 Web mining και Κοινωνικά Δίκτυα ...................................................................91	
  
7. Επίλογος – συµπεράσµατα ....................................................................................93	
  
Γλωσσάρι ....................................................................................................................95	
  
Ευρετήριο όρων........................................................................................................102	
  
Παραποµπές..............................................................................................................104	
  
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 13
1.Εισαγωγή
Τα τελευταία χρόνια έχουµε γίνει µάρτυρες µιας αλµατώδους αύξησης στον όγκο
των πληροφοριών οι οποίες µας είναι διαθέσιµες. Παράλληλα, τα τεχνολογικά µέσα
που έχουµε στη διάθεσή µας έχουν πολλαπλασιαστεί και έχουν σηµειώσει εκρηκτική
πρόοδο, αποτελώντας τον καθοριστικό παράγοντα τόσο για την παραγωγή όσο και
για την µετάδοση των πληροφοριών αυτών. Ποτέ άλλοτε δεν είχαµε τόσο εύκολα και
τόσο γρήγορα τη δυνατότητα να πληροφορηθούµε για οτιδήποτε µας ενδιαφέρει: Όχι
µόνο µέσω υπολογιστή, αλλά και µέσω κινητών τηλεφώνων, tablet κτλ µπορεί ο
καθένας να πλοηγηθεί αστραπιαία στον Παγκόσµιο Ιστό. Οι άνθρωποι συλλέγουν και
µοιράζονται πληροφορίες και τις µετασχηµατίζουν σε γνώση, χαρακτηριστικό
απαραίτητο για να προσαρµοστούν στην πολυπλοκότητα του κόσµου στον οποίο
ζουν. Η προσαρµοστικότητα αυτή του ανθρώπου αποτέλεσε, αποτελεί και θα
αποτελεί το κλειδί για την εξέλιξή του ως είδους .
Εντούτοις, η αφθονία των διαθέσιµων πληροφοριών δηµιουργεί και προβλήµατα:
Αν κάποτε ο όγκος των πληροφοριών ακολουθούσε µια φυσιολογική ροή, στις µέρες
µας η υπερπληθώρα τους οδηγεί σε σύγχυση και απώλεια της προσοχής µας. Η
έκφραση “βοµβαρδιζόµαστε από πληροφορίες”, αυτό ακριβώς υποδηλώνει. Εκτός
αυτού, στην προσπάθειά µας να βρούµε αυτό που θέλουµε µέσα από τον τεράστιο
όγκο πληροφοριών, χάνουµε πολύτιµο χρόνο. Είναι, εποµένως, πολύ σηµαντικό να
βρούµε πώς µπορούν οι άνθρωποι να µεγιστοποιήσουν το όφελος από τη διαδικασία
ανάκτησης των πληροφοριών που τους ενδιαφέρουν (από το σύνολο των
πληροφοριών που διατίθενται), σε σχέση µε την προσπάθεια (κόστος) που απαιτείται
γι' αυτό. Από τη µια, λοιπόν, πρέπει να εξεταστούν και κατανοηθούν οι µέθοδοι που
χρησιµοποιούν οι άνθρωποι για να συλλέγουν τις πληροφορίες που τους ενδιαφέρουν,
κι από την άλλη πρέπει το περιβάλλον από το οποίο ανακτούν τις πληροφορίες αυτές
να είναι έτσι σχεδιασµένο ώστε να υποβοηθά την αναζήτηση αυτή. Τα ζητήµατα αυτά
εξετάζει η θεωρία του Information Foraging.
1.1 Προέλευση της θεωρίας
Η θεωρία του Information Foraging εµφανίστηκε για πρώτη φορά τη δεκαετία του
'90 από τους Peter Pirolli και Stuart Card [1]. Η κεντρική της ιδέα έχει τις ρίζες της
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 14
στη θεωρία του optimal foraging (βέλτιστη αναζήτηση τροφής), η οποία
πρωτοεµφανίστηκε τη δεκαετία του '60 [2]. Σύµφωνα µε τη θεωρία του optimal
foraging, οι ζωντανοί οργανισµοί αναζητούν τροφή µε τέτοιο τρόπο ώστε να
µεγιστοποιούν την πρόσληψη ενέργειας ανά µονάδα χρόνου. Πιο συγκεκριµένα
ψάχνουν, συλλέγουν και καταναλώνουν τροφή µε τρόπο που να µεγιστοποιεί τις
θερµίδες που λαµβάνουν και να ελαχιστοποιεί το χρόνο που δαπανούν. Η θεωρία του
optimal foraging αναπτύχθηκε στην προσπάθεια των βιολόγων να εξηγήσουν το
µηχανισµό µε τον οποίο ένας θηρευτής αποφασίζει ποιο θήραµα να κυνηγήσει, καθώς
και πότε και γιατί να µετακινηθεί από µια περιοχή σε µια άλλη, κατά την αναζήτηση
τροφής. Η θεωρία αυτή υπήρξε ένα σηµαντικό εργαλείο για τη βιολογία και την
οικολογία, µια και η µελέτη και αποσαφήνιση της συµπεριφοράς των ζώων και των
πρακτικών που ακολουθούν κατά την αναζήτηση τροφής , βοήθησε σηµαντικά στην
κατανόηση της προσαρµοστικότητας και της εξελικτικής διαδικασίας των ειδών.
Μεταξύ αυτών, και του ανθρώπου, µια και η ίδια θεωρία χρησιµοποιήθηκε και στην
ανθρωπολογία για την κατασκευή µοντέλων συµπεριφοράς τα οποία να προβλέπουν
και να επεξηγούν πώς ο άνθρωπος εξελίσσεται και προσαρµόζεται στις εκάστοτε
συνθήκες του περιβάλλοντός του.
1.2 Από το Optimal Foraging στο Information Foraging
Η βασική ιδέα που αποτέλεσε το ερέθισµα για την ανάπτυξη της θεωρίας του
Information Foraging ήταν ότι οι άνθρωποι, κατά την αναζήτηση πληροφορίας,
εµφανίζουν παρόµοια συµπεριφορά µε τα ζώα-θηρευτές κατά την αναζήτηση τροφής.
Πιο συγκεκριµένα, παίρνουν αποφάσεις για το πού θα ψάξουν για τις πληροφορίες
που τους ενδιαφέρουν, τα εργαλεία που θα χρησιµοποιήσουν, πότε θα αλλάξουν το
σηµείο στο οποίο ψάχνουν ή τη στρατηγική µε την οποία ψάχνουν, επανεκτιµώντας
και αξιολογώντας τα αποτελέσµατα της µέχρι τότε αναζήτησής τους, µε σκοπό να
βελτιστοποιήσουν το κέρδος (τη λήψη πληροφοριών), σε συνάρτηση µε το χρόνο που
απαιτείται. Η µε αυτό τον τρόπο θεώρηση του ανθρώπου ως “θηρευτή” και η
συµπεριφορά του κατά την αναζήτηση πληροφοριών, αναπαρίσταται µε την έννοια
του “πληροφοριοφάγου” ή και “πληροφοριοβόρου” (informavore), η οποία
αποδίδεται στον George A. Miller [3].
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 15
1.3 Σηµασία και εφαρµογή της θεωρίας του Information Foraging
Η µελέτη του τρόπου µε τον οποίο οι άνθρωποι ψάχνουν για πληροφορίες στον
Παγκόσµιο Ιστό µε τη βοήθεια της θεωρίας του Information Foraging παράγει
αποτελέσµατα και σηµαντικά οφέλη σε διάφορα πεδία: Από τη µια µας βοηθάει να
κατανοήσουµε τη συµπεριφορά των χρηστών κατά τη διαδικασία ανεύρεσης
πληροφοριών στο Web ·από την άλλη δίνει πολύτιµες πληροφορίες για το πώς πρέπει
να είναι σχεδιασµένο το πλοηγητικό περιβάλλον πχ µιας ιστοσελίδας ώστε να
διευκολύνει το χρήστη στην ανάκτηση των πληροφοριών που τον ενδιαφέρουν,
ακόµα και να υποβοηθά τις διαφορετικές τεχνικές και στρατηγικές που µπορεί να
χρησιµοποιήσουν οι διάφοροι χρήστες. Επιπλέον, η θεωρία αυτή αναγνωρίζει ότι η
ανάκτηση πληροφοριών είναι µια δυναµική διαδικασία και υποβοηθά τη σχεδίαση
συστηµάτων που να λαµβάνουν υπ' όψη το γεγονός αυτό.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 16
2.Παρουσίαση και επεξήγηση του Information Foraging
2.1 Αρχικές- βασικές έννοιες
Όπως προαναφέρθηκε, η θεωρία του Information Foraging βασίζεται κατά µεγάλο
βαθµό στα µοντέλα και τις τεχνικές που έχουν αναπτυχθεί από τη θεωρία του Optimal
Foraging. Πιο συγκεκριµένα, δύο από τα µοντέλα αυτά αποτελούν την απαρχή για
την κατανόηση, επεξήγηση και ανάπτυξη του Information Foraging : α) το µοντέλο
των περιοχών (patch model) , το οποίο αναλύει ζητήµατα σχετικά µε την εύρεση και
εκµετάλευση των πόρων που ενδιαφέρουν το θηρευτή, όταν οι πόροι είναι
κατανεµηµένοι (διασκορπισµένοι) σε περιοχές (patches) [4], και β) το µοντέλο της
διατροφής (diet model ), το οποίο εξηγεί και αναλύει τι διαλέγει να καταναλώσει και
τι απορρίπτει ένας θηρευτής [4]. Μια τρίτη έννοια, αυτή του information scent [5],
χρησιµοποιείται για να περιγράψει τον εντοπισµό και τη χρησιµοποίηση στοιχείων
όπως οι βιβλιογραφικές αναφορές, εικόνες, αποσπάσµατα κειµένου ή σύνδεσµοι στο
διαδίκτυο, τα οποία µας δίνουν συνοπτικές πληροφορίες (ενδείξεις) σχετικά µε το
περιεχόµενο ενός βιβλίου ή µιας ιστοσελίδας. Παρακάτω θα αναλυθούν διεξοδικά οι
έννοιες αυτές.
2.1.1. Patch Model
Όπως προαναφέρθηκε, οι οργανισµοί διαβιούν σε ένα περιβάλλον στο οποίο η
τροφή τους βρίσκεται κατανεµηµένη (διασκορπισµένη) ανά περιοχές (patches):
Άλλες περιοχές έχουν µεγαλύτερη πυκνότητα φαγητού, άλλες παρουσιάζουν
µεγαλύτερη ποικιλία, οι περιοχές έχουν µεταξύ τους διαφορετικές αποστάσεις κτλ.
Κατ' αναλογία, το περιβάλλον µέσα στο οποίο ψάχνουµε, συλλέγουµε και
χρησιµοποιούµε πληροφορίες έχει µια ανάλογη δοµή:
• Πληροφορίες οι οποίες βρίσκονται συγκεντρωµένες σε κάποιο βιβλίο, σε
κάποιο συγκεκριµένο κεφάλαιο ή σε διαφορετικά κεφάλαια µέσα στο ίδιο
βιβλίο, ή ακόµα και σε άλλα βιβλία.
• Βιβλία σχετικά µε κάποιο θέµα, τα οποία είναι συγκεντρωµένα σε κάποιο
ράφι.
• Βιβλιοθήκες που έχουν ταξινοµηµένα βιβλία ανά θεµατική ενότητα και
βιβλιοθήκες περισσότερο ή λιγότερο εξειδικευµένες, σε διαφορετικές µεταξύ
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 17
τους αποστάσεις.
Ο ενδιαφερόµενος, λοιπόν, πηγαίνει από κεφάλαιο σε κεφάλαιο, από βιβλίο σε
βιβλίο, από ράφι σε ράφι και από βιβλιοθήκη σε βιβλιοθήκη ψάχνοντας και
συλλέγοντας τις πληροφορίες που τον ενδιαφέρουν, όπως κάποιος θηρευτής πηγαίνει
από περιοχή σε περιοχή ψάχνοντας το εκάστοτε θήραµά του. Όπως θα δούµε
παρακάτω, και ο Παγκόσµιος Ιστός έχει µια ανάλογη δοµή περιοχών και ιεραρχίας.
Εκτός αυτού, κατά τη διαδικασία αναζήτησης τροφής , ο θηρευτής προσαρµόζει την
τακτική του ανάλογα µε την περιοχή και το θήραµα: Μπορεί να πρέπει να περιµένει
κρυµµένος πχ ανάµεσα σε θάµνους µέχρι την κατάλληλη στιγµή που θα επιτεθεί στο
θήραµα ή πρέπει να είναι πολύ γρήγορος ώστε να πετύχει καλύτερα αποτελέσµατα
δια του αιφνιδιασµού. Άλλες φορές ίσως θα πρέπει να είναι και προσεκτικός και
γρήγορος ώστε να µη µετατραπεί ο ίδιος σε θήραµα κάποιου άλλου θηρευτή. Κατ'
αναλογία, ψάχνοντας κάποιος για πληροφορίες, πρέπει να προσαρµόσει τον τρόπο
που ψάχνει ανάλογα µε το µέρος: Ίσως θα πρέπει να βρει κάποια σχετικά βιβλία τα
οποία θα έχει συγκεντρωµένα στο ίδιο σηµείο ή θα σκεφτεί µε ποια σειρά θα
επισκεφτεί κάποιες διαφορετικές βιβλιοθήκες οι οποίες πιθανόν να έχουν τις
πληροφορίες που τον ενδιαφέρουν. Με άλλα λόγια, θα πρέπει να σχεδιάσει τον τρόπο
“δράσης” του ώστε να επιτύχει το επιδιωκόµενο αποτέλεσµα. Και, φυσικά, θα πρέπει
να αναθεωρήσει και να αλλάξει το πλάνο του ανάλογα µε αλλαγές και προβλήµατα
που µπορεί να προκύψουν, όπως , για παράδειγµα, τη δυσκολία να πάει σε µια
βιβλιοθήκη επειδή έχουν απεργία τα Μέσα Μαζικής Μεταφοράς .
Επιπρόσθετα, το περιβάλλον στο οποίο αναζητούµε πληροφορίες i) παρουσιάζει
επίσης µια ιεραρχική δοµή και ii) δεν είναι στατικό, αλλά µπορούµε, σε µικρό ή
µεγάλο βαθµό, να του δώσουµε τη µορφή που µας βολεύει περισσότερο: Ας πάρουµε
για παράδειγµα το περιβάλλον εργασίας του γραφείου στο οποίο µελετάµε. Τα
έγγραφα που χρησιµοποιούµε περισσότερο συνήθως βρίσκονται σε µικρότερη
απόσταση, ώστε να είναι άµεσα διαθέσιµα. Μπορεί να είναι στοιβαγµένα, ή ακόµα
καλύτερα ταξινοµηµένα για ακόµα πιο γρήγορη (άρα, αποτελεσµατική) πρόσβαση.
Σε κάποιο ράφι, πιο µακριά, µπορεί να έχουµε κάποια βιβλία τα οποία
συµβουλευόµαστε σπανιότερα. Και, λογικά, έχουµε µπροστά µας τον υπολογιστή
ώστε να ψάξουµε γρήγορα πληροφορίες για κάτι το οποίο δεν έχουµε σε έντυπη
µορφή, είτε έχοντάς το αποθηκευµένο στο σκληρό δίσκο είτε κάνοντας µια
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 18
αναζήτηση στο διαδίκτυο. Δεν υπάρχει, όµως, κάποιος απόλυτος κανόνας σύµφωνα
µε τον οποίο το κάθε τι θα µπει σε συγκεκριµένη θέση. Αντιθέτως, ο καθένας µπορεί
να διαµορφώσει το χώρο του ανάλογα µε το πώς τον βολεύει καλύτερα αλλά και να
αλλάξει τη διαµόρφωση του, αν το κρίνει σκόπιµο.
Ας δούµε πιο συγκεκριµένα τι σηµαίνει η εύρεση πληροφοριών σε ένα περιβάλλον
που είναι δοµηµένο όπως αναφέρθηκε στις προηγούµενες παραγράφους: Όταν
κάποιος ψάχνει για πληροφορίες, περιηγείται µέσα στο εκάστοτε περιβάλλον µέχρι να
βρει µια περιοχή η οποία φαίνεται να έχει αυτό που τον ενδιαφέρει. Δαπανά, λοιπόν ,
κάποιο χρόνο όταν µετακινείται (ψάχνει) ανάµεσα στις περιοχές. Όταν, δε, βρεθεί σε
µια περιοχή, ξεκινά το ψάξιµο µέσα στην περιοχή. Κάποια στιγµή, όταν πια δε
βρίσκει άλλες χρήσιµες πληροφορίες ή όταν θεωρήσει ότι θα βρει πιο γρήγορα και
πιο πολλές πληροφορίες αν µετακινηθεί σε άλλη περιοχή, εγκαταλείπει την τρέχουσα
για κάποια άλλη. Για να ποσοτικοποιήσουµε τα παραπάνω, ας ονοµάσουµε G το
κέρδος ( gain ) της συνολικής διαδικασίας. Για το θηρευτή που ψάχνει για τροφή,
αυτό θα µπορούσε να είναι οι συνολικές θερµίδες που θα µαζέψει . Για τον άνθρωπο,
µπορεί να είναι ένα σύνολο χρήσιµων πληροφοριών που ανακτήθηκαν για κάποιο
συγκεκριµένο στόχο. Ένα απλουστευµένο διάγραµµα της παραπάνω διαδικασίας
παρουσιάζεται στο Σχ. 2.1.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 19
Το γράφηµα αντιπροσωπεύει το κέρδος (πληροφορίες) που µαζεύει ο
ενδιαφερόµενος. Βρισκόµενος µέσα σε κάποια περιοχή, όποτε συλλέγει πληροφορίες,
η γραφική παράσταση ανεβαίνει (αύξηση κέρδους G). Μετά περνάει κάποιος χρόνος
ψάχνοντας για την επόµενη περιοχή , εισέρχεται σε µια καινούργια και µόλις
συλλέξει νέες πληροφορίες, η γραφική παράσταση αυξάνεται εκ νέου. Σύµφωνα µε
το µοντέλο των περιοχών, ο συνολικός δαπανόµενος χρόνος Τ διαιρείται σε δύο
διακριτά µεταξύ τους µέρη: Στο χρόνο ο οποίος δαπανάται κατά τη µετακίνηση
από τη µια περιοχή στην άλλη και στον εντός των περιοχών, κατά τη διάρκεια
εύρεσης και συλλογής. Το Σχ. 2.1.β αποτελεί µια αναδιάταξη του Σχ. 2.1.α,
παραθέτοντας πρώτα το χρόνο ανάµεσα στις περιοχές και µετά εντός των περιοχών.
Με τη διάταξη αυτή το κέρδος παρουσιάζεται µόνο συναρτήσει του χρόνου εντός των
περιοχών. Επίσης, η ευθεία που ξεκινά από την αρχή των αξόνων και καταλήγει στο
τέλος του γραφήµατος αποτελεί το ρυθµό µεταβολής R του κέρδους, ο οποίος
ισούται µε το πηλίκο του συνολικού κέρδους G προς τον συνολικό δαπανόµενο χρόνο
TA
ΤΕ
Σχήµα 2.1: α) διάγραµµα του αυξανόµενου κέρδους ενός υποθετικού θηρευτή,
µετακινούµενου από περιοχή σε περιοχή. β) ο ρυθµός µεταβολής κέρδους R,
εκφρασµένος ως ο λόγος του συνολικού κέρδους G προς το άθροισµα των χρόνων
ανάµεσα και εντός των περιοχών [6,σελ.13].
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 20
(2.1) . Η ποσότητα R αποτελεί δείκτη της ικανότητας του θηρευτή. Στη
µορφή αυτή, όµως, δεν είναι ιδιαίτερα χρήσιµη, καθώς απαιτείται ο συνολικός χρόνος
και το συνολικό κέρδος για να αποφανθεί κανείς σχετικά µε την ικανότητα του
θηρευτή. Κάνοντας µερικές παραδοχές µπορούµε να οδηγηθούµε σε µια πιο χρήσιµη
µορφή της εξίσωσης 2.1 :
1. Ο αριθµός των περιοχών που επισκέπτεται ο θηρευτής εξαρτάται από το
χρόνο που δαπανάται ανάµεσα στις περιοχές
2. Ο µέσος χρόνος που δαπανάται από περιοχή σε περιοχή είναι
3. Ο µέσος χρόνος εντός κάθε περιοχής είναι
4. Το µέσο κέρδος ανά περιοχή είναι
Δεδοµένου κάποιου συνολικού χρόνου που έχει στη διάθεσή του ο θηρευτής, όσο
περισσότερος χρόνος δαπανάται ανάµεσα στις περιοχές, τόσο λιγότερες είναι οι
περιοχές που επισκέπτεται. Αν ονοµάσουµε (2.2) το ρυθµό µε τον οποίο
επισκέπτεται µια περιοχή (ανά µονάδα χρόνου), το συνολικό κέρδος G θα είναι
(2.3), αφού το γινόµενο εκφράζει το συνολικό αριθµό περιοχών τις
οποίες θα επισκεφτεί ο θηρευτής. Ανάλογα, ο συνολικός χρόνος εντός των περιοχών
θα είναι (2.4) . Αντικαθιστώντας στην εξίσωση 2.1 θα έχουµε
(2.5) . Η εξίσωση αυτή ονοµάζεται Εξίσωση Δίσκου του
Holling [7]. Είναι , δε, πιο χρήσιµη από την εξίσωση (2.1), µια και χρησιµοποιεί τους
µέσους όρους µεγεθών, τα οποία µπορούµε να πάρουµε από δειγµατοληπτική
µέτρηση του περιβάλλοντος.
Αν υποθέσουµε ότι έχουµε ένα περιβάλλον που έχει δοµή περιοχών, µε την κάθε
περιοχή να έχει το δικό της κέρδος (πληροφορίες), µπορούµε να βγάλουµε τα
παρακάτω συµπεράσµατα (λαµβάνοντας υπ' όψιν και την εξίσωση (2.5) ):
• Το περιβάλλον µπορεί να γίνει πιο “πλούσιο” από πλευράς κέρδους αν
αυξηθεί η πυκνότητα των περιοχών που το αποτελούν. Στην περίπτωση αυτή,
µειώνεται ο χρόνος ανάµεσα στις περιοχές, οπότε αυξάνονται οι περιοχές που
R=
G
TA+ TE
tA
tE
g
λ=
1
tA
G= λ TA g λ TA
ΤΕ= λΤΑ tE
R=
λ TA g
TA+ λ TA tE
=
λ g
1+ λ tE
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 21
µπορεί να επισκεφτεί ο ενδιαφερόµενος (αυξάνεται το λ).
• Ένας άλλος τρόπος για να γίνει πιο “πλούσιο” το περιβάλλον είναι να αυξηθεί
το κέρδος που µπορεί να αποκοµίσει κάποιος µέσα σε κάθε περιοχή (αύξηση
του g), αυξάνοντας έτσι το συνολικό κέρδος.
Για κάθε περιοχή, µπορούµε να ορίσουµε ως κερδοφορία (profitability) το πηλίκο
του κέρδους g προς το χρόνο δηλ. (2.6). Αυξάνοντας την κερδοφορία των
περιοχών, αυξάνεται ο ρυθµός µεταβολής του κέρδους R. Από την άλλη, µειώνοντας
το χρόνο ανάµεσα στις περιοχές (αλλιώς, αυξάνοντας το λ), η εξίσωση (2.5) τείνει
ασυµπτωτικά να εξισωθεί µε την κερδοφορία των περιοχών, δηλ. R=π.
Το συµβατικό µοντέλο περιοχών της θεωρίας του optimal foraging [4] αποτελεί µια
ανάπτυξη της Εξίσωσης Δίσκου του Holling. Χρησιµοποιεί µια σειρά υποθέσεων για
να βελτιστοποιήσει την κατανοµή του συνολικού χρόνου που δαπανάται ανάµεσα
στις περιοχές και εντός τους. Σύµφωνα µε το µοντέλο , α) το περιβάλλον αποτελείται
από διαφορετικά είδη περιοχών (άρα και διαφορετικό κέρδος ανά περιοχή) και β) το
κέρδος ανά περιοχή εξαρτάται και από το δαπανώµενο χρόνο εντός της περιοχής, ο
οποίος είναι υπό τον έλεγχο του θηρευτή. Η βελτιστοποίηση έγκειται στο πόσος
χρόνος πρέπει να δαπανηθεί εντός µιας περιοχής προτού ο θηρευτής µετακινηθεί
στην επόµενη.
Πιο συγκεκριµένα, θεωρείται ότι το περιβάλλον αποτελείται από
διαφορετικές περιοχές. Κάθε διαφορετική περιοχή αποτελείται από τα εξής
χαρακτηριστικά:
• , την εξάπλωση ή συχνότητα εµφάνισης (prevalence)µιας περιοχής τύπου i,
• , το χρόνο παραµονής που περνάει ο θηρευτής εντός µιας περιοχής τύπου
i,
• , το κέρδος µιας περιοχής τύπου i, συναρτήσει του χρόνου που
δαπανάται εντός της περιοχής αυτής.
Λαµβάνοντας υπ' όψιν τα παραπάνω, η εξίσωση (2.5) παίρνει τη µορφή
(2.7) .
tE
π=
g
tE
1,2,...,i,..., P
λi
tEi
gi(tEi )
R=
∑
i= 1
P
λigi(tEi )
1+ ∑
i= 1
P
λi tEi
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 22
Το κέρδος g ανά περιοχή εκφράζεται πάντα µέσω µιας σχέσης-συνάρτησης. Η
συνάρτηση αυτή δεν έχει την ίδια µορφή, αλλά εξαρτάται από το αντικείµενο και τη
φύση της αναζήτησης. Για παράδειγµα, αν κάποιος κάνει µια αναζήτηση στο ίντερνετ
γύρω από κάποιο αντικείµενο και η αναζήτηση επιστρέψει µια λίστα από
πεπερασµένο αριθµό συνδέσµων, µια απλή καταγραφή των ιστοσελίδων στις οποίες
παραπέµπει κάθε σύνδεσµος θα εκφραστεί µε µια γραµµική συνάρτηση κέρδους.
Γενικά, όµως, το κέρδος από την αναζήτηση µέσα σε µια περιοχή µειώνεται µε την
πάροδο του χρόνου, δηλαδή η συνάρτηση που περιγράφει το κέρδος συνήθως
εκφράζεται από µια καµπύλη, της οποίας η κλίση µειώνεται όσο περνάει ο χρόνος
µέσα στην περιοχή. Μια τέτοια περίπτωση αποτυπώνεται γραφικά στο Σχ. 2.2.
Το σηµείο του Σχ. 2.2 είναι το χρονικό σηµείο στο οποίο ο θηρευτής είτε ξεκινάει
την αναζήτηση κάποιας περιοχής είτε εγκαταλείπει κάποια για µια καινούργια. Αν
φέρουµε µια ευθεία µε σηµείο εκκίνησης το , η οποία εφάπτεται της καµπύλης του
, τότε η κλίση της ευθείας µας δίνει το βέλτιστο ρυθµό κέρδους R. Επίσης, το
σηµείο στο οποίο εφάπτεται µε την καµπύλη µας δίνει και το βέλτιστο χρόνο
παραµονής µέσα στην περιοχή.
tA
tA
g(tE)
ct
Σχήµα 2.2: Σύµφωνα µε το Θεώρηµα Περιθωριακής Τιµής του Charnov, ο
βέλτιστος χρόνος παραµονής εντός της περιοχής βρίσκεται από το σηµείο στο
οποίο η γρ.παράσταση της g (t) εφάπτεται της ευθείας R* [6, σελ. 36].
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 23
Για τη µαθηµατική επεξήγηση του Σχ. 2.2 θα χρησιµοποιήσουµε το Θεώρηµα
Περιθωριακής Τιµής (Marginal Value Theorem -MVT) του Charnov [8], το οποίο
µας βοηθά να βρούµε πότε είναι η κατάλληλη χρονικά στιγµή για έναν θηρευτή να
εγκαταλείψει µια περιοχή για µια άλλη. Ας υποθέσουµε λοιπόν ότι έχουµε ένα είδος
περιοχής και είναι ο ρυθµός µεταβολής του κέρδους (πάντα υπό τη συνθήκη
ότι το κέρδος g είναι συνάρτηση του χρόνου εντός της περιοχής), οπότε θα είναι
(2.8) . Επίσης, έστω g' η παράγωγος (περιθωριακή τιµή) της
συνάρτησης κέρδους g. Σύµφωνα µε το Θεώρηµα Περιθωριακής Τιµής του Charnov,
ο βέλτιστος χρόνος παραµονής εντός της περιοχής είναι αυτός για τον οποίο ισχύει
(2.9) . Σε περίπτωση που υπάρχουν παραπάνω από µία
περιοχές, ο συνολικός ρυθµός µεταβολής του κέρδους εξαρτάται από το βέλτιστο
χρόνο για κάθε τύπο περιοχής, ο οποίος µε τη σειρά του βρίσκεται από το
παρακάτω σύνολο εξισώσεων:
(2.10).
Αξίζει να σηµειωθεί ότι στην περίπτωση πολλαπλών τύπων περιοχών, το Θεώρηµα
Περιθωριακής Τιµής δεν παρίσταται γραφικά µε τόσο απλό τρόπο όπως στο Σχ. 2.2 .
Το συµβατικό µοντέλο περιοχών το οποίο παρουσιάστηκε παραπάνω χρησιµοποιεί
ως υπόθεση ότι το περιβάλλον στο οποίο ενεργεί ο θηρευτής είναι αναλλοίωτο. Στην
πράξη, όµως, για αυτόν που ψάχνει για πληροφορίες, κάτι τέτοιο δεν ισχύει.
Αντίθετα, µπορεί να επέµβει στο περιβάλλον έτσι ώστε να γίνουν πιο αποδοτικές οι
διάφορες στρατηγικές που χρησιµοποιεί. Η διαδικασία αυτή ονοµάζεται
εµπλουτισµός (enrichment).
R(tE)
R(tE)= λg(tE)
1+ λ tE
ct
tEi
g'1( ̂tE1)= R( ̂tE1, ̂tE2,..., ̂tEP)
g'( ̂tE2)= R( ̂tE1, ̂tE2,..., ̂tEP)
g'P( ̂tEP)= r( ̂tE1, ̂tE2,..., ̂tEP)
lg (ct) = R (ct) =
1 + m (ct)
mg(ct)
h h
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 24
Εµπλουτισµός ανάµεσα και εντός των περιοχών
Ένας τρόπος εµπλουτισµού του περιβάλλοντος γίνεται µειώνοντας το χρόνο που
απαιτείται για να µετακινηθεί κάποιος από τη µια περιοχή στην άλλη. Παράδειγµα
αυτού είναι ο τρόπος µε τον οποίο οργανώνει κάποιος το γραφείο του, ώστε να
βρίσκει πιο γρήγορα τις εκάστοτε πληροφορίες που αναζητεί. Γεννιέται, όµως, και το
ακόλουθο πρόβληµα: Είναι προτιµότερο κανείς να δαπανήσει χρόνο για να µειώσει
το χρόνο ανάµεσα στις περιοχές ή να τον χρησιµοποιήσει για ψάξιµο εντός των
περιοχών;
Ένας άλλος τρόπος εµπλουτισµού είναι βελτιώνοντας το κέρδος που αποκοµίζει
κανείς ανά περιοχή. Αυτό µπορεί να γίνει, για παράδειγµα, αν κάποιος φιλτράρει τα
αποτελέσµατα της αναζήτησής του, χρησιµοποιώντας λέξεις-κλειδιά. Ή
φιλτράροντας τα εισερχόµενα mail του σε spam και αποδεκτά, ή ακόµα και
δηµιουργώντας κατηγορίες ανάλογα µε τους αποστολείς. Κι αυτή, όµως, η διαδικασία
γεννά ένα αντίστοιχο πρόβληµα: Είναι προτιµότερο κάποιος να επενδύσει χρόνο για
να έχει µελλοντικά καλύτερη εκµετάλλευση των περιοχών ή να χρησιµοποιήσει αυτό
το χρόνο για το ψάξιµο των περιοχών;
Χρησιµοποιώντας πάλι το συµβατικό µοντέλο περιοχών, οδηγούµαστε στο Σχ. 2.3.
Όπως φαίνεται στο Σχ. 2.3.α, µειώνοντας το χρόνο ανάµεσα στις περιοχές,
αυξάνεται ο ρυθµός µεταβολής του κέρδους . Εκτός αυτού, όµως, µειώνεται και ο
t A
R
Σχήµα 2.3: α) ο ρυθµός µεταβολής κέρδους R βελτιώνεται αν µειωθεί ο χρόνος
ανάµεσα στις περιοχές. β) το ίδιο επιτυγχάνεται αν βελτιωθεί η καµπύλη της
γρ.παράστασης της συνάρτησης κέρδους g(t) [6, σελ.36].
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 25
βέλτιστος χρόνος εντός της περιοχής. Αντίστοιχα, όπως βλέπουµε στο Σχ. 2.3.β, αν
αυξηθεί η συνάρτηση κέρδους , αυξάνεται ο ρυθµός µεταβολής του κέρδους
, αλλά µειώνεται και ο βέλτιστος χρόνος παραµονής εντός της περιοχής.
2.1.2. Diet Model
Ας θεωρήσουµε έναν θηρευτή, ο οποίος βρίσκεται σε ένα περιβάλλον µε ποικιλία
διαφορετικών θηραµάτων, το καθένα από τα οποία βρίσκεται σε διαφορετική
πληθυσµιακή συγκέντρωση, αλλά και µε διαφορετική ευκολία για τον θηρευτή στο
να τα εντοπίσει, να τα κυνηγήσει και να τα καταναλώσει. Ανάλογα µε τις ανάγκες
του θηρευτή, ποια είδη θηραµάτων θα πρέπει να κυνηγήσει και ποια να αποφύγει; Αν
επιλέξει να κυνηγήσει πολλά είδη θηραµάτων, θα πιάνει και θηράµατα τα οποία δε θα
του αποφέρουν σηµαντικό κέρδος (θερµίδες). Αν είναι πολύ εκλεκτικός, τότε θα
χάνει πολύ χρόνο στο ψάξιµο του συγκεκριµένου είδους που θα τον ενδιαφέρει. Με
άλλα λόγια, από ποια και πόσα είδη θα πρέπει να αποτελείται η δίαιτά (διατροφή)
του; Το συµβατικό µοντέλο δίαιτας [4] ασχολείται µε τα ζητήµατα αυτά. Κατ' αρχάς,
παίρνει ως δεδοµένες κάποιες υποθέσεις. Συγκεκριµένα, θεωρείται ότι:
• Τα θηράµατα, συναρτήσει του χρόνου, συναντώνται µε συνεχή ρυθµό
• Το ψάξιµο και η διαχείριση (περιλαµβανόµενης της καταδίωξης) των
θηραµάτων αποτελούν δύο αµοιβαία ανεξάρτητες διαδικασίες
• ο θηρευτής έχει πλήρη γνώση των θηραµάτων και του περιβάλλοντος όσον
αφορά την πληθυσµιακή παρουσία, το ενεργειακό κέρδος και το κόστος
ανεύρεσης και διαχείρισης των θηραµάτων
• οι πληροφορίες σχετικά µε τα θηράµατα είναι πλήρως διαθέσιµες και µπορούν
να χρησιµοποιηθούν άµεσα, όταν κάποιο θήραµα εντοπιστεί.
Είναι σηµαντικό να επισηµανθεί ότι οι υποθέσεις που υιοθετεί το µοντέλο ως
δεδοµένες, δεν ισχύουν απαραίτητα, καθώς επίσης και ότι δε λαµβάνονται υπ' όψιν
άλλοι παράγοντες οι όποιοι µπορούν να επηρεάσουν τη διαδικασία. Για παράδειγµα,
ένας θηρευτής δεν έχει πιθανότατα όσο χρόνο θα ήθελε στη διάθεσή του για να
κυνηγήσει, επειδή αυτό µπορεί να αποβεί µοιραίο για τη ζωή του (να αποτελέσει
δηλαδή κι ο ίδιος θήραµα ενός µεγαλύτερου θηρευτή) ή επειδή µπορεί να πρέπει
σύντοµα να επιστρέψει στη φωλιά/καταφύγιό του, ώστε να προστατεύσει τα µικρά
t
o
g(t) R
t
o
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 26
του.
Σύµφωνα µε το µοντέλο, ο θηρευτής µπορεί να κατατάξει τα θηράµατα σε
διαφορετικούς τύπους, για τους οποίους γνωρίζει το κέρδος που µπορεί
να αποκοµίσει και την πυκνότητα µε την οποία συναντώνται µέσα στην περιοχή. Ο
µέσος χρόνος για να βρεθεί κάποιο θήραµα είναι . Θεωρείται, επίσης , ότι ο
ρυθµός µε τον οποίο συναντάται ένα θήραµα τύπου i ακολουθεί µια τυχαία (Poisson)
κατανοµή. Εποµένως, κάθε θήραµα τύπου i συναντάται µε ρυθµό . Επίσης,
κάθε τύπος θηράµατος έχει ένα µέσο κέρδος , αποτέλεσµα της κατανάλωσής του. Ο
µέσος χρόνος που απαιτείται για να κυνηγήσει, αιχµαλωτίσει και καταναλώσει το
θήραµα ο θηρευτής είναι και αναφέρεται ως κόστος διαχείρισης του κάθε τύπου
θηράµατος i. Τέλος, ονοµάζουµε κερδοφορία του θηράµατος τύπου i το πηλίκο
(2.11) .
Η δίαιτα ενός θηρευτή θα αποτελείται από εκείνα τα διαθέσιµα θηράµατα τα οποία
θα αποφασίσει να κυνηγήσει. Έστω D το πλήθος των διαφορετικών τύπων
θηραµάτων που αποφασίζει να κυνηγήσει ο θηρευτής. Χρησιµοποιώντας την
Εξίσωση Δίσκου του Holling, µπορούµε να βρούµε το µέσο ρυθµό µεταβολής R του
κέρδους g, ο οποίος θα είναι: (2.12) .
Αλγόριθµος επιλογής της βέλτιστης δίαιτας
Αν υποθέσουµε ότι ο χρόνος που απαιτείται για να αναγνωριστεί ο τύπος ενός
θηράµατος είναι αµελητέος, τότε µπορεί να επιλεχθεί η βέλτιστη δίαιτα επιλέγοντας
ποιοι τύποι θηράµατος θα περιλαµβάνονται σε αυτή και ποιοι όχι. Η επιλογή (ή όχι)
ενός τύπου θηράµατος i µπορεί να γίνει µε τη βοήθεια της κερδοφορίας του ως
εξής: Ταξινοµούµε τους τύπους θηράµατος ανά αύξουσα τιµή κερδοφορίας (δηλ.
) και τους προσθέτουµε έναν-έναν στη δίαιτα. Σταµατάµε όταν το
µέχρι στιγµής άθροισµα των πρώτων k τύπων είναι µεγαλύτερο από την κερδοφορία
του αµέσως επόµενου θηράµατος, δηλαδή όταν
1,2,...,i,..., n
tAi
λi=
1
tEi
tWi
πi=
gi
tEi
R=
∑
i∈ D
λi gi
1+ ∑
i∈ D
λi tEi
πi
π1> π2> ...> πn
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 27
(2.13)
Η βέλτιστη δίαιτα µπορεί να απαρτιστεί από λιγότερους τύπους θηραµάτων, είτε αν
αυξήσουµε την κερδοφορία των τύπων που έχουν τον υψηλότερο δείκτη κερδοφορίας
είτε αυξάνοντας την παρουσία (πληθυσµό) των πιο κερδοφόρων τύπων.
Από τον παραπάνω αλγόριθµο εξάγονται δύο σηµαντικά συµπεράσµατα:
1. Είναι προτιµότερο κανείς να µη συµπεριλαµβάνει θηράµατα µε κερδοφορία
χαµηλότερη του µέσου όρου. Κι αυτό γιατί όση ώρα αναλώνεται στην εύρεση
και κατανάλωση θηραµάτων µε µικρή κερδοφορία, χάνει την ευκαιρία να
εντοπίσει θηράµατα µε µεγαλύτερη κερδοφορία.
2. Η επιλογή ενός τύπου θηραµάτων είναι ανεξάρτητη από το πλήθος των
θηραµάτων αυτών. Εξαρτάται µόνο από το πόσο υψηλή κερδοφορία
παρουσιάζουν. Εντούτοις, το πλήθος των διαφορετικών τύπων που θα
περιληφθούν στη δίαιτα εξαρτάται από το πλήθος των θηραµάτων µε υψηλές
κερδοφορίες. Αν τα θηράµατα µε υψηλή κερδοφορία συναντώνται µε µεγάλη
συχνότητα, τότε η δίαιτα τείνει να βελτιστοποιηθεί µε ακόµα λιγότερους
τύπους θηραµάτων.
Για να γίνει αντιληπτό το µοντέλο της δίαιτας, ας θεωρήσουµε µια καθηµερινή
πηγή πληροφόρησης, όπως η τηλεόραση: Αν υποθέσουµε ότι κάποια κανάλια έχουν
κυρίως ειδησεογραφικό περιεχόµενο (υψηλό δείκτη κερδοφορίας), ενώ κάποια άλλα
έχουν κυρίως ή µόνο ψυχαγωγικό περιεχόµενο (χαµηλό δείκτη κερδοφορίας),
κάποιος που θέλει να ενηµερωθεί θα πρέπει να παρακολουθεί µόνο τα
ειδησεογραφικά κανάλια. Ο λόγος είναι ότι αν βλέπει τα ψυχαγωγικά περιµένοντας
κάποια ψήγµατα ειδήσεων, την ίδια στιγµή χάνει τις ειδήσεις που θα έβλεπε αν
παρακολουθούσε κάποιο ειδησεογραφικό κανάλι. Επιπρόσθετα, αυτή η απόφαση
είναι ανεξάρτητη της πληθώρας των ψυχαγωγικών καναλιών. Ένα άλλο παράδειγµα
είναι τα mail που δέχεται κάποιος: Το διάβασµα των ανεπιθύµητων mail (spam ή
junk) πρέπει να αποφεύγεται, µια και συνήθως δεν παρέχει χρήσιµες πληροφορίες
στον ενδιαφερόµενο, αλλά και επειδή του καταναλώνει χρόνο από το διάβασµα
άλλων mail τα οποία πιθανόν να του παρέχουν τις επιθυµητές πληροφορίες.
Rk=
∑
1
k
λi gi
1+ ∑
i
k
λi tEi
> πk+ 1=
gk+ 1
tEk + 1
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 28
2.1.3. Information scent
Ως information scent ορίζεται η (κατά προσέγγιση) εκτίµηση της αξίας, του κόστους,
του περιεχοµένου και του µονοπατιού πρόσβασης µιας πηγής πληροφοριών, από
λέξεις, φράσεις, αποσπάσµατα κειµένου, εικόνες (καθώς και συνδυασµό αυτών) που
παραπέµπουν στο περιεχόµενο της πηγής αυτής. Ο όρος αυτός χρησιµοποιείται για να
περιγράψει πώς οι άνθρωποι εκτιµούν τις διαθέσιµες επιλογές τους όταν ψάχνουν για
πληροφορίες. Όταν έχουν στη διάθεσή τους µια λίστα από επιλογές, θα διαλέξουν
αυτή που φαίνεται πιο ξεκάθαρα ότι θα τους οδηγήσει στην πληροφορία που
αναζητούν.
Όπως και οι έννοιες των patch model και diet model, έτσι και το information scent
έχει τις ρίζες του στη θεωρία του optimal foraging: όπως η οσµή και τα ίχνη ενός
θηράµατος καθοδηγούν ένα ζώο-θηρευτή ώστε να κυνηγήσει µέσα σε µια περιοχή ή
να την εγκαταλείψει για µια άλλη, έτσι και οι άνθρωποι αναζητούν στοιχεία τα οποία
θα τους βοηθήσουν να βρουν πιο γρήγορα και αποτελεσµατικά τις πληροφορίες που
ψάχνουν. Τα ίχνη αυτά, ανάλογα µε το είδος των πληροφοριών, µπορούν να έχουν
διάφορες µορφές: βιβλιογραφικές αναφορές που µας παραπέµπουν σε πιο
ειδικευµένες πληροφορίες σχετικά µε κάτι που ψάχνουµε, ονοµασίες φακέλων
ενδεικτικές των αρχείων που περιέχουν στον υπολογιστή µας, η ονοµασία των ίδιων
αυτών αρχείων που πληροφορεί για το περιεχόµενό τους, σύνδεσµοι ή εικόνες που
εµφανίζονται όταν πραγµατοποιούµε µια αναζήτηση στο Internet κτλ. Όταν, λοιπόν,
το information scent είναι ισχυρό, ο ενδιαφερόµενος µπορεί να αντιληφθεί ότι ψάχνει
στη σωστή περιοχή, ώστε να βρει µε αποτελεσµατικότητα και ταχύτητα αυτό που
θέλει, ενώ αν είναι ασθενές θα χάσει πολύτιµο χρόνο, µετακινούµενος από περιοχή σε
περιοχή. Δεδοµένης της αλµατώδους εξάπλωσης του Internet σχεδόν σε κάθε πτυχή
της ζωής του σύγχρονου ανθρώπου αλλά και του όγκου πληροφοριών µέσα στον
οποίο κανείς ψάχνει, η έννοια του information scent αποτελεί τη σηµαντικότερη
έννοια στη θεωρία του Information Foraging.
2.2 Information Foraging και δοµή του Παγκόσµιου Ιστού
Οι τρεις έννοιες που παρουσιάστηκαν παραπάνω (patch model, diet model και
information scent) χρησιµοποιούνται για την κατασκευή γνωστικών µοντέλων που
περιγράφουν τη συµπεριφορά και τον τρόπο µε τον οποίο ενεργούµε όταν ψάχνουµε
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 29
πληροφορίες. Ειδικότερα, τα µοντέλα αυτά αναφέρονται στον Παγκόσµιο Ιστό,
καθώς είναι ο κυριότερος χώρος ανταλλαγής πληροφοριών, διαρκώς αυξανόµενος σε
όγκο και πολυπλοκότητα. Στο σηµείο αυτό παρουσιάζεται συνοπτικά η δοµή µε την
οποία είναι κατασκευασµένο το διαδίκτυο, ώστε να γίνει στη συνέχεια κατανοητός ο
τρόπος µε τον οποίο χρησιµοποιούνται πρακτικά οι θεµελιώδεις έννοιες της θεωρίας.
Η αναζήτηση πληροφοριών στον Ιστό γίνεται µε διάφορους τρόπους:
πληκτρολογώντας λέξεις κλειδιά σε µια µηχανή αναζήτησης, κάνοντας κλικ σε
κάποιο σύνδεσµο που βρίσκουµε, πληκτρολογώντας την πλήρη διεύθυνση της
ιστοσελίδας (URL - Uniform Resource Locator), χρησιµοποιώντας τα κουµπιά του
browser ( κουµπιά ιστορικού). Οι τρόποι αυτοί συναρτώνται και προέρχονται από τη
δοµή µε την οποία είναι κατασκευασµένος ο Ιστός. Τα συστήµατα πληροφοριών
τείνουν να έχουν µια ιεραρχική δοµή. Αυτό γίνεται για δύο λόγους: Για λόγους
ευρωστίας ( µια και η δυσλειτουργία ενός µέρους σε χαµηλότερα επίπεδα της
ιεραρχίας δεν επηρεάζει τη δοµή συνολικά) , αλλά και για λόγους
αποτελεσµατικότητας. Σύµφωνα µε τον H. L. Resnikoff [9], µέσα από
αποκεντρωµένες κοινωνικές διαδικασίες µπορούν να προκύψουν αποτελεσµατικά
συστήµατα πληροφοριών, ιεραρχικά δοµηµένα. Επίσης, σύµφωνα µε τους Eiron και
McCurley [10], η µοντελοποίηση του Ιστού µπορεί να εξηγηθεί µέσα από την
κοινωνική διαδικασία της συγγραφής των ιστοσελίδων, σε συνδυασµό µε τις
κοινωνικές σχέσεις που αναπτύσσονται στις οµάδες των ανθρώπων που ασχολούνται
µε τη συγγραφή. Η ιεραρχική δοµή των οµάδων των ανθρώπων που ασχολούνται µε
τη συγγραφή των σελίδων και τη διάδοση των πληροφοριών, φαίνεται να ακολουθεί
την εξελικτική διαδικασία και άλλων κοινωνικών φαινοµένων, όπως αυτά
περιγράφονται και από τον H. A. Simon [11].
Μια ιστοσελίδα είναι µια βασική περιοχή πληροφοριών. Αποτελεί µια περιοχή
συγκέντρωσης πληροφοριών, και, ανάλογα µε το περιεχόµενο, µπορεί και να έχει
διαφορετική µορφή: Μπορεί να περιέχει κείµενο, συνδέσµους προς άλλες σελίδες,
banner µε διαφηµίσεις, πεδίο εισαγωγής όρων αναζήτησης, πτυσσόµενα µενού κτλ. Ο
ιστότοπος παρέχει πρόσβαση σε ιστοσελίδες, αλλά και, ανάλογα µε τη χρησιµότητά
του, σε βάσεις δεδοµένων, φόρµες επικοινωνίας ή/και εξυπηρέτησης καταναλωτών
κ.ά., τα οποία αναφέρονται σε κάποιο κοινό θέµα ή εξυπηρετούν κάποιο κοινό σκοπό.
Τα URLs επίσης έχουν ιεραρχική δοµή. Τέλος, οι πύλες (portals), οι οποίες
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 30
λειτουργούν ως κεντρικοί κόµβοι για την εύρεση πληροφοριών, οµαδοποιούν
συνδέσµους του διαδικτύου ανάλογα µε τη σηµασιολογική τους συσχέτιση αλλά και
χρησιµοποιούν µηχανές αναζήτησης οι οποίες καταλογοποιούν τους συνδέσµους και
εµφανίζουν αποτελέσµατα, σε µορφή ιστοσελίδας, σχετικά µε την αναζήτηση που
κάνει ο χρήστης. Ξεκινώντας, λοιπόν, από τις πιο στοιχειώδεις µορφές περιοχών
πληροφοριών (ιστοσελίδες), αυτές συγκεντρώνονται σε υψηλότερου επιπέδου
περιοχές (ιστότοποι και portal).
Ο τρόπος µε τον οποίο είναι κατανεµηµένοι οι σύνδεσµοι στον Ιστό προσοµοιάζει
σε δοµή περιοχών. Μέσα σε έναν ιστότοπο, οι σύνδεσµοι µιας ιστοσελίδας
παραπέµπουν κυρίως σε ιστοσελίδες του ίδιου ιστότοπου. Οι Eiron και McCurley [9]
µελέτησαν την ιεραρχική δοµή του Ιστού, αναλύοντας 616 εκατοµµύρια ιστοσελίδες
από 6,5 εκατοµµύρια ιστότοπους. Πήραν ένα δείγµα των συνδέσµων και τους
κατηγοριοποίησαν ως εξής: Στο Ίδιο επίπεδο (ιεραρχικά), Πάνω και Κάτω (όσον
αφορά το επίπεδο ιεραρχίας), Αυτοαναφορικούς, Εγκάρσιους (στον ίδιο ιστότοπο,
αλλά χωρίς να εµπίπτουν στις παραπάνω κατηγορίες) και Εξωτερικούς (που
παραπέµπουν σε άλλους ιστότοπους). Στο Σχ. 2.4 παρουσιάζονται σχηµατικά τα είδη
των συνδέσµων. Η κατανοµή τους ήταν: 41.1% στο Ίδιο επίπεδο, 11.2% Πάνω, 3.9%
Κάτω, 18.7% Εγκάρσιοι και 25% Εξωτερικοί (επίσης, 0.9% των συνδέσµων ήταν
αυτοαναφορικοί). Παρατηρήθηκε, λοιπόν ότι περίπου το 75% των συνδέσµων
παραπέµπουν σε ιστοσελίδες µέσα στον ίδιο ιστότοπο, ενώ 59.8% αφορούν σε
σελίδες του ίδιου επιπέδου ιεραρχίας. Εκτός αυτού, παρατηρήθηκε ότι η πιθανότητα
να υπάρχει κάποιος σύνδεσµος ανάµεσα σε δύο ιστοσελίδες µειώνεται εκθετικά, όσο
αυξάνει η απόστασή τους µέσα στη δενδρική δοµή ενός ιστότοπου.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 31
Ενδιαφέρον παρουσιάζει και ο τρόπος µε τον οποίο προκύπτει η διασύνδεση των
σελίδων στον Ιστό. Όταν κάποιος βρίσκεται σε µια ιστοσελίδα, συνήθως έχει βρεθεί
εκεί ακολουθώντας κάποιο σύνδεσµο από µια άλλη ιστοσελίδα ή από το αποτέλεσµα
κάποιας µηχανής αναζήτησης. Γενικά, όσο µεγαλύτερο ενδιαφέρον παρουσιάζει µια
σελίδα ή ένας ιστότοπος, τόσο περισσότεροι σύνδεσµοι οδηγούν σε αυτόν.
Αντίστοιχα, σε µια σελίδα συνήθως (αλλά όχι πάντα) υπάρχουν ένας ή περισσότεροι
σύνδεσµοι οι οποίοι οδηγούν σε άλλες σελίδες µε παραπλήσιο ή πιο εξειδικευµένο
περιεχόµενο. Όσους περισσότερους συγκεντρωµένους συνδέσµους έχει µια σελίδα οι
οποίοι να παραπέµπουν σε άλλες σελίδες, τόσο πιο χρήσιµη µπορεί να είναι όταν
αναζητούµε κάποιες πληροφορίες. Με άλλα λόγια, οι σελίδες και οι ιστότοποι
µπορούν να ιδωθούν ως κόµβοι πληροφοριών µέσα στη δοµή του Ιστού. Οι κόµβοι
από τους οποίους εκκινούν οι διάφοροι σύνδεσµοι ονοµάζονται hubs και οι κόµβοι
στους οποίους καταλήγουν οι σύνδεσµοι ονοµάζονται authorities (έγκυρες σελίδες)
[12]. Προφανώς, ένας κόµβος πληροφοριών µπορεί να ιδωθεί είτε σαν hub είτε σαν
authority (και προφανώς είναι και τα δύο), ανάλογα µε το τι µας ενδιαφέρει: ο
αριθµός των εξερχόµενων (outlinks ή outbound links) ή των εισερχόµενων (inlinks ή
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 32
inbound links) συνδέσµων. Ο αριθµός των outlinks (αντίστοιχα: inlinks) ενός hub
(αντίστοιχα: authority) ονοµάζεται µέγεθος του αντίστοιχου κόµβου. Το µέγεθος ενός
κόµβου αποτελεί ένα εργαλείο για το αν θα προτιµηθεί ή όχι από κάποιον. Αν
κάποιος ενδιαφερόµενος ψάχνει για πληροφορίες, είναι πιθανότερο να κατευθυνθεί
σε ένα κόµβο που έχει µεγάλο µέγεθος ως hub. Κι αυτό γιατί θα ξέρει ότι από τον
κόµβο αυτό θα εκκινούν πολλοί απευθείας σύνδεσµοι για άλλες σελίδες, άρα
µειωµένο κόστος αναζήτησης. Γι΄ αυτό και αρκετός κόσµος συνηθίζει να ξεκινά την
αναζήτησή του από ένα µεγάλο portal. Αντίστοιχα, το µέγεθος του authority
αποτελεί ένα καλό εργαλείο για τη σχετικότητα µιας ιστοσελίδας µε αυτό που
ψάχνουµε. Το να υπάρχει ένα inlink σε µια σελίδα σηµαίνει ότι θεωρείται σχετική και
άξια αναφοράς από αυτόν που παραπέµπει στη σελίδα αυτή και όσο περισσότερα
inlinks, τόσο περισσότερο σχετική φαίνεται να είναι η σελίδα. Φυσικά, σε κάτι τέτοιο
µπορούν να υπεισέρχονται παράγοντες όπως η προσωπική προτίµηση αυτού που
κάνει την παραποµπή ή το προσωπικό όφελος, ακόµη και η διάθεση εξαπάτησης.
Εντούτοις, αποτελεί ένα εργαλείο το οποίο χρησιµοποιούν διάφοροι ευρετικοί
αλγόριθµοι στον τοµέα του SEO (Search Engine Optimisation), όπως οι µηχανές
αναζήτησης.
Τέλος, ο Ιστός παρουσιάζει µια δοµή επί µέρους τοπικότητας, ανάλογα µε τα
θέµατα ενδιαφέροντος: Οι πληροφορίες που είναι σχετικές µε κάποιο θέµα τείνουν να
βρίσκονται συγκεντρωµένες σε κοντινές περιοχές πληροφοριών. Ο Davison [13]
αξιολόγησε την τοπικότητα ενός δείγµατος σελίδων ανά ζεύγη, ανάλογα µε το αν
ήταν συνδεδεµένες απ' ευθείας (µέσω συνδέσµων µεταξύ τους), συνδεδεµένες
συγγενικά (µέσω της ίδιας σελίδας-γονέα) και διαλεγµένες τυχαία. Λαµβάνοντας τη
σχετικότητα των κειµένων τους, παρατήρησε ότι οι άµεσα συνδεδεµένες σελίδες
είχαν τη µεγαλύτερη σχετικότητα, ενώ οι συνδεδεµένες συγγενικά είχαν παραπλήσια
αλλά λίγο µικρότερη σχετικότητα. Εντούτοις, οι διαλεγµένες τυχαία σελίδες είχαν
σηµαντικά µικρότερη σχετικότητα µεταξύ τους, και µε µεγάλη διαφορά από τις
προηγούµενες οµαδοποιήσεις.
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 33
3.Τεχνικές µοντελοποίησης της πλοηγητικής συµπεριφοράς
των χρηστών
Όπως αναφέρθηκε στο προηγούµενο κεφάλαιο, η έννοια του information scent
διαδραµατίζει κεντρικό ρόλο στη θεωρία του Information Foraging. Η ορθολογιστική
ανάλυση (rational analysis) του information scent υποθέτει ότι ο στόχος του χρήστη
είναι η χρησιµοποίηση εξωτερικών ενδείξεων εγγύητητας πληροφορίας (proximal
cues) µε σκοπό να προβλέψει και εκτιµήσει τη χρησιµότητα µακρινών πηγών
πληροφοριών (πχ µιας ιστοσελίδας η οποία σχετίζεται µε κάποιο σύνδεσµο στο
Internet), και, έπειτα, να πλοηγηθεί στις πηγές µε τη µεγαλύτερη προσδοκώµενη
χρησιµότητα. Η ανάλυση αυτή αποτελείται από τρία στάδια: α) µια ανάλυση Bayes [6
σελ.76] της προσδοκώµενης σχετικότητας µιας µακρινής πηγής πληροφοριών, µε
βάση τις διαθέσιµες ενδείξεις του information scent, β) µια απεικόνιση του παραπάνω
µοντέλου σε µαθηµατική διατύπωση ενός µηχανισµού εξαπλούµενης ενεργοποίησης
(spreading activation) και γ) ένα µοντέλο ορθολογιστικής επιλογής το οποίο
χρησιµοποιεί την εξαπλούµενη ενεργοποίηση για να εκτιµήσει τη χρησιµότητα των
εναλλακτικών συνδέσµων στον Ιστό.
3.1 Ανάλυση Bayes
Ας υποθέσουµε ότι ψάχνουµε πληροφορίες για κάποιο θέµα που µας ενδιαφέρει.
Έστω επίσης ότι έχουµε ένα σύνολο µακρινών πηγών (πχ ιστοσελίδες) και ένα
σύνολο από ενδείξεις εγγύτητας σχετικά µε τις πληροφορίες που αναζητούµε. Ας
ονοµάσουµε Ε το σύνολο των πληροφοριών που επιθυµούµε (και οι οποίες
περιέχονται σε κάποιες ιστοσελίδες) και C το σύνολο των ενδείξεων εγγύτητας που
έχουµε (σύνδεσµοι). Χρησιµοποιώντας το θεώρηµα του Bayes υπό τη µορφή
σχετικών πιθανοτήτων (odds), η πρόβλεψη µια ιστοσελίδα να περιέχει πληροφορίες
που µας ενδιαφέρουν, δεδοµένης της ύπαρξης ενδείξεων εγγύτητας, θα είναι
(3.1) , όπου O(E/C) είναι η εκ των υστέρων πρόβλεψη
ύπαρξης των επιθυµητών πληροφοριών Ε δοθέντων των ενδείξεων εγγύτητας C, O(E)
η εκ των προτέρων πρόβλεψη ύπαρξης επιθυµητών πληροφοριών Ε, Pr(C/E) η
πιθανότητα οι δοθείσες ενδείξεις εγγύτητας να είναι σχετικές µε τις επιθυµητές
O(E/C)= O(E)⋅
Pr(C/E)
Pr(C/E')
Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και
Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου”
Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 34
πληροφορίες Ε και Pr(C/E') η πιθανότητα οι δοθείσες ενδείξεις εγγύτητας να µην
οδηγούν στις επιθυµητές πληροφορίες. Οι προβλέψεις µπορούν κι αυτές να γραφτούν
σε µορφή πιθανοτήτων, µε , όπου Pr(E/C) είναι η πιθανότητα να
βρεθούν οι πληροφορίες δοθέντων των ενδείξεων εγγύτητας και Pr(E'/C) η
πιθανότητα να µη βρεθούν οι πληροφορίες δοθέντων των ενδείξεων εγγύτητας και
, όπου Pr(E) η πιθανότητα να βρεθούν οι επιθυµητές πληροφορίες και
Pr(E') η πιθανότητα να µη βρεθούν. Στην περίπτωση αυτή η εξίσωση (3.1) γράφεται
ως εξής: (3.2).
Μπορούµε να υποθέσουµε ότι οι επιθυµητές πληροφορίες αποτελούνται από ένα
σύνολο στοιχείων i τα οποία είναι συνδυασµός λέξεων, εικονιδίων, αριθµών,
γραφηµάτων κτλ (ανάλογα µε το είδος των πληροφοριών που ψάχνουµε) .
Αντίστοιχα, οι ενδείξεις εγγύτητας αποτελούνται επίσης από ένα σύνολο
διαφορετικών στοιχείων j (πχ συνδέσµους). Με τα δεδοµένα αυτά οδηγούµαστε στην
παρακάτω µορφή: (3.3) , όπου το αριστερό µέλος της
εξίσωσης εκφράζει την πρόβλεψη να βρεθεί ένα επιθυµητό χαρακτηριστικό i
δοθέντων των ενδείξεων εγγύτητας, είναι η πρόβλεψη ύπαρξης ενός
χαρακτηριστικού i και Pr(i / j) η πιθανότητα εύρεσης του χαρακτηριστικού i µε
δεδοµένη την ύπαρξη µιας ένδειξης εγγύτητας j, δηλαδή η πιθανότητα να υπάρχει
συσχέτιση µεταξύ τους. Είναι σηµαντικό να επισηµανθεί ότι η συσχέτιση αυτή
προκύπτει από προηγούµενη εµπειρία. Λογαριθµίζοντας την τελευταία εξίσωση θα
έχουµε (3.4) ή
(3.5),
όπου , και
Η (3.5) αποτελεί τη βάση για το µηχανισµό εξαπλούµενης ενεργοποίησης. Η
ποσότητα είναι γνωστή ως Κατά Σηµεία Αµοιβαία Πληροφορία (Pointwise
O(E/C)=
Pr(E/C)
Pr(E'/C)
O(E)=
Pr(E)
Pr(E')
Pr (E'/C)
Pr (E/C)
= Pr (E')
Pr (E)
$ Pr (C/E')
Pr (C/E)
Pr(i/C)
Pr(i'/C)
=
Pr(i)
Pr(i ')
⋅ ∏j∈ C
Pr(i/j)
Pr (i)
Pr(i)
Pr(i')
log(
Pr(i/C)
Pr(i '/C)
)= log(
Pr(i)
Pr(i')
)+ ∑j∈ C
Pr(i/j)
Pr(i)
Ai= log(
Pr(i/C)
Pr (i'/C)
) Bi= log(
Pr(i)
Pr(i')
) Sji=
Pr(i/j)
Pr(i)
Sji
Ai= Bi+ ∑
j
Sji
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ
Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ

More Related Content

Viewers also liked

Connect the Dots By Sagar Goud
Connect the Dots By Sagar GoudConnect the Dots By Sagar Goud
Connect the Dots By Sagar GoudSagar Goud
 
Rancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TA
Rancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TARancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TA
Rancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TApoliteknik negeri madura
 
You Don't Have To Be Perfect #1
You Don't Have To Be Perfect #1You Don't Have To Be Perfect #1
You Don't Have To Be Perfect #1esme iolanthe
 
De weg naar wendbaarheid
De weg naar wendbaarheidDe weg naar wendbaarheid
De weg naar wendbaarheidRemko Boonstra
 
Intersectionality Queer 201 Presentation
Intersectionality Queer 201 PresentationIntersectionality Queer 201 Presentation
Intersectionality Queer 201 PresentationCaitlin Galiz-Rowe
 
Tutorial pembuatan ca pada virtualhost dan ssl
Tutorial pembuatan ca pada virtualhost dan sslTutorial pembuatan ca pada virtualhost dan ssl
Tutorial pembuatan ca pada virtualhost dan sslDelicia Generis Humani
 
Testing of React JS app
Testing of React JS appTesting of React JS app
Testing of React JS appAleks Zinevych
 

Viewers also liked (10)

Connect the Dots By Sagar Goud
Connect the Dots By Sagar GoudConnect the Dots By Sagar Goud
Connect the Dots By Sagar Goud
 
Rancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TA
Rancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TARancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TA
Rancang Bangun Kapal Penumpang Bertenaga Panel Surya Untuk TA
 
Valores
ValoresValores
Valores
 
You Don't Have To Be Perfect #1
You Don't Have To Be Perfect #1You Don't Have To Be Perfect #1
You Don't Have To Be Perfect #1
 
De weg naar wendbaarheid
De weg naar wendbaarheidDe weg naar wendbaarheid
De weg naar wendbaarheid
 
Intersectionality Queer 201 Presentation
Intersectionality Queer 201 PresentationIntersectionality Queer 201 Presentation
Intersectionality Queer 201 Presentation
 
Tutorial pembuatan ca pada virtualhost dan ssl
Tutorial pembuatan ca pada virtualhost dan sslTutorial pembuatan ca pada virtualhost dan ssl
Tutorial pembuatan ca pada virtualhost dan ssl
 
Testing of React JS app
Testing of React JS appTesting of React JS app
Testing of React JS app
 
AUTHOR'S PROOF
AUTHOR'S PROOFAUTHOR'S PROOF
AUTHOR'S PROOF
 
Manual de practicas de soldadura
Manual de practicas de soldaduraManual de practicas de soldadura
Manual de practicas de soldadura
 

Similar to Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ

ιστοεξερευνησεις παπανικολαου
ιστοεξερευνησεις παπανικολαουιστοεξερευνησεις παπανικολαου
ιστοεξερευνησεις παπανικολαουpandoraki
 
1το διαδίκτυο
1το διαδίκτυο1το διαδίκτυο
1το διαδίκτυοjimkol
 
Σχεδιάζοντας για Ευχρηστία και Προσβασιμότητα
Σχεδιάζοντας για Ευχρηστία και ΠροσβασιμότηταΣχεδιάζοντας για Ευχρηστία και Προσβασιμότητα
Σχεδιάζοντας για Ευχρηστία και ΠροσβασιμότηταPanayiotis Zaphiris
 
Eusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-final
Eusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-finalEusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-final
Eusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-finalpanharatz
 
«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...
«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...
«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...Department of Library Science AΤEI Thessaloniki
 
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥAnna Boukouvala
 
mobile learning master degree presentation Skoula Chrysanthi
mobile learning master degree presentation Skoula Chrysanthimobile learning master degree presentation Skoula Chrysanthi
mobile learning master degree presentation Skoula ChrysanthiChrissie Skoula
 
Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)
Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)
Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)Θεοδώρα Μαγουλιώτη
 
Eργπε δδε β γ αθήνας-30-11-21
Eργπε δδε β γ αθήνας-30-11-21Eργπε δδε β γ αθήνας-30-11-21
Eργπε δδε β γ αθήνας-30-11-21Dimitris Gkotzos
 
Information literacy 16o_sinedrio
Information literacy 16o_sinedrioInformation literacy 16o_sinedrio
Information literacy 16o_sinedrioDominiki Rouggeri
 
Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...
Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...
Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...Ifigenia Vardakosta
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταISSEL
 
Βήματα Σχεδίασης μιας Κοινότητας Πρακτικής
Βήματα Σχεδίασης μιας Κοινότητας ΠρακτικήςΒήματα Σχεδίασης μιας Κοινότητας Πρακτικής
Βήματα Σχεδίασης μιας Κοινότητας ΠρακτικήςSmaragda Papadopoulou
 
3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυο3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυοPanagiotis Papadopoulos
 
3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυο3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυοPanagiotis Papadopoulos
 
διαλέγω διαδίκτυο αλλά... επιλέγω!
διαλέγω διαδίκτυο αλλά... επιλέγω!διαλέγω διαδίκτυο αλλά... επιλέγω!
διαλέγω διαδίκτυο αλλά... επιλέγω!zetabokola
 
Themata kt p_kbe_chemeng2_intro_1_3_2012
Themata kt p_kbe_chemeng2_intro_1_3_2012Themata kt p_kbe_chemeng2_intro_1_3_2012
Themata kt p_kbe_chemeng2_intro_1_3_2012ntemis
 

Similar to Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ (20)

Enotita3.1
Enotita3.1Enotita3.1
Enotita3.1
 
ιστοεξερευνησεις παπανικολαου
ιστοεξερευνησεις παπανικολαουιστοεξερευνησεις παπανικολαου
ιστοεξερευνησεις παπανικολαου
 
1το διαδίκτυο
1το διαδίκτυο1το διαδίκτυο
1το διαδίκτυο
 
Σχεδιάζοντας για Ευχρηστία και Προσβασιμότητα
Σχεδιάζοντας για Ευχρηστία και ΠροσβασιμότηταΣχεδιάζοντας για Ευχρηστία και Προσβασιμότητα
Σχεδιάζοντας για Ευχρηστία και Προσβασιμότητα
 
Eusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-final
Eusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-finalEusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-final
Eusp template preparationinfo-ζαννειο-πειραματικο-λυκειο-final
 
«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...
«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...
«Το προφίλ του Βιβλιοθηκονόμου (ελληνική πραγματικότητα και διεθνείς τάσεις) ...
 
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ
 
TEACHING USING WWW
TEACHING USING WWWTEACHING USING WWW
TEACHING USING WWW
 
mobile learning master degree presentation Skoula Chrysanthi
mobile learning master degree presentation Skoula Chrysanthimobile learning master degree presentation Skoula Chrysanthi
mobile learning master degree presentation Skoula Chrysanthi
 
Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)
Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)
Ασφάλεια στο Διαδίκτυο (εισαγωγική παρουσίαση)
 
Eργπε δδε β γ αθήνας-30-11-21
Eργπε δδε β γ αθήνας-30-11-21Eργπε δδε β γ αθήνας-30-11-21
Eργπε δδε β γ αθήνας-30-11-21
 
Information literacy 16o_sinedrio
Information literacy 16o_sinedrioInformation literacy 16o_sinedrio
Information literacy 16o_sinedrio
 
Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...
Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...
Μελέτες χρηστικότητας δικτυακών τόπων ακαδημαϊκών βιβλιοθηκών:προτάσεις επιλο...
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
 
Βήματα Σχεδίασης μιας Κοινότητας Πρακτικής
Βήματα Σχεδίασης μιας Κοινότητας ΠρακτικήςΒήματα Σχεδίασης μιας Κοινότητας Πρακτικής
Βήματα Σχεδίασης μιας Κοινότητας Πρακτικής
 
3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυο3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυο
 
3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυο3 γνωρίζω το διαδίκτυο
3 γνωρίζω το διαδίκτυο
 
διαλέγω διαδίκτυο αλλά... επιλέγω!
διαλέγω διαδίκτυο αλλά... επιλέγω!διαλέγω διαδίκτυο αλλά... επιλέγω!
διαλέγω διαδίκτυο αλλά... επιλέγω!
 
Robotics2011 pyrgos
Robotics2011 pyrgosRobotics2011 pyrgos
Robotics2011 pyrgos
 
Themata kt p_kbe_chemeng2_intro_1_3_2012
Themata kt p_kbe_chemeng2_intro_1_3_2012Themata kt p_kbe_chemeng2_intro_1_3_2012
Themata kt p_kbe_chemeng2_intro_1_3_2012
 

Αμπαρτζιδης Γεωργιος_73049_ΠΛΣΔΕ

  • 1. ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήµατα ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου Γεώργιος Π. Αµπαρτζίδης Επιβλέπουσα: Μαρία Ρήγκου Πάτρα Σεπτέµβριος 2014
  • 2. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 2 Διπλωµατική Εργασία Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου Γεώργιος Π. Αµπαρτζίδης Επιβλέπουσα: Μαρία Ρήγκου Ακαδηµαϊκό Έτος 2013 – 2014 Πάτρα, Σεπτέµβριος 2014
  • 3. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 3 © ΕΑΠ, 2014 Η παρούσα διατριβή, η οποία εκπονήθηκε στα πλαίσια της ΘΕ “Διπλωµατική Εργασία”, και τα λοιπά αποτελέσµατα της Διπλωµατικής Εργασίας (ΔΕ) αποτελούν συνιδιοκτησία του ΕΑΠ και του φοιτητή, ο καθένας από τους οποίους έχει το δικαίωµα ανεξάρτητης χρήσης και αναπαραγωγής τους (στο σύνολο ή τµηµατικά) για διδακτικούς και ερευνητικούς λόγους, σε κάθε περίπτωση αναφέροντας τον τίτλο και το συγγραφέα και το ΕΑΠ όπου εκπονήθηκε η ΔΕ καθώς και τον επιβλέποντα και τον επιβλέποντα και την επιτροπή κρίσης. Γεώργιος Π. Αµπαρτζίδης
  • 4. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 4 Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου Γεώργιος Π. Αµπαρτζίδης Ονοµατεπώνυµο Επιβλέποντα Ρήγκου Μαρία Ονοµατεπώνυµο Μέλους 1 Σακκόπουλος Ευάγγελος Περίληψη Αντικείµενο της παρούσας διπλωµατικής εργασίας είναι η βιβλιογραφική µελέτη, ο εντοπισµός και η καταγραφή των πρακτικών εφαρµογών στο θέµα της θεωρίας του Information Foraging. Σύµφωνα µε τη θεωρία αυτή, οι άνθρωποι µπορούν να χαρακτηριστούν σαν ένα είδος «πληροφοριοβόρων» (informavores): αναζητούν, συλλέγουν, χρησιµοποιούν, καταναλώνουν και διαµοιράζονται πληροφορίες µε τέτοιο τρόπο ώστε να µεγιστοποιούν το λόγο της αξίας των προσλαµβανόµενων πληροφοριών προς το κόστος εντοπισµού τους. Η παρούσα εργασία παρουσιάζει και αναλύει τη θεωρία του Information Foraging, συµπεριλαµβάνοντας τόσο την αρχική της µορφή όσο και τις δυνατότητες εξέλιξης και εµπλουτισµού της ώστε να συµβαδίζει µε την τωρινή µορφή του Παγκόσµιου Ιστού. Στη συνέχεια, γίνεται καταγραφή της χρήσης της θεωρίας σε τεχνικές µοντελοποίησης της πλοηγητικής
  • 5. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 5 συµπεριφοράς του χρήστη και γίνεται παρουσίαση και σύγκριση µε άλλες διαθέσιµες τεχνικές. Επιπρόσθετα, παρουσιάζονται οι διάφορες µεθόδοι υποβοήθησης του χρήστη κατά τη διαδικασία αναζήτησης πληροφορίας και οι εφαρµογές στο σχεδιασµό των ιστοσελίδων και του τρόπου παρουσίασης των περιεχοµένων τους ώστε να είναι φιλικές προς το χρήστη, καθώς και τα σηµεία στα οποία η έννοια του information scent (της πιο σηµαντικής, γνωστής και ευρέως χρησιµοποιούµενης έννοιας του Information Foraging) βρίσκει εφαρµογή στις παραπάνω µεθόδους και εφαρµογές. Τέλος, γίνεται αποτύπωση των σύγχρονων τάσεων και των διαφαινόµενων προοπτικών στον χώρο της Αλληλεπίδρασης Ανθρώπου – Υπολογιστή. Λέξεις – κλειδιά: Information Foraging, information scent, informavores, web navigation behavior, web usage mining.
  • 6. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 6 Information Foraging Theory: Algorithms, Technologies and Future Prospects Regarding the Observation of the Navigational Behavior of Internet Users George P. Ampartzidis Supervisor’s First Member’s fullname fullname Rigkou Maria Sakkopoulos Enangelos Summary The subject of this Postgraduate Thesis is the bibliographical study, the tracking and recording of the practical applications of the Information Foraging Theory. According to the literature, people can be characterized as “informavores”, searching, collecting, using, consuming and sharing information in such a way that maximizes the rate of gaining valuable information. In the present Thesis, the theory of Information Foraging is presented and analyzed, including not only its original form, but also its potential evolution and enrichment in order to keep up with the current form of the World Wide Web. Furthermore, the Thesis presents the application of the theory in cognitive models of web navigation behavior and compares them with other available techniques. Moreover, the available methods in assisting Internet users while searching for information are outlined, in addition to applications in web page design
  • 7. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 7 that aim at presenting webpage content in a user-friendly manner. Additionally, the Thesis draws upon the implementation of the concept of information scent (the most significant, well-known and widely used concept of the Information Foraging Theory) on the aforementioned methods and applications. Finally, the latest trends and future prospects in the field of Human–Computer Interaction are presented. Key–words: Information Foraging, information scent, informavores, web navigation behavior, web usage mining.
  • 8. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 8 Ευχαριστίες Θα ήθελα να ευχαριστήσω την καθηγήτριά µου, Μαρία Ρήγκου, για την ευκαιρία να ασχοληθώ στη διπλωµατική µου εργασία µε αυτό το πολύ ενδιαφέρον θέµα, καθώς και για την άψογη συνεργασία µας. Επίσης, θα ήθελα να ευχαριστήσω βαθιά τους γονείς µου, Πάρι και Νατάσσα, οι οποίοι µου συµπαραστάθηκαν σταθερά και µε οποιοδήποτε τρόπο µπορούσαν καθ’ όλη τη διάρκεια των σπουδών µου. Ακόµη, τους φίλους Κωνσταντίνο Χανόπουλο, Γωγώ Κώνστα και Στέλλα Κοτζαµπασάκη, οι οποίοι µε την εµπειρία τους µε βοήθησαν σε µια σειρά πρακτικών προβληµάτων. Τέλος, θα ήθελα να ευχαριστήσω θερµά τη σύζυγό µου Κατερίνα, η οποία υπέµενε τα τελευταία τέσσερα χρόνια τον εκνευρισµό και το άγχος που κατά διαστήµατα µού δηµιούργησαν οι σπουδές µου, καθώς και το τετράποδο µέλος της οικογένειάς µας, ένα γλυκύτατο Γερµανικό Ποιµενικό που ακούει στο όνοµα Πέρσα.
  • 9. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 9 Σχήµατα Σχήµα 2.1: Διάγραµµα χρόνου- κέρδους- ρυθµού µεταβολής κέρδους……………..13 Σχήµα 2.2: Διάγραµµα βέλτιστου χρόνου παραµονής εντός µιας περιοχής………...16 Σχήµα 2.3: Διάγραµµα εµπλουτισµού περιοχών…………………………………….18 Σχήµα 2.4: Δενδρική δοµή ενός ιστότοπου………………………………………….25 Σχήµα 3.1: Διάγραµµα χρόνου πρώτου περάσµατος………………………………..33 Σχήµα 3.2: Κατανοµή συχνότητας των χρηστών, συναρτήσει του αριθµού των συνδέσµων που επισκέπτονται…………………………………………..34 Σχήµα 3.3: Διάγραµα της αρχιτεκτονικής του µοντέλου SNIF-ACT……………….36 Σχήµα 3.4: Παράδειγµα προσοµοίωσης µε το µοντέλο MESA..................................41 Σχήµα 3.5: Παράδειγµα προσοµοίωσης µε το µοντέλο CoLiDeS…………………..45 Σχήµα 3.6: Διάγραµµα του αλγορίθµου που χρησιµοποιεί το µοντέλο CoLiDeS+…48
  • 10. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 10 Εικόνες Εικόνα 5.1: Χάρτης απεικόνισης (heatmap) των σηµείων στα οποία εστίασαν οι χρήστες τριών διαφορετικών ιστοσελίδων...............................................65 Εικόνα 5.2: Παράδειγµα χρήσης του Responsive Web Design……………………..73 Εικόνα 5.3: Παράδειγµα εµφάνισης ιστοσελίδας σε υπολογιστή και σε κινητό….....76
  • 11. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 11 Περιεχόµενα 1.Εισαγωγή .................................................................................................................13   1.1 Προέλευση της θεωρίας......................................................................................13   1.2 Από το Optimal Foraging στο Information Foraging.........................................14   1.3 Σηµασία και εφαρµογή της θεωρίας του Information Foraging.........................15   2.Παρουσίαση και επεξήγηση του Information Foraging......................................16   2.1 Αρχικές- βασικές έννοιες....................................................................................16   2.1.1. Patch Model.................................................................................................16   2.1.2. Diet Model...................................................................................................25   2.1.3. Information scent.........................................................................................28   2.2 Information Foraging και δοµή του Παγκόσµιου Ιστού.....................................28   3.Τεχνικές µοντελοποίησης της πλοηγητικής συµπεριφοράς των χρηστών.........33   3.1 Ανάλυση Bayes ..................................................................................................33   3.2 Εξαπλούµενη ενεργοποίηση- Spreading activation............................................35   3.3 Random Utility Model........................................................................................35   3.4 Ο νόµος της περιήγησης.....................................................................................37   3.5 Μοντέλο SNIF-ACT...........................................................................................40   3.6 MESA.................................................................................................................46   3.7 CoLiDeS.............................................................................................................48   3.7.1 CoLiDeS+.....................................................................................................52   3.7.2 CoLiDeS + Pic .............................................................................................54   4. Μέθοδοι υποβοήθησης του χρήστη κατά τη διαδικασία αναζήτησης πληροφορίας ...............................................................................................................56   4.1 Μέθοδοι υποβοήθησης και Δεδοµένα Δοµής – Link Analysis ..........................56   4.1.1 Αρχική µέθοδος LAR...................................................................................57   4.1.2 Μέθοδος PageRank......................................................................................58   4.1.3 HITS.............................................................................................................60   4.1.4 Αλγόριθµοι LAR σχετιζόµενοι µε το spam..................................................60   4.2 Μέθοδοι υποβοήθησης και Δεδοµένα Περιεχοµένου ........................................62   4.2.1 Μέθοδοι προεπεξεργασίας δεδοµένων.........................................................62   4.2.2 Αναπαράσταση του περιεχοµένου σε µορφή διανύσµατος..........................63   4.3 Εξατοµικευµένη αναζήτηση στον Ιστό ..............................................................64   4.3.1 Μειονεκτήµατα της εξατοµικευµένης αναζήτησης .....................................66   5. Εφαρµογές στο σχεδιασµό ιστοσελίδων φιλικών προς το χρήστη ....................68   5.1 Σχεδιασµός µε βάση το information scent..........................................................69   5.2 Πλοηγητική συµπεριφορά και πρακτικές των χρηστών.....................................70   5.3 Σχεδιάζοντας ιστοσελίδες φιλικές προς το χρήστη ............................................72   5.3.1 Έµφαση στο information scent ....................................................................75   5.3.2 Απλότητα στο σχεδιασµό και τη γλώσσα ....................................................76   5.3.3 Χρόνος φόρτωσης της ιστοσελίδας..............................................................77   5.3.4 Responsive Design (Αποκριτικός Σχεδιασµός) ...........................................77   5.3.5 Adaptive Web Design ..................................................................................80   5.3.6 Εφαρµογές για κινητές συσκευές (mobile applications)..............................81   6. Προοπτικές και διαφαινόµενες τάσεις .................................................................83   6.1 Social Computing ...............................................................................................83  
  • 12. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 12 6.1.1 Social Computing και Information Foraging ...............................................87   6.2 Web Intelligence.................................................................................................87   6.3. Οντολογία..........................................................................................................87   6.4 Semantic Web.....................................................................................................88   6.5 Web mining και Κοινωνικά Δίκτυα ...................................................................91   7. Επίλογος – συµπεράσµατα ....................................................................................93   Γλωσσάρι ....................................................................................................................95   Ευρετήριο όρων........................................................................................................102   Παραποµπές..............................................................................................................104  
  • 13. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 13 1.Εισαγωγή Τα τελευταία χρόνια έχουµε γίνει µάρτυρες µιας αλµατώδους αύξησης στον όγκο των πληροφοριών οι οποίες µας είναι διαθέσιµες. Παράλληλα, τα τεχνολογικά µέσα που έχουµε στη διάθεσή µας έχουν πολλαπλασιαστεί και έχουν σηµειώσει εκρηκτική πρόοδο, αποτελώντας τον καθοριστικό παράγοντα τόσο για την παραγωγή όσο και για την µετάδοση των πληροφοριών αυτών. Ποτέ άλλοτε δεν είχαµε τόσο εύκολα και τόσο γρήγορα τη δυνατότητα να πληροφορηθούµε για οτιδήποτε µας ενδιαφέρει: Όχι µόνο µέσω υπολογιστή, αλλά και µέσω κινητών τηλεφώνων, tablet κτλ µπορεί ο καθένας να πλοηγηθεί αστραπιαία στον Παγκόσµιο Ιστό. Οι άνθρωποι συλλέγουν και µοιράζονται πληροφορίες και τις µετασχηµατίζουν σε γνώση, χαρακτηριστικό απαραίτητο για να προσαρµοστούν στην πολυπλοκότητα του κόσµου στον οποίο ζουν. Η προσαρµοστικότητα αυτή του ανθρώπου αποτέλεσε, αποτελεί και θα αποτελεί το κλειδί για την εξέλιξή του ως είδους . Εντούτοις, η αφθονία των διαθέσιµων πληροφοριών δηµιουργεί και προβλήµατα: Αν κάποτε ο όγκος των πληροφοριών ακολουθούσε µια φυσιολογική ροή, στις µέρες µας η υπερπληθώρα τους οδηγεί σε σύγχυση και απώλεια της προσοχής µας. Η έκφραση “βοµβαρδιζόµαστε από πληροφορίες”, αυτό ακριβώς υποδηλώνει. Εκτός αυτού, στην προσπάθειά µας να βρούµε αυτό που θέλουµε µέσα από τον τεράστιο όγκο πληροφοριών, χάνουµε πολύτιµο χρόνο. Είναι, εποµένως, πολύ σηµαντικό να βρούµε πώς µπορούν οι άνθρωποι να µεγιστοποιήσουν το όφελος από τη διαδικασία ανάκτησης των πληροφοριών που τους ενδιαφέρουν (από το σύνολο των πληροφοριών που διατίθενται), σε σχέση µε την προσπάθεια (κόστος) που απαιτείται γι' αυτό. Από τη µια, λοιπόν, πρέπει να εξεταστούν και κατανοηθούν οι µέθοδοι που χρησιµοποιούν οι άνθρωποι για να συλλέγουν τις πληροφορίες που τους ενδιαφέρουν, κι από την άλλη πρέπει το περιβάλλον από το οποίο ανακτούν τις πληροφορίες αυτές να είναι έτσι σχεδιασµένο ώστε να υποβοηθά την αναζήτηση αυτή. Τα ζητήµατα αυτά εξετάζει η θεωρία του Information Foraging. 1.1 Προέλευση της θεωρίας Η θεωρία του Information Foraging εµφανίστηκε για πρώτη φορά τη δεκαετία του '90 από τους Peter Pirolli και Stuart Card [1]. Η κεντρική της ιδέα έχει τις ρίζες της
  • 14. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 14 στη θεωρία του optimal foraging (βέλτιστη αναζήτηση τροφής), η οποία πρωτοεµφανίστηκε τη δεκαετία του '60 [2]. Σύµφωνα µε τη θεωρία του optimal foraging, οι ζωντανοί οργανισµοί αναζητούν τροφή µε τέτοιο τρόπο ώστε να µεγιστοποιούν την πρόσληψη ενέργειας ανά µονάδα χρόνου. Πιο συγκεκριµένα ψάχνουν, συλλέγουν και καταναλώνουν τροφή µε τρόπο που να µεγιστοποιεί τις θερµίδες που λαµβάνουν και να ελαχιστοποιεί το χρόνο που δαπανούν. Η θεωρία του optimal foraging αναπτύχθηκε στην προσπάθεια των βιολόγων να εξηγήσουν το µηχανισµό µε τον οποίο ένας θηρευτής αποφασίζει ποιο θήραµα να κυνηγήσει, καθώς και πότε και γιατί να µετακινηθεί από µια περιοχή σε µια άλλη, κατά την αναζήτηση τροφής. Η θεωρία αυτή υπήρξε ένα σηµαντικό εργαλείο για τη βιολογία και την οικολογία, µια και η µελέτη και αποσαφήνιση της συµπεριφοράς των ζώων και των πρακτικών που ακολουθούν κατά την αναζήτηση τροφής , βοήθησε σηµαντικά στην κατανόηση της προσαρµοστικότητας και της εξελικτικής διαδικασίας των ειδών. Μεταξύ αυτών, και του ανθρώπου, µια και η ίδια θεωρία χρησιµοποιήθηκε και στην ανθρωπολογία για την κατασκευή µοντέλων συµπεριφοράς τα οποία να προβλέπουν και να επεξηγούν πώς ο άνθρωπος εξελίσσεται και προσαρµόζεται στις εκάστοτε συνθήκες του περιβάλλοντός του. 1.2 Από το Optimal Foraging στο Information Foraging Η βασική ιδέα που αποτέλεσε το ερέθισµα για την ανάπτυξη της θεωρίας του Information Foraging ήταν ότι οι άνθρωποι, κατά την αναζήτηση πληροφορίας, εµφανίζουν παρόµοια συµπεριφορά µε τα ζώα-θηρευτές κατά την αναζήτηση τροφής. Πιο συγκεκριµένα, παίρνουν αποφάσεις για το πού θα ψάξουν για τις πληροφορίες που τους ενδιαφέρουν, τα εργαλεία που θα χρησιµοποιήσουν, πότε θα αλλάξουν το σηµείο στο οποίο ψάχνουν ή τη στρατηγική µε την οποία ψάχνουν, επανεκτιµώντας και αξιολογώντας τα αποτελέσµατα της µέχρι τότε αναζήτησής τους, µε σκοπό να βελτιστοποιήσουν το κέρδος (τη λήψη πληροφοριών), σε συνάρτηση µε το χρόνο που απαιτείται. Η µε αυτό τον τρόπο θεώρηση του ανθρώπου ως “θηρευτή” και η συµπεριφορά του κατά την αναζήτηση πληροφοριών, αναπαρίσταται µε την έννοια του “πληροφοριοφάγου” ή και “πληροφοριοβόρου” (informavore), η οποία αποδίδεται στον George A. Miller [3].
  • 15. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 15 1.3 Σηµασία και εφαρµογή της θεωρίας του Information Foraging Η µελέτη του τρόπου µε τον οποίο οι άνθρωποι ψάχνουν για πληροφορίες στον Παγκόσµιο Ιστό µε τη βοήθεια της θεωρίας του Information Foraging παράγει αποτελέσµατα και σηµαντικά οφέλη σε διάφορα πεδία: Από τη µια µας βοηθάει να κατανοήσουµε τη συµπεριφορά των χρηστών κατά τη διαδικασία ανεύρεσης πληροφοριών στο Web ·από την άλλη δίνει πολύτιµες πληροφορίες για το πώς πρέπει να είναι σχεδιασµένο το πλοηγητικό περιβάλλον πχ µιας ιστοσελίδας ώστε να διευκολύνει το χρήστη στην ανάκτηση των πληροφοριών που τον ενδιαφέρουν, ακόµα και να υποβοηθά τις διαφορετικές τεχνικές και στρατηγικές που µπορεί να χρησιµοποιήσουν οι διάφοροι χρήστες. Επιπλέον, η θεωρία αυτή αναγνωρίζει ότι η ανάκτηση πληροφοριών είναι µια δυναµική διαδικασία και υποβοηθά τη σχεδίαση συστηµάτων που να λαµβάνουν υπ' όψη το γεγονός αυτό.
  • 16. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 16 2.Παρουσίαση και επεξήγηση του Information Foraging 2.1 Αρχικές- βασικές έννοιες Όπως προαναφέρθηκε, η θεωρία του Information Foraging βασίζεται κατά µεγάλο βαθµό στα µοντέλα και τις τεχνικές που έχουν αναπτυχθεί από τη θεωρία του Optimal Foraging. Πιο συγκεκριµένα, δύο από τα µοντέλα αυτά αποτελούν την απαρχή για την κατανόηση, επεξήγηση και ανάπτυξη του Information Foraging : α) το µοντέλο των περιοχών (patch model) , το οποίο αναλύει ζητήµατα σχετικά µε την εύρεση και εκµετάλευση των πόρων που ενδιαφέρουν το θηρευτή, όταν οι πόροι είναι κατανεµηµένοι (διασκορπισµένοι) σε περιοχές (patches) [4], και β) το µοντέλο της διατροφής (diet model ), το οποίο εξηγεί και αναλύει τι διαλέγει να καταναλώσει και τι απορρίπτει ένας θηρευτής [4]. Μια τρίτη έννοια, αυτή του information scent [5], χρησιµοποιείται για να περιγράψει τον εντοπισµό και τη χρησιµοποίηση στοιχείων όπως οι βιβλιογραφικές αναφορές, εικόνες, αποσπάσµατα κειµένου ή σύνδεσµοι στο διαδίκτυο, τα οποία µας δίνουν συνοπτικές πληροφορίες (ενδείξεις) σχετικά µε το περιεχόµενο ενός βιβλίου ή µιας ιστοσελίδας. Παρακάτω θα αναλυθούν διεξοδικά οι έννοιες αυτές. 2.1.1. Patch Model Όπως προαναφέρθηκε, οι οργανισµοί διαβιούν σε ένα περιβάλλον στο οποίο η τροφή τους βρίσκεται κατανεµηµένη (διασκορπισµένη) ανά περιοχές (patches): Άλλες περιοχές έχουν µεγαλύτερη πυκνότητα φαγητού, άλλες παρουσιάζουν µεγαλύτερη ποικιλία, οι περιοχές έχουν µεταξύ τους διαφορετικές αποστάσεις κτλ. Κατ' αναλογία, το περιβάλλον µέσα στο οποίο ψάχνουµε, συλλέγουµε και χρησιµοποιούµε πληροφορίες έχει µια ανάλογη δοµή: • Πληροφορίες οι οποίες βρίσκονται συγκεντρωµένες σε κάποιο βιβλίο, σε κάποιο συγκεκριµένο κεφάλαιο ή σε διαφορετικά κεφάλαια µέσα στο ίδιο βιβλίο, ή ακόµα και σε άλλα βιβλία. • Βιβλία σχετικά µε κάποιο θέµα, τα οποία είναι συγκεντρωµένα σε κάποιο ράφι. • Βιβλιοθήκες που έχουν ταξινοµηµένα βιβλία ανά θεµατική ενότητα και βιβλιοθήκες περισσότερο ή λιγότερο εξειδικευµένες, σε διαφορετικές µεταξύ
  • 17. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 17 τους αποστάσεις. Ο ενδιαφερόµενος, λοιπόν, πηγαίνει από κεφάλαιο σε κεφάλαιο, από βιβλίο σε βιβλίο, από ράφι σε ράφι και από βιβλιοθήκη σε βιβλιοθήκη ψάχνοντας και συλλέγοντας τις πληροφορίες που τον ενδιαφέρουν, όπως κάποιος θηρευτής πηγαίνει από περιοχή σε περιοχή ψάχνοντας το εκάστοτε θήραµά του. Όπως θα δούµε παρακάτω, και ο Παγκόσµιος Ιστός έχει µια ανάλογη δοµή περιοχών και ιεραρχίας. Εκτός αυτού, κατά τη διαδικασία αναζήτησης τροφής , ο θηρευτής προσαρµόζει την τακτική του ανάλογα µε την περιοχή και το θήραµα: Μπορεί να πρέπει να περιµένει κρυµµένος πχ ανάµεσα σε θάµνους µέχρι την κατάλληλη στιγµή που θα επιτεθεί στο θήραµα ή πρέπει να είναι πολύ γρήγορος ώστε να πετύχει καλύτερα αποτελέσµατα δια του αιφνιδιασµού. Άλλες φορές ίσως θα πρέπει να είναι και προσεκτικός και γρήγορος ώστε να µη µετατραπεί ο ίδιος σε θήραµα κάποιου άλλου θηρευτή. Κατ' αναλογία, ψάχνοντας κάποιος για πληροφορίες, πρέπει να προσαρµόσει τον τρόπο που ψάχνει ανάλογα µε το µέρος: Ίσως θα πρέπει να βρει κάποια σχετικά βιβλία τα οποία θα έχει συγκεντρωµένα στο ίδιο σηµείο ή θα σκεφτεί µε ποια σειρά θα επισκεφτεί κάποιες διαφορετικές βιβλιοθήκες οι οποίες πιθανόν να έχουν τις πληροφορίες που τον ενδιαφέρουν. Με άλλα λόγια, θα πρέπει να σχεδιάσει τον τρόπο “δράσης” του ώστε να επιτύχει το επιδιωκόµενο αποτέλεσµα. Και, φυσικά, θα πρέπει να αναθεωρήσει και να αλλάξει το πλάνο του ανάλογα µε αλλαγές και προβλήµατα που µπορεί να προκύψουν, όπως , για παράδειγµα, τη δυσκολία να πάει σε µια βιβλιοθήκη επειδή έχουν απεργία τα Μέσα Μαζικής Μεταφοράς . Επιπρόσθετα, το περιβάλλον στο οποίο αναζητούµε πληροφορίες i) παρουσιάζει επίσης µια ιεραρχική δοµή και ii) δεν είναι στατικό, αλλά µπορούµε, σε µικρό ή µεγάλο βαθµό, να του δώσουµε τη µορφή που µας βολεύει περισσότερο: Ας πάρουµε για παράδειγµα το περιβάλλον εργασίας του γραφείου στο οποίο µελετάµε. Τα έγγραφα που χρησιµοποιούµε περισσότερο συνήθως βρίσκονται σε µικρότερη απόσταση, ώστε να είναι άµεσα διαθέσιµα. Μπορεί να είναι στοιβαγµένα, ή ακόµα καλύτερα ταξινοµηµένα για ακόµα πιο γρήγορη (άρα, αποτελεσµατική) πρόσβαση. Σε κάποιο ράφι, πιο µακριά, µπορεί να έχουµε κάποια βιβλία τα οποία συµβουλευόµαστε σπανιότερα. Και, λογικά, έχουµε µπροστά µας τον υπολογιστή ώστε να ψάξουµε γρήγορα πληροφορίες για κάτι το οποίο δεν έχουµε σε έντυπη µορφή, είτε έχοντάς το αποθηκευµένο στο σκληρό δίσκο είτε κάνοντας µια
  • 18. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 18 αναζήτηση στο διαδίκτυο. Δεν υπάρχει, όµως, κάποιος απόλυτος κανόνας σύµφωνα µε τον οποίο το κάθε τι θα µπει σε συγκεκριµένη θέση. Αντιθέτως, ο καθένας µπορεί να διαµορφώσει το χώρο του ανάλογα µε το πώς τον βολεύει καλύτερα αλλά και να αλλάξει τη διαµόρφωση του, αν το κρίνει σκόπιµο. Ας δούµε πιο συγκεκριµένα τι σηµαίνει η εύρεση πληροφοριών σε ένα περιβάλλον που είναι δοµηµένο όπως αναφέρθηκε στις προηγούµενες παραγράφους: Όταν κάποιος ψάχνει για πληροφορίες, περιηγείται µέσα στο εκάστοτε περιβάλλον µέχρι να βρει µια περιοχή η οποία φαίνεται να έχει αυτό που τον ενδιαφέρει. Δαπανά, λοιπόν , κάποιο χρόνο όταν µετακινείται (ψάχνει) ανάµεσα στις περιοχές. Όταν, δε, βρεθεί σε µια περιοχή, ξεκινά το ψάξιµο µέσα στην περιοχή. Κάποια στιγµή, όταν πια δε βρίσκει άλλες χρήσιµες πληροφορίες ή όταν θεωρήσει ότι θα βρει πιο γρήγορα και πιο πολλές πληροφορίες αν µετακινηθεί σε άλλη περιοχή, εγκαταλείπει την τρέχουσα για κάποια άλλη. Για να ποσοτικοποιήσουµε τα παραπάνω, ας ονοµάσουµε G το κέρδος ( gain ) της συνολικής διαδικασίας. Για το θηρευτή που ψάχνει για τροφή, αυτό θα µπορούσε να είναι οι συνολικές θερµίδες που θα µαζέψει . Για τον άνθρωπο, µπορεί να είναι ένα σύνολο χρήσιµων πληροφοριών που ανακτήθηκαν για κάποιο συγκεκριµένο στόχο. Ένα απλουστευµένο διάγραµµα της παραπάνω διαδικασίας παρουσιάζεται στο Σχ. 2.1.
  • 19. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 19 Το γράφηµα αντιπροσωπεύει το κέρδος (πληροφορίες) που µαζεύει ο ενδιαφερόµενος. Βρισκόµενος µέσα σε κάποια περιοχή, όποτε συλλέγει πληροφορίες, η γραφική παράσταση ανεβαίνει (αύξηση κέρδους G). Μετά περνάει κάποιος χρόνος ψάχνοντας για την επόµενη περιοχή , εισέρχεται σε µια καινούργια και µόλις συλλέξει νέες πληροφορίες, η γραφική παράσταση αυξάνεται εκ νέου. Σύµφωνα µε το µοντέλο των περιοχών, ο συνολικός δαπανόµενος χρόνος Τ διαιρείται σε δύο διακριτά µεταξύ τους µέρη: Στο χρόνο ο οποίος δαπανάται κατά τη µετακίνηση από τη µια περιοχή στην άλλη και στον εντός των περιοχών, κατά τη διάρκεια εύρεσης και συλλογής. Το Σχ. 2.1.β αποτελεί µια αναδιάταξη του Σχ. 2.1.α, παραθέτοντας πρώτα το χρόνο ανάµεσα στις περιοχές και µετά εντός των περιοχών. Με τη διάταξη αυτή το κέρδος παρουσιάζεται µόνο συναρτήσει του χρόνου εντός των περιοχών. Επίσης, η ευθεία που ξεκινά από την αρχή των αξόνων και καταλήγει στο τέλος του γραφήµατος αποτελεί το ρυθµό µεταβολής R του κέρδους, ο οποίος ισούται µε το πηλίκο του συνολικού κέρδους G προς τον συνολικό δαπανόµενο χρόνο TA ΤΕ Σχήµα 2.1: α) διάγραµµα του αυξανόµενου κέρδους ενός υποθετικού θηρευτή, µετακινούµενου από περιοχή σε περιοχή. β) ο ρυθµός µεταβολής κέρδους R, εκφρασµένος ως ο λόγος του συνολικού κέρδους G προς το άθροισµα των χρόνων ανάµεσα και εντός των περιοχών [6,σελ.13].
  • 20. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 20 (2.1) . Η ποσότητα R αποτελεί δείκτη της ικανότητας του θηρευτή. Στη µορφή αυτή, όµως, δεν είναι ιδιαίτερα χρήσιµη, καθώς απαιτείται ο συνολικός χρόνος και το συνολικό κέρδος για να αποφανθεί κανείς σχετικά µε την ικανότητα του θηρευτή. Κάνοντας µερικές παραδοχές µπορούµε να οδηγηθούµε σε µια πιο χρήσιµη µορφή της εξίσωσης 2.1 : 1. Ο αριθµός των περιοχών που επισκέπτεται ο θηρευτής εξαρτάται από το χρόνο που δαπανάται ανάµεσα στις περιοχές 2. Ο µέσος χρόνος που δαπανάται από περιοχή σε περιοχή είναι 3. Ο µέσος χρόνος εντός κάθε περιοχής είναι 4. Το µέσο κέρδος ανά περιοχή είναι Δεδοµένου κάποιου συνολικού χρόνου που έχει στη διάθεσή του ο θηρευτής, όσο περισσότερος χρόνος δαπανάται ανάµεσα στις περιοχές, τόσο λιγότερες είναι οι περιοχές που επισκέπτεται. Αν ονοµάσουµε (2.2) το ρυθµό µε τον οποίο επισκέπτεται µια περιοχή (ανά µονάδα χρόνου), το συνολικό κέρδος G θα είναι (2.3), αφού το γινόµενο εκφράζει το συνολικό αριθµό περιοχών τις οποίες θα επισκεφτεί ο θηρευτής. Ανάλογα, ο συνολικός χρόνος εντός των περιοχών θα είναι (2.4) . Αντικαθιστώντας στην εξίσωση 2.1 θα έχουµε (2.5) . Η εξίσωση αυτή ονοµάζεται Εξίσωση Δίσκου του Holling [7]. Είναι , δε, πιο χρήσιµη από την εξίσωση (2.1), µια και χρησιµοποιεί τους µέσους όρους µεγεθών, τα οποία µπορούµε να πάρουµε από δειγµατοληπτική µέτρηση του περιβάλλοντος. Αν υποθέσουµε ότι έχουµε ένα περιβάλλον που έχει δοµή περιοχών, µε την κάθε περιοχή να έχει το δικό της κέρδος (πληροφορίες), µπορούµε να βγάλουµε τα παρακάτω συµπεράσµατα (λαµβάνοντας υπ' όψιν και την εξίσωση (2.5) ): • Το περιβάλλον µπορεί να γίνει πιο “πλούσιο” από πλευράς κέρδους αν αυξηθεί η πυκνότητα των περιοχών που το αποτελούν. Στην περίπτωση αυτή, µειώνεται ο χρόνος ανάµεσα στις περιοχές, οπότε αυξάνονται οι περιοχές που R= G TA+ TE tA tE g λ= 1 tA G= λ TA g λ TA ΤΕ= λΤΑ tE R= λ TA g TA+ λ TA tE = λ g 1+ λ tE
  • 21. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 21 µπορεί να επισκεφτεί ο ενδιαφερόµενος (αυξάνεται το λ). • Ένας άλλος τρόπος για να γίνει πιο “πλούσιο” το περιβάλλον είναι να αυξηθεί το κέρδος που µπορεί να αποκοµίσει κάποιος µέσα σε κάθε περιοχή (αύξηση του g), αυξάνοντας έτσι το συνολικό κέρδος. Για κάθε περιοχή, µπορούµε να ορίσουµε ως κερδοφορία (profitability) το πηλίκο του κέρδους g προς το χρόνο δηλ. (2.6). Αυξάνοντας την κερδοφορία των περιοχών, αυξάνεται ο ρυθµός µεταβολής του κέρδους R. Από την άλλη, µειώνοντας το χρόνο ανάµεσα στις περιοχές (αλλιώς, αυξάνοντας το λ), η εξίσωση (2.5) τείνει ασυµπτωτικά να εξισωθεί µε την κερδοφορία των περιοχών, δηλ. R=π. Το συµβατικό µοντέλο περιοχών της θεωρίας του optimal foraging [4] αποτελεί µια ανάπτυξη της Εξίσωσης Δίσκου του Holling. Χρησιµοποιεί µια σειρά υποθέσεων για να βελτιστοποιήσει την κατανοµή του συνολικού χρόνου που δαπανάται ανάµεσα στις περιοχές και εντός τους. Σύµφωνα µε το µοντέλο , α) το περιβάλλον αποτελείται από διαφορετικά είδη περιοχών (άρα και διαφορετικό κέρδος ανά περιοχή) και β) το κέρδος ανά περιοχή εξαρτάται και από το δαπανώµενο χρόνο εντός της περιοχής, ο οποίος είναι υπό τον έλεγχο του θηρευτή. Η βελτιστοποίηση έγκειται στο πόσος χρόνος πρέπει να δαπανηθεί εντός µιας περιοχής προτού ο θηρευτής µετακινηθεί στην επόµενη. Πιο συγκεκριµένα, θεωρείται ότι το περιβάλλον αποτελείται από διαφορετικές περιοχές. Κάθε διαφορετική περιοχή αποτελείται από τα εξής χαρακτηριστικά: • , την εξάπλωση ή συχνότητα εµφάνισης (prevalence)µιας περιοχής τύπου i, • , το χρόνο παραµονής που περνάει ο θηρευτής εντός µιας περιοχής τύπου i, • , το κέρδος µιας περιοχής τύπου i, συναρτήσει του χρόνου που δαπανάται εντός της περιοχής αυτής. Λαµβάνοντας υπ' όψιν τα παραπάνω, η εξίσωση (2.5) παίρνει τη µορφή (2.7) . tE π= g tE 1,2,...,i,..., P λi tEi gi(tEi ) R= ∑ i= 1 P λigi(tEi ) 1+ ∑ i= 1 P λi tEi
  • 22. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 22 Το κέρδος g ανά περιοχή εκφράζεται πάντα µέσω µιας σχέσης-συνάρτησης. Η συνάρτηση αυτή δεν έχει την ίδια µορφή, αλλά εξαρτάται από το αντικείµενο και τη φύση της αναζήτησης. Για παράδειγµα, αν κάποιος κάνει µια αναζήτηση στο ίντερνετ γύρω από κάποιο αντικείµενο και η αναζήτηση επιστρέψει µια λίστα από πεπερασµένο αριθµό συνδέσµων, µια απλή καταγραφή των ιστοσελίδων στις οποίες παραπέµπει κάθε σύνδεσµος θα εκφραστεί µε µια γραµµική συνάρτηση κέρδους. Γενικά, όµως, το κέρδος από την αναζήτηση µέσα σε µια περιοχή µειώνεται µε την πάροδο του χρόνου, δηλαδή η συνάρτηση που περιγράφει το κέρδος συνήθως εκφράζεται από µια καµπύλη, της οποίας η κλίση µειώνεται όσο περνάει ο χρόνος µέσα στην περιοχή. Μια τέτοια περίπτωση αποτυπώνεται γραφικά στο Σχ. 2.2. Το σηµείο του Σχ. 2.2 είναι το χρονικό σηµείο στο οποίο ο θηρευτής είτε ξεκινάει την αναζήτηση κάποιας περιοχής είτε εγκαταλείπει κάποια για µια καινούργια. Αν φέρουµε µια ευθεία µε σηµείο εκκίνησης το , η οποία εφάπτεται της καµπύλης του , τότε η κλίση της ευθείας µας δίνει το βέλτιστο ρυθµό κέρδους R. Επίσης, το σηµείο στο οποίο εφάπτεται µε την καµπύλη µας δίνει και το βέλτιστο χρόνο παραµονής µέσα στην περιοχή. tA tA g(tE) ct Σχήµα 2.2: Σύµφωνα µε το Θεώρηµα Περιθωριακής Τιµής του Charnov, ο βέλτιστος χρόνος παραµονής εντός της περιοχής βρίσκεται από το σηµείο στο οποίο η γρ.παράσταση της g (t) εφάπτεται της ευθείας R* [6, σελ. 36].
  • 23. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 23 Για τη µαθηµατική επεξήγηση του Σχ. 2.2 θα χρησιµοποιήσουµε το Θεώρηµα Περιθωριακής Τιµής (Marginal Value Theorem -MVT) του Charnov [8], το οποίο µας βοηθά να βρούµε πότε είναι η κατάλληλη χρονικά στιγµή για έναν θηρευτή να εγκαταλείψει µια περιοχή για µια άλλη. Ας υποθέσουµε λοιπόν ότι έχουµε ένα είδος περιοχής και είναι ο ρυθµός µεταβολής του κέρδους (πάντα υπό τη συνθήκη ότι το κέρδος g είναι συνάρτηση του χρόνου εντός της περιοχής), οπότε θα είναι (2.8) . Επίσης, έστω g' η παράγωγος (περιθωριακή τιµή) της συνάρτησης κέρδους g. Σύµφωνα µε το Θεώρηµα Περιθωριακής Τιµής του Charnov, ο βέλτιστος χρόνος παραµονής εντός της περιοχής είναι αυτός για τον οποίο ισχύει (2.9) . Σε περίπτωση που υπάρχουν παραπάνω από µία περιοχές, ο συνολικός ρυθµός µεταβολής του κέρδους εξαρτάται από το βέλτιστο χρόνο για κάθε τύπο περιοχής, ο οποίος µε τη σειρά του βρίσκεται από το παρακάτω σύνολο εξισώσεων: (2.10). Αξίζει να σηµειωθεί ότι στην περίπτωση πολλαπλών τύπων περιοχών, το Θεώρηµα Περιθωριακής Τιµής δεν παρίσταται γραφικά µε τόσο απλό τρόπο όπως στο Σχ. 2.2 . Το συµβατικό µοντέλο περιοχών το οποίο παρουσιάστηκε παραπάνω χρησιµοποιεί ως υπόθεση ότι το περιβάλλον στο οποίο ενεργεί ο θηρευτής είναι αναλλοίωτο. Στην πράξη, όµως, για αυτόν που ψάχνει για πληροφορίες, κάτι τέτοιο δεν ισχύει. Αντίθετα, µπορεί να επέµβει στο περιβάλλον έτσι ώστε να γίνουν πιο αποδοτικές οι διάφορες στρατηγικές που χρησιµοποιεί. Η διαδικασία αυτή ονοµάζεται εµπλουτισµός (enrichment). R(tE) R(tE)= λg(tE) 1+ λ tE ct tEi g'1( ̂tE1)= R( ̂tE1, ̂tE2,..., ̂tEP) g'( ̂tE2)= R( ̂tE1, ̂tE2,..., ̂tEP) g'P( ̂tEP)= r( ̂tE1, ̂tE2,..., ̂tEP) lg (ct) = R (ct) = 1 + m (ct) mg(ct) h h
  • 24. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 24 Εµπλουτισµός ανάµεσα και εντός των περιοχών Ένας τρόπος εµπλουτισµού του περιβάλλοντος γίνεται µειώνοντας το χρόνο που απαιτείται για να µετακινηθεί κάποιος από τη µια περιοχή στην άλλη. Παράδειγµα αυτού είναι ο τρόπος µε τον οποίο οργανώνει κάποιος το γραφείο του, ώστε να βρίσκει πιο γρήγορα τις εκάστοτε πληροφορίες που αναζητεί. Γεννιέται, όµως, και το ακόλουθο πρόβληµα: Είναι προτιµότερο κανείς να δαπανήσει χρόνο για να µειώσει το χρόνο ανάµεσα στις περιοχές ή να τον χρησιµοποιήσει για ψάξιµο εντός των περιοχών; Ένας άλλος τρόπος εµπλουτισµού είναι βελτιώνοντας το κέρδος που αποκοµίζει κανείς ανά περιοχή. Αυτό µπορεί να γίνει, για παράδειγµα, αν κάποιος φιλτράρει τα αποτελέσµατα της αναζήτησής του, χρησιµοποιώντας λέξεις-κλειδιά. Ή φιλτράροντας τα εισερχόµενα mail του σε spam και αποδεκτά, ή ακόµα και δηµιουργώντας κατηγορίες ανάλογα µε τους αποστολείς. Κι αυτή, όµως, η διαδικασία γεννά ένα αντίστοιχο πρόβληµα: Είναι προτιµότερο κάποιος να επενδύσει χρόνο για να έχει µελλοντικά καλύτερη εκµετάλλευση των περιοχών ή να χρησιµοποιήσει αυτό το χρόνο για το ψάξιµο των περιοχών; Χρησιµοποιώντας πάλι το συµβατικό µοντέλο περιοχών, οδηγούµαστε στο Σχ. 2.3. Όπως φαίνεται στο Σχ. 2.3.α, µειώνοντας το χρόνο ανάµεσα στις περιοχές, αυξάνεται ο ρυθµός µεταβολής του κέρδους . Εκτός αυτού, όµως, µειώνεται και ο t A R Σχήµα 2.3: α) ο ρυθµός µεταβολής κέρδους R βελτιώνεται αν µειωθεί ο χρόνος ανάµεσα στις περιοχές. β) το ίδιο επιτυγχάνεται αν βελτιωθεί η καµπύλη της γρ.παράστασης της συνάρτησης κέρδους g(t) [6, σελ.36].
  • 25. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 25 βέλτιστος χρόνος εντός της περιοχής. Αντίστοιχα, όπως βλέπουµε στο Σχ. 2.3.β, αν αυξηθεί η συνάρτηση κέρδους , αυξάνεται ο ρυθµός µεταβολής του κέρδους , αλλά µειώνεται και ο βέλτιστος χρόνος παραµονής εντός της περιοχής. 2.1.2. Diet Model Ας θεωρήσουµε έναν θηρευτή, ο οποίος βρίσκεται σε ένα περιβάλλον µε ποικιλία διαφορετικών θηραµάτων, το καθένα από τα οποία βρίσκεται σε διαφορετική πληθυσµιακή συγκέντρωση, αλλά και µε διαφορετική ευκολία για τον θηρευτή στο να τα εντοπίσει, να τα κυνηγήσει και να τα καταναλώσει. Ανάλογα µε τις ανάγκες του θηρευτή, ποια είδη θηραµάτων θα πρέπει να κυνηγήσει και ποια να αποφύγει; Αν επιλέξει να κυνηγήσει πολλά είδη θηραµάτων, θα πιάνει και θηράµατα τα οποία δε θα του αποφέρουν σηµαντικό κέρδος (θερµίδες). Αν είναι πολύ εκλεκτικός, τότε θα χάνει πολύ χρόνο στο ψάξιµο του συγκεκριµένου είδους που θα τον ενδιαφέρει. Με άλλα λόγια, από ποια και πόσα είδη θα πρέπει να αποτελείται η δίαιτά (διατροφή) του; Το συµβατικό µοντέλο δίαιτας [4] ασχολείται µε τα ζητήµατα αυτά. Κατ' αρχάς, παίρνει ως δεδοµένες κάποιες υποθέσεις. Συγκεκριµένα, θεωρείται ότι: • Τα θηράµατα, συναρτήσει του χρόνου, συναντώνται µε συνεχή ρυθµό • Το ψάξιµο και η διαχείριση (περιλαµβανόµενης της καταδίωξης) των θηραµάτων αποτελούν δύο αµοιβαία ανεξάρτητες διαδικασίες • ο θηρευτής έχει πλήρη γνώση των θηραµάτων και του περιβάλλοντος όσον αφορά την πληθυσµιακή παρουσία, το ενεργειακό κέρδος και το κόστος ανεύρεσης και διαχείρισης των θηραµάτων • οι πληροφορίες σχετικά µε τα θηράµατα είναι πλήρως διαθέσιµες και µπορούν να χρησιµοποιηθούν άµεσα, όταν κάποιο θήραµα εντοπιστεί. Είναι σηµαντικό να επισηµανθεί ότι οι υποθέσεις που υιοθετεί το µοντέλο ως δεδοµένες, δεν ισχύουν απαραίτητα, καθώς επίσης και ότι δε λαµβάνονται υπ' όψιν άλλοι παράγοντες οι όποιοι µπορούν να επηρεάσουν τη διαδικασία. Για παράδειγµα, ένας θηρευτής δεν έχει πιθανότατα όσο χρόνο θα ήθελε στη διάθεσή του για να κυνηγήσει, επειδή αυτό µπορεί να αποβεί µοιραίο για τη ζωή του (να αποτελέσει δηλαδή κι ο ίδιος θήραµα ενός µεγαλύτερου θηρευτή) ή επειδή µπορεί να πρέπει σύντοµα να επιστρέψει στη φωλιά/καταφύγιό του, ώστε να προστατεύσει τα µικρά t o g(t) R t o
  • 26. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 26 του. Σύµφωνα µε το µοντέλο, ο θηρευτής µπορεί να κατατάξει τα θηράµατα σε διαφορετικούς τύπους, για τους οποίους γνωρίζει το κέρδος που µπορεί να αποκοµίσει και την πυκνότητα µε την οποία συναντώνται µέσα στην περιοχή. Ο µέσος χρόνος για να βρεθεί κάποιο θήραµα είναι . Θεωρείται, επίσης , ότι ο ρυθµός µε τον οποίο συναντάται ένα θήραµα τύπου i ακολουθεί µια τυχαία (Poisson) κατανοµή. Εποµένως, κάθε θήραµα τύπου i συναντάται µε ρυθµό . Επίσης, κάθε τύπος θηράµατος έχει ένα µέσο κέρδος , αποτέλεσµα της κατανάλωσής του. Ο µέσος χρόνος που απαιτείται για να κυνηγήσει, αιχµαλωτίσει και καταναλώσει το θήραµα ο θηρευτής είναι και αναφέρεται ως κόστος διαχείρισης του κάθε τύπου θηράµατος i. Τέλος, ονοµάζουµε κερδοφορία του θηράµατος τύπου i το πηλίκο (2.11) . Η δίαιτα ενός θηρευτή θα αποτελείται από εκείνα τα διαθέσιµα θηράµατα τα οποία θα αποφασίσει να κυνηγήσει. Έστω D το πλήθος των διαφορετικών τύπων θηραµάτων που αποφασίζει να κυνηγήσει ο θηρευτής. Χρησιµοποιώντας την Εξίσωση Δίσκου του Holling, µπορούµε να βρούµε το µέσο ρυθµό µεταβολής R του κέρδους g, ο οποίος θα είναι: (2.12) . Αλγόριθµος επιλογής της βέλτιστης δίαιτας Αν υποθέσουµε ότι ο χρόνος που απαιτείται για να αναγνωριστεί ο τύπος ενός θηράµατος είναι αµελητέος, τότε µπορεί να επιλεχθεί η βέλτιστη δίαιτα επιλέγοντας ποιοι τύποι θηράµατος θα περιλαµβάνονται σε αυτή και ποιοι όχι. Η επιλογή (ή όχι) ενός τύπου θηράµατος i µπορεί να γίνει µε τη βοήθεια της κερδοφορίας του ως εξής: Ταξινοµούµε τους τύπους θηράµατος ανά αύξουσα τιµή κερδοφορίας (δηλ. ) και τους προσθέτουµε έναν-έναν στη δίαιτα. Σταµατάµε όταν το µέχρι στιγµής άθροισµα των πρώτων k τύπων είναι µεγαλύτερο από την κερδοφορία του αµέσως επόµενου θηράµατος, δηλαδή όταν 1,2,...,i,..., n tAi λi= 1 tEi tWi πi= gi tEi R= ∑ i∈ D λi gi 1+ ∑ i∈ D λi tEi πi π1> π2> ...> πn
  • 27. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 27 (2.13) Η βέλτιστη δίαιτα µπορεί να απαρτιστεί από λιγότερους τύπους θηραµάτων, είτε αν αυξήσουµε την κερδοφορία των τύπων που έχουν τον υψηλότερο δείκτη κερδοφορίας είτε αυξάνοντας την παρουσία (πληθυσµό) των πιο κερδοφόρων τύπων. Από τον παραπάνω αλγόριθµο εξάγονται δύο σηµαντικά συµπεράσµατα: 1. Είναι προτιµότερο κανείς να µη συµπεριλαµβάνει θηράµατα µε κερδοφορία χαµηλότερη του µέσου όρου. Κι αυτό γιατί όση ώρα αναλώνεται στην εύρεση και κατανάλωση θηραµάτων µε µικρή κερδοφορία, χάνει την ευκαιρία να εντοπίσει θηράµατα µε µεγαλύτερη κερδοφορία. 2. Η επιλογή ενός τύπου θηραµάτων είναι ανεξάρτητη από το πλήθος των θηραµάτων αυτών. Εξαρτάται µόνο από το πόσο υψηλή κερδοφορία παρουσιάζουν. Εντούτοις, το πλήθος των διαφορετικών τύπων που θα περιληφθούν στη δίαιτα εξαρτάται από το πλήθος των θηραµάτων µε υψηλές κερδοφορίες. Αν τα θηράµατα µε υψηλή κερδοφορία συναντώνται µε µεγάλη συχνότητα, τότε η δίαιτα τείνει να βελτιστοποιηθεί µε ακόµα λιγότερους τύπους θηραµάτων. Για να γίνει αντιληπτό το µοντέλο της δίαιτας, ας θεωρήσουµε µια καθηµερινή πηγή πληροφόρησης, όπως η τηλεόραση: Αν υποθέσουµε ότι κάποια κανάλια έχουν κυρίως ειδησεογραφικό περιεχόµενο (υψηλό δείκτη κερδοφορίας), ενώ κάποια άλλα έχουν κυρίως ή µόνο ψυχαγωγικό περιεχόµενο (χαµηλό δείκτη κερδοφορίας), κάποιος που θέλει να ενηµερωθεί θα πρέπει να παρακολουθεί µόνο τα ειδησεογραφικά κανάλια. Ο λόγος είναι ότι αν βλέπει τα ψυχαγωγικά περιµένοντας κάποια ψήγµατα ειδήσεων, την ίδια στιγµή χάνει τις ειδήσεις που θα έβλεπε αν παρακολουθούσε κάποιο ειδησεογραφικό κανάλι. Επιπρόσθετα, αυτή η απόφαση είναι ανεξάρτητη της πληθώρας των ψυχαγωγικών καναλιών. Ένα άλλο παράδειγµα είναι τα mail που δέχεται κάποιος: Το διάβασµα των ανεπιθύµητων mail (spam ή junk) πρέπει να αποφεύγεται, µια και συνήθως δεν παρέχει χρήσιµες πληροφορίες στον ενδιαφερόµενο, αλλά και επειδή του καταναλώνει χρόνο από το διάβασµα άλλων mail τα οποία πιθανόν να του παρέχουν τις επιθυµητές πληροφορίες. Rk= ∑ 1 k λi gi 1+ ∑ i k λi tEi > πk+ 1= gk+ 1 tEk + 1
  • 28. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 28 2.1.3. Information scent Ως information scent ορίζεται η (κατά προσέγγιση) εκτίµηση της αξίας, του κόστους, του περιεχοµένου και του µονοπατιού πρόσβασης µιας πηγής πληροφοριών, από λέξεις, φράσεις, αποσπάσµατα κειµένου, εικόνες (καθώς και συνδυασµό αυτών) που παραπέµπουν στο περιεχόµενο της πηγής αυτής. Ο όρος αυτός χρησιµοποιείται για να περιγράψει πώς οι άνθρωποι εκτιµούν τις διαθέσιµες επιλογές τους όταν ψάχνουν για πληροφορίες. Όταν έχουν στη διάθεσή τους µια λίστα από επιλογές, θα διαλέξουν αυτή που φαίνεται πιο ξεκάθαρα ότι θα τους οδηγήσει στην πληροφορία που αναζητούν. Όπως και οι έννοιες των patch model και diet model, έτσι και το information scent έχει τις ρίζες του στη θεωρία του optimal foraging: όπως η οσµή και τα ίχνη ενός θηράµατος καθοδηγούν ένα ζώο-θηρευτή ώστε να κυνηγήσει µέσα σε µια περιοχή ή να την εγκαταλείψει για µια άλλη, έτσι και οι άνθρωποι αναζητούν στοιχεία τα οποία θα τους βοηθήσουν να βρουν πιο γρήγορα και αποτελεσµατικά τις πληροφορίες που ψάχνουν. Τα ίχνη αυτά, ανάλογα µε το είδος των πληροφοριών, µπορούν να έχουν διάφορες µορφές: βιβλιογραφικές αναφορές που µας παραπέµπουν σε πιο ειδικευµένες πληροφορίες σχετικά µε κάτι που ψάχνουµε, ονοµασίες φακέλων ενδεικτικές των αρχείων που περιέχουν στον υπολογιστή µας, η ονοµασία των ίδιων αυτών αρχείων που πληροφορεί για το περιεχόµενό τους, σύνδεσµοι ή εικόνες που εµφανίζονται όταν πραγµατοποιούµε µια αναζήτηση στο Internet κτλ. Όταν, λοιπόν, το information scent είναι ισχυρό, ο ενδιαφερόµενος µπορεί να αντιληφθεί ότι ψάχνει στη σωστή περιοχή, ώστε να βρει µε αποτελεσµατικότητα και ταχύτητα αυτό που θέλει, ενώ αν είναι ασθενές θα χάσει πολύτιµο χρόνο, µετακινούµενος από περιοχή σε περιοχή. Δεδοµένης της αλµατώδους εξάπλωσης του Internet σχεδόν σε κάθε πτυχή της ζωής του σύγχρονου ανθρώπου αλλά και του όγκου πληροφοριών µέσα στον οποίο κανείς ψάχνει, η έννοια του information scent αποτελεί τη σηµαντικότερη έννοια στη θεωρία του Information Foraging. 2.2 Information Foraging και δοµή του Παγκόσµιου Ιστού Οι τρεις έννοιες που παρουσιάστηκαν παραπάνω (patch model, diet model και information scent) χρησιµοποιούνται για την κατασκευή γνωστικών µοντέλων που περιγράφουν τη συµπεριφορά και τον τρόπο µε τον οποίο ενεργούµε όταν ψάχνουµε
  • 29. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 29 πληροφορίες. Ειδικότερα, τα µοντέλα αυτά αναφέρονται στον Παγκόσµιο Ιστό, καθώς είναι ο κυριότερος χώρος ανταλλαγής πληροφοριών, διαρκώς αυξανόµενος σε όγκο και πολυπλοκότητα. Στο σηµείο αυτό παρουσιάζεται συνοπτικά η δοµή µε την οποία είναι κατασκευασµένο το διαδίκτυο, ώστε να γίνει στη συνέχεια κατανοητός ο τρόπος µε τον οποίο χρησιµοποιούνται πρακτικά οι θεµελιώδεις έννοιες της θεωρίας. Η αναζήτηση πληροφοριών στον Ιστό γίνεται µε διάφορους τρόπους: πληκτρολογώντας λέξεις κλειδιά σε µια µηχανή αναζήτησης, κάνοντας κλικ σε κάποιο σύνδεσµο που βρίσκουµε, πληκτρολογώντας την πλήρη διεύθυνση της ιστοσελίδας (URL - Uniform Resource Locator), χρησιµοποιώντας τα κουµπιά του browser ( κουµπιά ιστορικού). Οι τρόποι αυτοί συναρτώνται και προέρχονται από τη δοµή µε την οποία είναι κατασκευασµένος ο Ιστός. Τα συστήµατα πληροφοριών τείνουν να έχουν µια ιεραρχική δοµή. Αυτό γίνεται για δύο λόγους: Για λόγους ευρωστίας ( µια και η δυσλειτουργία ενός µέρους σε χαµηλότερα επίπεδα της ιεραρχίας δεν επηρεάζει τη δοµή συνολικά) , αλλά και για λόγους αποτελεσµατικότητας. Σύµφωνα µε τον H. L. Resnikoff [9], µέσα από αποκεντρωµένες κοινωνικές διαδικασίες µπορούν να προκύψουν αποτελεσµατικά συστήµατα πληροφοριών, ιεραρχικά δοµηµένα. Επίσης, σύµφωνα µε τους Eiron και McCurley [10], η µοντελοποίηση του Ιστού µπορεί να εξηγηθεί µέσα από την κοινωνική διαδικασία της συγγραφής των ιστοσελίδων, σε συνδυασµό µε τις κοινωνικές σχέσεις που αναπτύσσονται στις οµάδες των ανθρώπων που ασχολούνται µε τη συγγραφή. Η ιεραρχική δοµή των οµάδων των ανθρώπων που ασχολούνται µε τη συγγραφή των σελίδων και τη διάδοση των πληροφοριών, φαίνεται να ακολουθεί την εξελικτική διαδικασία και άλλων κοινωνικών φαινοµένων, όπως αυτά περιγράφονται και από τον H. A. Simon [11]. Μια ιστοσελίδα είναι µια βασική περιοχή πληροφοριών. Αποτελεί µια περιοχή συγκέντρωσης πληροφοριών, και, ανάλογα µε το περιεχόµενο, µπορεί και να έχει διαφορετική µορφή: Μπορεί να περιέχει κείµενο, συνδέσµους προς άλλες σελίδες, banner µε διαφηµίσεις, πεδίο εισαγωγής όρων αναζήτησης, πτυσσόµενα µενού κτλ. Ο ιστότοπος παρέχει πρόσβαση σε ιστοσελίδες, αλλά και, ανάλογα µε τη χρησιµότητά του, σε βάσεις δεδοµένων, φόρµες επικοινωνίας ή/και εξυπηρέτησης καταναλωτών κ.ά., τα οποία αναφέρονται σε κάποιο κοινό θέµα ή εξυπηρετούν κάποιο κοινό σκοπό. Τα URLs επίσης έχουν ιεραρχική δοµή. Τέλος, οι πύλες (portals), οι οποίες
  • 30. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 30 λειτουργούν ως κεντρικοί κόµβοι για την εύρεση πληροφοριών, οµαδοποιούν συνδέσµους του διαδικτύου ανάλογα µε τη σηµασιολογική τους συσχέτιση αλλά και χρησιµοποιούν µηχανές αναζήτησης οι οποίες καταλογοποιούν τους συνδέσµους και εµφανίζουν αποτελέσµατα, σε µορφή ιστοσελίδας, σχετικά µε την αναζήτηση που κάνει ο χρήστης. Ξεκινώντας, λοιπόν, από τις πιο στοιχειώδεις µορφές περιοχών πληροφοριών (ιστοσελίδες), αυτές συγκεντρώνονται σε υψηλότερου επιπέδου περιοχές (ιστότοποι και portal). Ο τρόπος µε τον οποίο είναι κατανεµηµένοι οι σύνδεσµοι στον Ιστό προσοµοιάζει σε δοµή περιοχών. Μέσα σε έναν ιστότοπο, οι σύνδεσµοι µιας ιστοσελίδας παραπέµπουν κυρίως σε ιστοσελίδες του ίδιου ιστότοπου. Οι Eiron και McCurley [9] µελέτησαν την ιεραρχική δοµή του Ιστού, αναλύοντας 616 εκατοµµύρια ιστοσελίδες από 6,5 εκατοµµύρια ιστότοπους. Πήραν ένα δείγµα των συνδέσµων και τους κατηγοριοποίησαν ως εξής: Στο Ίδιο επίπεδο (ιεραρχικά), Πάνω και Κάτω (όσον αφορά το επίπεδο ιεραρχίας), Αυτοαναφορικούς, Εγκάρσιους (στον ίδιο ιστότοπο, αλλά χωρίς να εµπίπτουν στις παραπάνω κατηγορίες) και Εξωτερικούς (που παραπέµπουν σε άλλους ιστότοπους). Στο Σχ. 2.4 παρουσιάζονται σχηµατικά τα είδη των συνδέσµων. Η κατανοµή τους ήταν: 41.1% στο Ίδιο επίπεδο, 11.2% Πάνω, 3.9% Κάτω, 18.7% Εγκάρσιοι και 25% Εξωτερικοί (επίσης, 0.9% των συνδέσµων ήταν αυτοαναφορικοί). Παρατηρήθηκε, λοιπόν ότι περίπου το 75% των συνδέσµων παραπέµπουν σε ιστοσελίδες µέσα στον ίδιο ιστότοπο, ενώ 59.8% αφορούν σε σελίδες του ίδιου επιπέδου ιεραρχίας. Εκτός αυτού, παρατηρήθηκε ότι η πιθανότητα να υπάρχει κάποιος σύνδεσµος ανάµεσα σε δύο ιστοσελίδες µειώνεται εκθετικά, όσο αυξάνει η απόστασή τους µέσα στη δενδρική δοµή ενός ιστότοπου.
  • 31. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 31 Ενδιαφέρον παρουσιάζει και ο τρόπος µε τον οποίο προκύπτει η διασύνδεση των σελίδων στον Ιστό. Όταν κάποιος βρίσκεται σε µια ιστοσελίδα, συνήθως έχει βρεθεί εκεί ακολουθώντας κάποιο σύνδεσµο από µια άλλη ιστοσελίδα ή από το αποτέλεσµα κάποιας µηχανής αναζήτησης. Γενικά, όσο µεγαλύτερο ενδιαφέρον παρουσιάζει µια σελίδα ή ένας ιστότοπος, τόσο περισσότεροι σύνδεσµοι οδηγούν σε αυτόν. Αντίστοιχα, σε µια σελίδα συνήθως (αλλά όχι πάντα) υπάρχουν ένας ή περισσότεροι σύνδεσµοι οι οποίοι οδηγούν σε άλλες σελίδες µε παραπλήσιο ή πιο εξειδικευµένο περιεχόµενο. Όσους περισσότερους συγκεντρωµένους συνδέσµους έχει µια σελίδα οι οποίοι να παραπέµπουν σε άλλες σελίδες, τόσο πιο χρήσιµη µπορεί να είναι όταν αναζητούµε κάποιες πληροφορίες. Με άλλα λόγια, οι σελίδες και οι ιστότοποι µπορούν να ιδωθούν ως κόµβοι πληροφοριών µέσα στη δοµή του Ιστού. Οι κόµβοι από τους οποίους εκκινούν οι διάφοροι σύνδεσµοι ονοµάζονται hubs και οι κόµβοι στους οποίους καταλήγουν οι σύνδεσµοι ονοµάζονται authorities (έγκυρες σελίδες) [12]. Προφανώς, ένας κόµβος πληροφοριών µπορεί να ιδωθεί είτε σαν hub είτε σαν authority (και προφανώς είναι και τα δύο), ανάλογα µε το τι µας ενδιαφέρει: ο αριθµός των εξερχόµενων (outlinks ή outbound links) ή των εισερχόµενων (inlinks ή
  • 32. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 32 inbound links) συνδέσµων. Ο αριθµός των outlinks (αντίστοιχα: inlinks) ενός hub (αντίστοιχα: authority) ονοµάζεται µέγεθος του αντίστοιχου κόµβου. Το µέγεθος ενός κόµβου αποτελεί ένα εργαλείο για το αν θα προτιµηθεί ή όχι από κάποιον. Αν κάποιος ενδιαφερόµενος ψάχνει για πληροφορίες, είναι πιθανότερο να κατευθυνθεί σε ένα κόµβο που έχει µεγάλο µέγεθος ως hub. Κι αυτό γιατί θα ξέρει ότι από τον κόµβο αυτό θα εκκινούν πολλοί απευθείας σύνδεσµοι για άλλες σελίδες, άρα µειωµένο κόστος αναζήτησης. Γι΄ αυτό και αρκετός κόσµος συνηθίζει να ξεκινά την αναζήτησή του από ένα µεγάλο portal. Αντίστοιχα, το µέγεθος του authority αποτελεί ένα καλό εργαλείο για τη σχετικότητα µιας ιστοσελίδας µε αυτό που ψάχνουµε. Το να υπάρχει ένα inlink σε µια σελίδα σηµαίνει ότι θεωρείται σχετική και άξια αναφοράς από αυτόν που παραπέµπει στη σελίδα αυτή και όσο περισσότερα inlinks, τόσο περισσότερο σχετική φαίνεται να είναι η σελίδα. Φυσικά, σε κάτι τέτοιο µπορούν να υπεισέρχονται παράγοντες όπως η προσωπική προτίµηση αυτού που κάνει την παραποµπή ή το προσωπικό όφελος, ακόµη και η διάθεση εξαπάτησης. Εντούτοις, αποτελεί ένα εργαλείο το οποίο χρησιµοποιούν διάφοροι ευρετικοί αλγόριθµοι στον τοµέα του SEO (Search Engine Optimisation), όπως οι µηχανές αναζήτησης. Τέλος, ο Ιστός παρουσιάζει µια δοµή επί µέρους τοπικότητας, ανάλογα µε τα θέµατα ενδιαφέροντος: Οι πληροφορίες που είναι σχετικές µε κάποιο θέµα τείνουν να βρίσκονται συγκεντρωµένες σε κοντινές περιοχές πληροφοριών. Ο Davison [13] αξιολόγησε την τοπικότητα ενός δείγµατος σελίδων ανά ζεύγη, ανάλογα µε το αν ήταν συνδεδεµένες απ' ευθείας (µέσω συνδέσµων µεταξύ τους), συνδεδεµένες συγγενικά (µέσω της ίδιας σελίδας-γονέα) και διαλεγµένες τυχαία. Λαµβάνοντας τη σχετικότητα των κειµένων τους, παρατήρησε ότι οι άµεσα συνδεδεµένες σελίδες είχαν τη µεγαλύτερη σχετικότητα, ενώ οι συνδεδεµένες συγγενικά είχαν παραπλήσια αλλά λίγο µικρότερη σχετικότητα. Εντούτοις, οι διαλεγµένες τυχαία σελίδες είχαν σηµαντικά µικρότερη σχετικότητα µεταξύ τους, και µε µεγάλη διαφορά από τις προηγούµενες οµαδοποιήσεις.
  • 33. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 33 3.Τεχνικές µοντελοποίησης της πλοηγητικής συµπεριφοράς των χρηστών Όπως αναφέρθηκε στο προηγούµενο κεφάλαιο, η έννοια του information scent διαδραµατίζει κεντρικό ρόλο στη θεωρία του Information Foraging. Η ορθολογιστική ανάλυση (rational analysis) του information scent υποθέτει ότι ο στόχος του χρήστη είναι η χρησιµοποίηση εξωτερικών ενδείξεων εγγύητητας πληροφορίας (proximal cues) µε σκοπό να προβλέψει και εκτιµήσει τη χρησιµότητα µακρινών πηγών πληροφοριών (πχ µιας ιστοσελίδας η οποία σχετίζεται µε κάποιο σύνδεσµο στο Internet), και, έπειτα, να πλοηγηθεί στις πηγές µε τη µεγαλύτερη προσδοκώµενη χρησιµότητα. Η ανάλυση αυτή αποτελείται από τρία στάδια: α) µια ανάλυση Bayes [6 σελ.76] της προσδοκώµενης σχετικότητας µιας µακρινής πηγής πληροφοριών, µε βάση τις διαθέσιµες ενδείξεις του information scent, β) µια απεικόνιση του παραπάνω µοντέλου σε µαθηµατική διατύπωση ενός µηχανισµού εξαπλούµενης ενεργοποίησης (spreading activation) και γ) ένα µοντέλο ορθολογιστικής επιλογής το οποίο χρησιµοποιεί την εξαπλούµενη ενεργοποίηση για να εκτιµήσει τη χρησιµότητα των εναλλακτικών συνδέσµων στον Ιστό. 3.1 Ανάλυση Bayes Ας υποθέσουµε ότι ψάχνουµε πληροφορίες για κάποιο θέµα που µας ενδιαφέρει. Έστω επίσης ότι έχουµε ένα σύνολο µακρινών πηγών (πχ ιστοσελίδες) και ένα σύνολο από ενδείξεις εγγύτητας σχετικά µε τις πληροφορίες που αναζητούµε. Ας ονοµάσουµε Ε το σύνολο των πληροφοριών που επιθυµούµε (και οι οποίες περιέχονται σε κάποιες ιστοσελίδες) και C το σύνολο των ενδείξεων εγγύτητας που έχουµε (σύνδεσµοι). Χρησιµοποιώντας το θεώρηµα του Bayes υπό τη µορφή σχετικών πιθανοτήτων (odds), η πρόβλεψη µια ιστοσελίδα να περιέχει πληροφορίες που µας ενδιαφέρουν, δεδοµένης της ύπαρξης ενδείξεων εγγύτητας, θα είναι (3.1) , όπου O(E/C) είναι η εκ των υστέρων πρόβλεψη ύπαρξης των επιθυµητών πληροφοριών Ε δοθέντων των ενδείξεων εγγύτητας C, O(E) η εκ των προτέρων πρόβλεψη ύπαρξης επιθυµητών πληροφοριών Ε, Pr(C/E) η πιθανότητα οι δοθείσες ενδείξεις εγγύτητας να είναι σχετικές µε τις επιθυµητές O(E/C)= O(E)⋅ Pr(C/E) Pr(C/E')
  • 34. Γεώργιος Αµπαρτζίδης, “Information Foraging Theory: Αλγόριθµοι, Τεχνολογίες και Προοπτικές στην Παρατήρηση της Πλοηγητικής Συµπεριφοράς των Χρηστών του Διαδικτύου” Ελληνικό Ανοιχτό Πανεπιστήµιο: ΠΛΣ Διπλωµατική Εργασία 34 πληροφορίες Ε και Pr(C/E') η πιθανότητα οι δοθείσες ενδείξεις εγγύτητας να µην οδηγούν στις επιθυµητές πληροφορίες. Οι προβλέψεις µπορούν κι αυτές να γραφτούν σε µορφή πιθανοτήτων, µε , όπου Pr(E/C) είναι η πιθανότητα να βρεθούν οι πληροφορίες δοθέντων των ενδείξεων εγγύτητας και Pr(E'/C) η πιθανότητα να µη βρεθούν οι πληροφορίες δοθέντων των ενδείξεων εγγύτητας και , όπου Pr(E) η πιθανότητα να βρεθούν οι επιθυµητές πληροφορίες και Pr(E') η πιθανότητα να µη βρεθούν. Στην περίπτωση αυτή η εξίσωση (3.1) γράφεται ως εξής: (3.2). Μπορούµε να υποθέσουµε ότι οι επιθυµητές πληροφορίες αποτελούνται από ένα σύνολο στοιχείων i τα οποία είναι συνδυασµός λέξεων, εικονιδίων, αριθµών, γραφηµάτων κτλ (ανάλογα µε το είδος των πληροφοριών που ψάχνουµε) . Αντίστοιχα, οι ενδείξεις εγγύτητας αποτελούνται επίσης από ένα σύνολο διαφορετικών στοιχείων j (πχ συνδέσµους). Με τα δεδοµένα αυτά οδηγούµαστε στην παρακάτω µορφή: (3.3) , όπου το αριστερό µέλος της εξίσωσης εκφράζει την πρόβλεψη να βρεθεί ένα επιθυµητό χαρακτηριστικό i δοθέντων των ενδείξεων εγγύτητας, είναι η πρόβλεψη ύπαρξης ενός χαρακτηριστικού i και Pr(i / j) η πιθανότητα εύρεσης του χαρακτηριστικού i µε δεδοµένη την ύπαρξη µιας ένδειξης εγγύτητας j, δηλαδή η πιθανότητα να υπάρχει συσχέτιση µεταξύ τους. Είναι σηµαντικό να επισηµανθεί ότι η συσχέτιση αυτή προκύπτει από προηγούµενη εµπειρία. Λογαριθµίζοντας την τελευταία εξίσωση θα έχουµε (3.4) ή (3.5), όπου , και Η (3.5) αποτελεί τη βάση για το µηχανισµό εξαπλούµενης ενεργοποίησης. Η ποσότητα είναι γνωστή ως Κατά Σηµεία Αµοιβαία Πληροφορία (Pointwise O(E/C)= Pr(E/C) Pr(E'/C) O(E)= Pr(E) Pr(E') Pr (E'/C) Pr (E/C) = Pr (E') Pr (E) $ Pr (C/E') Pr (C/E) Pr(i/C) Pr(i'/C) = Pr(i) Pr(i ') ⋅ ∏j∈ C Pr(i/j) Pr (i) Pr(i) Pr(i') log( Pr(i/C) Pr(i '/C) )= log( Pr(i) Pr(i') )+ ∑j∈ C Pr(i/j) Pr(i) Ai= log( Pr(i/C) Pr (i'/C) ) Bi= log( Pr(i) Pr(i') ) Sji= Pr(i/j) Pr(i) Sji Ai= Bi+ ∑ j Sji