SlideShare a Scribd company logo
1 of 21
Download to read offline
Intro
              Fabio Celli                                     Personality
              E x tra c tio n o f U s ers ' P ers o na lity
                                                              Evaluation
              fro m FriendFeed I ta lia n P o s ts
                                                              Results




                       Computer Science
Comp. Linguistics



                Social
               Network
               Analysis
  Sociology
                  Psychology
                                                                      Urbino
                                                                 sep.30.2010
Intro
              Fabio Celli                                     Personality
              E x tra c tio n o f U s ers ' P ers o na lity
                                                              Evaluation
              fro m FriendFeed I ta lia n P o s ts
                                                              Results




                       Computer Science
Comp. Linguistics



                Social
               Network
               Analysis
  Sociology
                  Psychology
                                                                      Urbino
                                                                 sep.30.2010
Intro
           Fabio Celli                                     Personality
           E x tra c tio n o f U s ers ' P ers o na lity
                                                           Evaluation
           fro m FriendFeed I ta lia n P o s ts
                                                           Results



                       - extract information from text
                       - development of ontologies
                       - development of search engines
                       ...

                       - estrazione di informazioni da testi
Comp. Linguistics      - sviluppo di ontologie
                       - sviluppo dei motori di ricerca
                       ...




                                                                    Urbino
                                                               sep.30.2010
Intro
           Fabio Celli                                     Personality
           E x tra c tio n o f U s ers ' P ers o na lity
                                                           Evaluation
           fro m FriendFeed I ta lia n P o s ts
                                                           Results



                       1) collect text data and annotate it
                       2) build model of information in text
                       4) develop programs that extract info modelized


                       1) collezione e annotazione di dati testuali
Comp. Linguistics      2) sviluppo di modelli dell'informazione nei testi
                       3) sviluppo di programmi per estrarre info




                                                                   Urbino
                                                              sep.30.2010
Intro
       Fabio Celli                                     Personality
       E x tra c tio n o f U s ers ' P ers o na lity
                                                       Evaluation
       fro m FriendFeed I ta lia n P o s ts
                                                       Results



                   SNSs provide tons of data (text+users)
                   Problems:
                   1) formalization of personality
                   2) annotation of data with personality
                   judgements


SNSs               I Social Networks contengono un sacco di dati
                   Problemi:
                   1) formalizzazione della personalità
                   2) annotazione dei dati con valutazioni della
                   personalità




                                                               Urbino
                                                          sep.30.2010
Intro
                    Fabio Celli                                         Personality
                    E x tra c tio n o f U s ers ' P ers o na lity
                                                                        Evaluation
                    fro m FriendFeed I ta lia n P o s ts
                                                                        Results



             BIG 5: standard model used in Psychology [Norman 1963]
             Extraversion
             Emotional stability
Psychology   Agreebleness
             Conscientiousness
             Openness to experience

             BIG 5: modello standard in Psicologia      [Norman 1963]
             Estroversione
             Stabilità emotiva
             Cooperatività
             Precisione
             Immaginatività



                                                                                Urbino
                                                                           sep.30.2010
Intro
                         Fabio Celli                                         Personality
                         E x tra c tio n o f U s ers ' P ers o na lity
                                                                             Evaluation
                         fro m FriendFeed I ta lia n P o s ts
                                                                             Results



                Linguistic Features correlating with BIG 5 [Mairesse et al 2007]
                Tratti linguistici associati al BIG 5 [Mairesse et al 2007]

Psychology   Features    Extrav.    Emot. st.   Agreebl.   Consc.        Openn.
             .:;-        -                                               -
             ,                                                           +
             @user       -                                               +
             !                                  +                        +
             Links
             io mi mio   +          -                                    -
             no non      -          +           +          -
             :(                     +           -          -
             0-9                                                         -
             ()[]{}      -                                               +
             :)          +          +
             di a da …              +                      +
             ?           -                                 -             +
             Swears                             -          -             +
             N° Words                                                    +
             Word freq              -                      +             -
                                                                                       Urbino
             ...
                                                                                  sep.30.2010
Intro
                            Fabio Celli                                     Personality
                            E x tra c tio n o f U s ers ' P ers o na lity
                                                                            Evaluation
                            fro m FriendFeed I ta lia n P o s ts
                                                                            Results



                     Example of personality (formalized)
                     Esempio di personalità (formalizzata)

 Psychology



                                      yyonn

yes            yes              balance            no                 no
extraversion   emotivity        agreebleness       consciousness openness




                                                                                    Urbino
                                                                               sep.30.2010
Intro
                                  Fabio Celli                                     Personality
                                  E x tra c tio n o f U s ers ' P ers o na lity
                                                                                  Evaluation
                                  fro m FriendFeed I ta lia n P o s ts
                                                                                  Results




Here comes the hard part:
- it is hard for human annotators to reach consensus on personality judgenments.

Assumption:
- one user has one and only one (complex) personality. So I can evaluate it
comparing more posts of the same user.


Qui viene il difficile:
- il consenso sui giudizi della personalità dato dagli annotatori è difficile da ottenere

Assunto:
-un utente ha una e una sola personalità (complessa). Dunque Possiamovalutarla
confrontando più post dello stesso utente.

                                                                                          Urbino
                                                                                     sep.30.2010
Intro
                        Fabio Celli                                     Personality
                        E x tra c tio n o f U s ers ' P ers o na lity
                                                                        Evaluation
                        fro m FriendFeed I ta lia n P o s ts
                                                                        Results



                   Personality recognizer:
                   - input: 1) posts+users 2) list of all users
                   - process: calculate features for each user
                   - modelize: produce a personality model for each user
Computer Science   - evaluate: compare personality model with users' posts
                   - output: 1) personality 2) accuracy 3) validity

                   Riconoscitore della personalità
                   -input: 1) post+utente 2) lista degli utenti
                   - calcola i tratti per ciascun utente
                   - produce un modello della personalità per ciascun utente
                   - compara il modello con tutti i post dell'utente
                   - output: 1) personalità 2) accuracy 3) validity



                                                                                Urbino
                                                                           sep.30.2010
Intro
                               Fabio Celli                                     Personality
                               E x tra c tio n o f U s ers ' P ers o na lity
                                                                               Evaluation
                               fro m FriendFeed I ta lia n P o s ts
                                                                               Results



                         Personality recognizer:
                         - input: 1) posts+users 2) list of all users
                         - process: calculate features for each user
                         - modelize: produce a personality model for each user
Computer Science         - evaluate: compare personality model with users' posts
                         - output: 1) personality 2) accuracy 3) validity

                        Riconoscitore della personalità
                        -input: 1) post+utente 2) lista degli utenti
                        - calcola i tratti per ciascun utente
                        - produce un modello della personalità per ciascun utente
                        - compara il modello con tutti i post dell'utente
            Measure of the reliability
                        - output: 1) personalità 2) accuracy 3) validity
            of the personality model
                                                 tp=true positives
            Misura dell'affidabilità del         tn=true negatives
            modello della personalità            fp=false positives
                                                 fn=false negatives                    Urbino
                                                                                  sep.30.2010
Intro
                                Fabio Celli                                     Personality
                                E x tra c tio n o f U s ers ' P ers o na lity
                                                                                Evaluation
                                fro m FriendFeed I ta lia n P o s ts
                                                                                Results



                          Personality recognizer:
                          - input: 1) posts+users 2) list of all users
                          - process: calculate features for each user
                          - modelize: produce a personality model for each user
Computer Science          - evaluate: compare personality model with users' posts
                          - output: 1) personality 2) accuracy 3) validity

                           Riconoscitore della personalità
                           -input: 1) post+utente 2) lista degli utenti
                           - calcola i tratti per ciascun utente
                           - produce un modello della personalità per ciascun utente
                   Measurecompara il modello con tutti i post dell'utente
                           - of the variability
                   of the user's personality
                           - output: 1) personalità 2) accuracy 3) validity

                   Misura della variabilità       a=accuracy
                   della personalità              P=number of user's posts
                   dell'utente                                                          Urbino
                                                                                   sep.30.2010
Intro
                                  Fabio Celli                                     Personality
                                  E x tra c tio n o f U s ers ' P ers o na lity
                                                                                  Evaluation
                                  fro m FriendFeed I ta lia n P o s ts
                                                                                  Results




Sample from FriendFeed dataset [Celli, Magnani, DiLascio, Pacelli, Rossi 2010]
captured from http://friendfeed.com/public
748 Italian FriendFeed users, 1065 posts. 156 users have more than one post.
Mean accuracy = .631
Mean validity = .729


Campione da FriendFeed [Celli, Magnani, DiLascio, Pacelli, Rossi 2010]
http://friendfeed.com/public
748 utenti, 1065 posts, 156 utenti con più di un post.
Accuracy media = .631
Validity media = .729



                                                                                          Urbino
                                                                                     sep.30.2010
Intro
       Fabio Celli                                     Personality
       E x tra c tio n o f U s ers ' P ers o na lity
                                                       Evaluation
       fro m FriendFeed I ta lia n P o s ts
                                                       Results




Rank       Model              Freq
1          ynyyn              16.6%
2          ynyon              12.1%
3          onoyn              7.6%
4          ooooo              7.6%
5          ynoyn              4.5%
6          yoooo              4.5%
7          ynooo              3.8%
8          ynoyo              3.8%
9          ynoon              3.2%
10         onyoo              3.2%
...        (other)            39.1%



                                                               Urbino
                                                          sep.30.2010
Intro
Fabio Celli                                     Personality
E x tra c tio n o f U s ers ' P ers o na lity
                                                Evaluation
fro m FriendFeed I ta lia n P o s ts
                                                Results




                                                        Urbino
                                                   sep.30.2010
Intro
                                Fabio Celli                                     Personality
                                E x tra c tio n o f U s ers ' P ers o na lity
                                                                                Evaluation
                                fro m FriendFeed I ta lia n P o s ts
                                                                                Results




Pearson's correlation test reveal that there is a strong (+0.79) and highly significant
correlation (p-value = .0003) between the accuracy and personality model types

Il test di correlazione (Pearson) rivela che c'è una forte correlazione tra alcuni tipi di
 personalità e l'accuratezza




                                                                                        Urbino
                                                                                   sep.30.2010
Intro
                                Fabio Celli                                     Personality
                                E x tra c tio n o f U s ers ' P ers o na lity
                                                                                Evaluation
                                fro m FriendFeed I ta lia n P o s ts
                                                                                Results




Pearson's correlation test reveal that there is a strong (+0.79) and highly significant
correlation (p-value = .0003) between the accuracy and personality model types

Il test di correlazione (Pearson) rivela che c'è una forte correlazione tra alcuni tipi di
 personalità e l'accuratezza

Althought there is no correlation (p-value = .413) between personality and posting
activity, once ltered out the long tail of users with sparse personality models,
emerges that there is one personality type that produces more posts than others

Anche se non c'è correlazione tra tra le personalità è il numero di post prodotti,
presi solo i tipi di personalità più frequenti emerge che c'è una personalità che
produce più delle altre


                                                                                        Urbino
                                                                                   sep.30.2010
Intro
Fabio Celli                                     Personality
E x tra c tio n o f U s ers ' P ers o na lity
                                                Evaluation
fro m FriendFeed I ta lia n P o s ts
                                                Results




                                                        Urbino
                                                   sep.30.2010
Intro
                               Fabio Celli                                     Personality
                               E x tra c tio n o f U s ers ' P ers o na lity
                                                                               Evaluation
                               fro m FriendFeed I ta lia n P o s ts
                                                                               Results




A manual look to the data reveals that there are some users (the ones with higher
validity) that are focused on a topic, example: “styleandthecity”, “ultimora",
“cronaca24"

Uno sguardo più ravvicinato ai dati rivela che ci sono alcuni utenti con alta validity
che parlano di un preciso argomento. Esempio: “styleandthecity”, “ultimora",
“cronaca24"




                                                                                       Urbino
                                                                                  sep.30.2010
Intro
                               Fabio Celli                                     Personality
                               E x tra c tio n o f U s ers ' P ers o na lity
                                                                               Evaluation
                               fro m FriendFeed I ta lia n P o s ts
                                                                               Results




CONCLUSIONS
The work presented here is a first survey of personality in SNSs. In the future it
would be interesting to run experiments following threads of users checking for their
personality in order to study how personalities interact together, and what are the
features that make a post interesting to a certain personality type (requires topc
analysis).

CONCLUSIONI
Il lavoro presentato qui è solo un primo approccio allo studio della personalità nei
Social Networks, nel futuro sarebbe interessante studiare l'andamento delle
discussioni tra utenti monitorando la loro personalità e studiando come le
personalità interagiscono tra loro, e quali contenuti sono interessanti per quali
personalità (questo richiede analisi dei topic).


                                                                                       Urbino
                                                                                  sep.30.2010
Intro
Fabio Celli                                     Personality
E x tra c tio n o f U s ers ' P ers o na lity
                                                Evaluation
fro m FriendFeed I ta lia n P o s ts
                                                Results




Thank you!!!




                                                        Urbino
                                                   sep.30.2010

More Related Content

More from Luca Rossi

The Genesis of Crisis Communication: from Witnesses to Gatewatchers
The Genesis of Crisis Communication: from Witnesses to GatewatchersThe Genesis of Crisis Communication: from Witnesses to Gatewatchers
The Genesis of Crisis Communication: from Witnesses to GatewatchersLuca Rossi
 
Social Media in 2013 italian Elections
Social Media in 2013 italian Elections Social Media in 2013 italian Elections
Social Media in 2013 italian Elections Luca Rossi
 
News Italia 2012
News Italia 2012News Italia 2012
News Italia 2012Luca Rossi
 
Conversation Practices and Network Structure in Twitter
Conversation Practices and Network Structure in TwitterConversation Practices and Network Structure in Twitter
Conversation Practices and Network Structure in TwitterLuca Rossi
 
Ecologia spettatorialità
Ecologia spettatorialitàEcologia spettatorialità
Ecologia spettatorialitàLuca Rossi
 
Una generazione di Nativi Digitali?
Una generazione di Nativi Digitali? Una generazione di Nativi Digitali?
Una generazione di Nativi Digitali? Luca Rossi
 
EU Kids Online
EU Kids OnlineEU Kids Online
EU Kids OnlineLuca Rossi
 
Partecipazione e Civic Engagement
Partecipazione e Civic EngagementPartecipazione e Civic Engagement
Partecipazione e Civic EngagementLuca Rossi
 
A Foucaultian perspective on Web 2.0
A Foucaultian perspective on Web 2.0A Foucaultian perspective on Web 2.0
A Foucaultian perspective on Web 2.0Luca Rossi
 
A Foucaultian perspective on web2.0
A Foucaultian perspective on web2.0A Foucaultian perspective on web2.0
A Foucaultian perspective on web2.0Luca Rossi
 
Glee tube mediamutation
Glee tube mediamutationGlee tube mediamutation
Glee tube mediamutationLuca Rossi
 
Gaming in SNS context
Gaming in SNS contextGaming in SNS context
Gaming in SNS contextLuca Rossi
 
Information propagation in Microblogging Sites
Information propagation in Microblogging SitesInformation propagation in Microblogging Sites
Information propagation in Microblogging SitesLuca Rossi
 
Fare sentiment analysis nel web sociale
Fare sentiment analysis nel web socialeFare sentiment analysis nel web sociale
Fare sentiment analysis nel web socialeLuca Rossi
 
Warm social metrics
Warm social metricsWarm social metrics
Warm social metricsLuca Rossi
 
Pictures of Friendfeed
Pictures of FriendfeedPictures of Friendfeed
Pictures of FriendfeedLuca Rossi
 
Information spreading in FriendFeed
Information spreading in FriendFeedInformation spreading in FriendFeed
Information spreading in FriendFeedLuca Rossi
 
Reti Socievoli
Reti SocievoliReti Socievoli
Reti SocievoliLuca Rossi
 
Social Media Italia
Social Media ItaliaSocial Media Italia
Social Media ItaliaLuca Rossi
 

More from Luca Rossi (20)

The Genesis of Crisis Communication: from Witnesses to Gatewatchers
The Genesis of Crisis Communication: from Witnesses to GatewatchersThe Genesis of Crisis Communication: from Witnesses to Gatewatchers
The Genesis of Crisis Communication: from Witnesses to Gatewatchers
 
Social Media in 2013 italian Elections
Social Media in 2013 italian Elections Social Media in 2013 italian Elections
Social Media in 2013 italian Elections
 
News Italia 2012
News Italia 2012News Italia 2012
News Italia 2012
 
Conversation Practices and Network Structure in Twitter
Conversation Practices and Network Structure in TwitterConversation Practices and Network Structure in Twitter
Conversation Practices and Network Structure in Twitter
 
Ecologia spettatorialità
Ecologia spettatorialitàEcologia spettatorialità
Ecologia spettatorialità
 
Una generazione di Nativi Digitali?
Una generazione di Nativi Digitali? Una generazione di Nativi Digitali?
Una generazione di Nativi Digitali?
 
EU Kids Online
EU Kids OnlineEU Kids Online
EU Kids Online
 
Partecipazione e Civic Engagement
Partecipazione e Civic EngagementPartecipazione e Civic Engagement
Partecipazione e Civic Engagement
 
A Foucaultian perspective on Web 2.0
A Foucaultian perspective on Web 2.0A Foucaultian perspective on Web 2.0
A Foucaultian perspective on Web 2.0
 
A Foucaultian perspective on web2.0
A Foucaultian perspective on web2.0A Foucaultian perspective on web2.0
A Foucaultian perspective on web2.0
 
Glee tube mediamutation
Glee tube mediamutationGlee tube mediamutation
Glee tube mediamutation
 
Gaming in SNS context
Gaming in SNS contextGaming in SNS context
Gaming in SNS context
 
Information propagation in Microblogging Sites
Information propagation in Microblogging SitesInformation propagation in Microblogging Sites
Information propagation in Microblogging Sites
 
Fare sentiment analysis nel web sociale
Fare sentiment analysis nel web socialeFare sentiment analysis nel web sociale
Fare sentiment analysis nel web sociale
 
Warm social metrics
Warm social metricsWarm social metrics
Warm social metrics
 
Pictures of Friendfeed
Pictures of FriendfeedPictures of Friendfeed
Pictures of Friendfeed
 
Gothenburg
GothenburgGothenburg
Gothenburg
 
Information spreading in FriendFeed
Information spreading in FriendFeedInformation spreading in FriendFeed
Information spreading in FriendFeed
 
Reti Socievoli
Reti SocievoliReti Socievoli
Reti Socievoli
 
Social Media Italia
Social Media ItaliaSocial Media Italia
Social Media Italia
 

Recently uploaded

IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaRafael Figueredo
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiorevaleriodinoia35
 
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.giuliofiorerm
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaStefano Lariccia
 
CON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla CresimaCON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla CresimaRafael Figueredo
 
Corso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativoCorso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativovaleriodinoia35
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaStefano Lariccia
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldivaleriodinoia35
 
Ticonzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaTiconzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaPierLuigi Albini
 
La seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieLa seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieVincenzoPantalena1
 

Recently uploaded (10)

IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiore
 
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
 
CON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla CresimaCON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla Cresima
 
Corso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativoCorso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativo
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldi
 
Ticonzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaTiconzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza cultura
 
La seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieLa seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medie
 

Extraction of Users' Personality from FriendFeed Italian Posts

  • 1. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Computer Science Comp. Linguistics Social Network Analysis Sociology Psychology Urbino sep.30.2010
  • 2. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Computer Science Comp. Linguistics Social Network Analysis Sociology Psychology Urbino sep.30.2010
  • 3. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results - extract information from text - development of ontologies - development of search engines ... - estrazione di informazioni da testi Comp. Linguistics - sviluppo di ontologie - sviluppo dei motori di ricerca ... Urbino sep.30.2010
  • 4. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results 1) collect text data and annotate it 2) build model of information in text 4) develop programs that extract info modelized 1) collezione e annotazione di dati testuali Comp. Linguistics 2) sviluppo di modelli dell'informazione nei testi 3) sviluppo di programmi per estrarre info Urbino sep.30.2010
  • 5. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results SNSs provide tons of data (text+users) Problems: 1) formalization of personality 2) annotation of data with personality judgements SNSs I Social Networks contengono un sacco di dati Problemi: 1) formalizzazione della personalità 2) annotazione dei dati con valutazioni della personalità Urbino sep.30.2010
  • 6. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results BIG 5: standard model used in Psychology [Norman 1963] Extraversion Emotional stability Psychology Agreebleness Conscientiousness Openness to experience BIG 5: modello standard in Psicologia [Norman 1963] Estroversione Stabilità emotiva Cooperatività Precisione Immaginatività Urbino sep.30.2010
  • 7. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Linguistic Features correlating with BIG 5 [Mairesse et al 2007] Tratti linguistici associati al BIG 5 [Mairesse et al 2007] Psychology Features Extrav. Emot. st. Agreebl. Consc. Openn. .:;- - - , + @user - + ! + + Links io mi mio + - - no non - + + - :( + - - 0-9 - ()[]{} - + :) + + di a da … + + ? - - + Swears - - + N° Words + Word freq - + - Urbino ... sep.30.2010
  • 8. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Example of personality (formalized) Esempio di personalità (formalizzata) Psychology yyonn yes yes balance no no extraversion emotivity agreebleness consciousness openness Urbino sep.30.2010
  • 9. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Here comes the hard part: - it is hard for human annotators to reach consensus on personality judgenments. Assumption: - one user has one and only one (complex) personality. So I can evaluate it comparing more posts of the same user. Qui viene il difficile: - il consenso sui giudizi della personalità dato dagli annotatori è difficile da ottenere Assunto: -un utente ha una e una sola personalità (complessa). Dunque Possiamovalutarla confrontando più post dello stesso utente. Urbino sep.30.2010
  • 10. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Personality recognizer: - input: 1) posts+users 2) list of all users - process: calculate features for each user - modelize: produce a personality model for each user Computer Science - evaluate: compare personality model with users' posts - output: 1) personality 2) accuracy 3) validity Riconoscitore della personalità -input: 1) post+utente 2) lista degli utenti - calcola i tratti per ciascun utente - produce un modello della personalità per ciascun utente - compara il modello con tutti i post dell'utente - output: 1) personalità 2) accuracy 3) validity Urbino sep.30.2010
  • 11. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Personality recognizer: - input: 1) posts+users 2) list of all users - process: calculate features for each user - modelize: produce a personality model for each user Computer Science - evaluate: compare personality model with users' posts - output: 1) personality 2) accuracy 3) validity Riconoscitore della personalità -input: 1) post+utente 2) lista degli utenti - calcola i tratti per ciascun utente - produce un modello della personalità per ciascun utente - compara il modello con tutti i post dell'utente Measure of the reliability - output: 1) personalità 2) accuracy 3) validity of the personality model tp=true positives Misura dell'affidabilità del tn=true negatives modello della personalità fp=false positives fn=false negatives Urbino sep.30.2010
  • 12. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Personality recognizer: - input: 1) posts+users 2) list of all users - process: calculate features for each user - modelize: produce a personality model for each user Computer Science - evaluate: compare personality model with users' posts - output: 1) personality 2) accuracy 3) validity Riconoscitore della personalità -input: 1) post+utente 2) lista degli utenti - calcola i tratti per ciascun utente - produce un modello della personalità per ciascun utente Measurecompara il modello con tutti i post dell'utente - of the variability of the user's personality - output: 1) personalità 2) accuracy 3) validity Misura della variabilità a=accuracy della personalità P=number of user's posts dell'utente Urbino sep.30.2010
  • 13. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Sample from FriendFeed dataset [Celli, Magnani, DiLascio, Pacelli, Rossi 2010] captured from http://friendfeed.com/public 748 Italian FriendFeed users, 1065 posts. 156 users have more than one post. Mean accuracy = .631 Mean validity = .729 Campione da FriendFeed [Celli, Magnani, DiLascio, Pacelli, Rossi 2010] http://friendfeed.com/public 748 utenti, 1065 posts, 156 utenti con più di un post. Accuracy media = .631 Validity media = .729 Urbino sep.30.2010
  • 14. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Rank Model Freq 1 ynyyn 16.6% 2 ynyon 12.1% 3 onoyn 7.6% 4 ooooo 7.6% 5 ynoyn 4.5% 6 yoooo 4.5% 7 ynooo 3.8% 8 ynoyo 3.8% 9 ynoon 3.2% 10 onyoo 3.2% ... (other) 39.1% Urbino sep.30.2010
  • 15. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Urbino sep.30.2010
  • 16. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Pearson's correlation test reveal that there is a strong (+0.79) and highly significant correlation (p-value = .0003) between the accuracy and personality model types Il test di correlazione (Pearson) rivela che c'è una forte correlazione tra alcuni tipi di personalità e l'accuratezza Urbino sep.30.2010
  • 17. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Pearson's correlation test reveal that there is a strong (+0.79) and highly significant correlation (p-value = .0003) between the accuracy and personality model types Il test di correlazione (Pearson) rivela che c'è una forte correlazione tra alcuni tipi di personalità e l'accuratezza Althought there is no correlation (p-value = .413) between personality and posting activity, once ltered out the long tail of users with sparse personality models, emerges that there is one personality type that produces more posts than others Anche se non c'è correlazione tra tra le personalità è il numero di post prodotti, presi solo i tipi di personalità più frequenti emerge che c'è una personalità che produce più delle altre Urbino sep.30.2010
  • 18. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Urbino sep.30.2010
  • 19. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results A manual look to the data reveals that there are some users (the ones with higher validity) that are focused on a topic, example: “styleandthecity”, “ultimora", “cronaca24" Uno sguardo più ravvicinato ai dati rivela che ci sono alcuni utenti con alta validity che parlano di un preciso argomento. Esempio: “styleandthecity”, “ultimora", “cronaca24" Urbino sep.30.2010
  • 20. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results CONCLUSIONS The work presented here is a first survey of personality in SNSs. In the future it would be interesting to run experiments following threads of users checking for their personality in order to study how personalities interact together, and what are the features that make a post interesting to a certain personality type (requires topc analysis). CONCLUSIONI Il lavoro presentato qui è solo un primo approccio allo studio della personalità nei Social Networks, nel futuro sarebbe interessante studiare l'andamento delle discussioni tra utenti monitorando la loro personalità e studiando come le personalità interagiscono tra loro, e quali contenuti sono interessanti per quali personalità (questo richiede analisi dei topic). Urbino sep.30.2010
  • 21. Intro Fabio Celli Personality E x tra c tio n o f U s ers ' P ers o na lity Evaluation fro m FriendFeed I ta lia n P o s ts Results Thank you!!! Urbino sep.30.2010