La SEOmantica: misteri, potenzialità e sviluppi per il seo del futuro con la LDA.Tutto ciò che non avresti mai voluto sentirti dire sulla SEO, oggi è sempre più realtà.A cura di Michele De CapitaniPrima Posizione Srl - Via dell’Industria, 60 – 35129 Padova – PD – www.prima-posizione.it 1
SEOMantica“La SEO è come la Fisica, solo quando la governi comprendi che ti servirà ad ottenere solamente una nuova prospettiva dell’universo quantistico.”Michele De Capitani - 2010© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 2
SEOManticaEvoluzione della formule del ranking nella SEO:1996-2000 = CONTENUTI2000-2003 = CONTENUTI + LINK POPULARITY (LP)2003-2006 = (CONTENUTI + LP) / PENALTY (PNY)2006-2008 = (CONTENUTI + LP + TRUST (TR)) / PNY2008-2010 = [(CONTENUTI + LP + TR) x SPEED)] / PNY© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 3
SEOMantica1996-2000 = CONTENUTIFattori determinanti per il rankingTag Title
Meta tag (Keywords)
Ripetizioni e frequenze della 	keyword all’interno del tag body (keyword density/frequency)© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 4
SEOMantica2000-2003 = CONTENUTI + LINK POPULARITY (LP)Fattori determinanti per il rankingTag Title
Meta tag (Description)
Keyword density/frequency
Quantità dei backlinks ricevuti
Google PageRank
Anchor text dei backlinks© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 5
SEOMantica2003-2006 = (CONTENUTI + LP) / PENALTY (PNY)Fattori determinanti per il rankingTag Title
Meta tag (Description)
Keyword density/frequency
Quantità dei backlinks ricevuti
Google PageRank
Anchor text dei backlinks
Lotta allo SPAM: in particolare a Keyword Stuffing, Doorways e cloaking.
Utilizzo moderato di tutti i fattori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 6
SEOMantica2006-2008 = (CONTENUTI+LP+TRUST (TR)) / PNYFattori determinanti per il rankingTag Title
Meta tag (Description)
Keyword density/frequency
QuantitàQualità dei backlinks ricevuti
Google PageRank + TrustRank - BadRank
Anchor text dei backlinks - Boombing
Lotta allo SPAM: in particolare a Keyword Stuffing, Doorways e cloaking + filtraggio serrato sui duplicati.
Utilizzo moderato di tutti i fattori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 7
SEOMantica2008-2010 = [(CONTENUTI+LP+TR) x SPEED)]/PNYFattori determinanti per il rankingTag Title
Meta tag (Description solo duplicazione)
Qualità dei backlinks ricevuti
Google PageRank + TrustRank - BadRank
Anchor text dei backlinks - Boombing
Velocità e riduzione tempi di caricamento/accesso alle pagine web (Google Caffeine)
Lotta allo SPAM: in particolare a Keyword Stuffing, Doorways e cloaking + filtraggio serrato sui duplicati.
Utilizzo moderato di tutti i fattori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 8
SEOManticaTutte queste conoscenze e ogni esperienza acquisita fanno il bagaglio professionale di ciascun SEO…© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 9
SEOManticaMa…© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page    _10
SEOMantica…essendo esseri umani (sembra strano a dirsi ma lo siamo ) …© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 11
SEOManticatutte queste CREDENZE decuplicano le nostre PAURE!© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 12
SEOManticaQuali sono le nostre Paure?Breve, ma significativa classifica..© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 13
SEOManticaCERTEZZA“… ma sei proprio sicuro?!”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 14
SEOManticaLe MAPPE“… azz.. Sempre queste fra le pillole!!”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 15
SEOManticaSCRIVERE TESTI A MANO“… sti benedetti contenuti unici, originali e interessanti!!”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 16
SEOManticaLA FINE DELLA SEO“… Google mi odia e mi vuole mandare in pensione...”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 17
SEOManticaSTO SBAGLIANDO TUTTO“… Le mie tecniche sono obsolete ...”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 18
SEOManticaPotremmo andare avanti all’infinito, basta pensare un po’ ai nostri clienti.. © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 19
SEOManticaE’ risaputo, le Paure sono degli ostacoli al raggiungimento di nuovi traguardi© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 20
SEOManticaOra, qui in questo preciso momento, sei di fronte ad una scelta…© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 21
SEOMantica© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 22
SEOManticaE’ la tua ultima occasione, se rinunci non ne avrai altre:Pillola Azzurra – “Fine della storia, domani ti troverai alla tua scrivania e continuerai a fare SEO così come l’hai sempre fatta.”Pillola Rossa – “Resti nel paese delle meraviglie e vedrai quant’è profonda la tana del Bianconiglio…”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 23
SEOManticaRicorda, ti sto offrendo solo la verità!© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 24
SEOManticaMetti da parte le credenze e apri le porte a nuove prospettive© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 25
SEOMantica© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 26
SEOManticaIstantanea dei fattori che determinano il ranking:Valutazione interna ed esternaLINK e TRUST = calcolo quantitativo e qualitativo dei backlinks. Potenzialità Sviluppo: poche, perché già a buon livelloPENALTY = penalizzare significa giudicare, per giudicare occorre scrivere delle leggi e formare giudici imparziali. Potenzialità Sviluppo: buone, ma faticano a stare al passo coi tempi e l’esplosione esponenziale del web e delle tecnologie.© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 27
SEOManticaIstantanea dei fattori che determinano il ranking:Valutazione interna ed esternaCONTENUTI = basata su parametri matematici superficiali e soprattutto legati alla presenza o meno delle keywords in tag/punti particolari della pagina (tag title, h1, h2, etc.).Potenzialità Sviluppo: Enormi, perché attualmente la “macchina è stupida”, ma mediante l’applicazione di appositi modelli matematici si può trasformare da STUPID a  INTELLIGENT (IA – Intelligenza Artificiale) la comprensione dei contenuti, grazie alla semantica© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 28
SEOManticaInformation Retrieval (IR)L’analisi del contenuto in ambito di ricerca delle informazioni© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 29
SEOManticaLa “SEOMantica”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 30
SEOManticaCos’è la SEOMantica?Si tratta dell’utilizzo dell’analisi semantica (IR) ai fini della SEO e quindi del Ranking sui motori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 31
SEOManticaLe keywords di oggi legate alla SEOMantica:IR (Information Retrieval) = composta da 7 sottosezioni: 	Psicologia Cognitiva, Ontologia, Design, Linguistica, 	Semiotica, Informazione e Informatica
TF/IDF (Term Frequency / Inverse Document Frequency)= 	Frequenza del termine / Frequenza del documento inversa
LSA (Latent Semantic Analysis) = Analisi Semantica Latente
LSI (Latent Semantic Indexing) = Indicizzazione Semantica
PLSA (Probabilistic Latent Semantic Analysis) = 		Analisi Semantica Probabilistica LatenteLDA (Latent Dirichlet Analysis) = Analisi Latente di Dirichlet
HTMM (Hidden Topic Markov Models) = 		Modelli di Markov sugli argomenti nascosti © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 32
SEOManticaRicorda, ti sto offrendo solo la verità… © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 33
SEOManticaTF/IDF (Term Frequency / Inverse Document Frequency)PassatoKeyword Frequency = Nr. di ripetizioni di una keywords all’interno di un testoFormula:  Conteggio delle ripetizioniKeyword Density= Ripetizioni della Keywords rapportate al numero totale di parole presenti nel documento	Formula: Keyword Frenquency * 100 / Totale Keywords © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 34
SEOManticaTF/IDF (Term Frequency / Inverse Document Frequency)L’evoluzione TF/IDFTF/IDF = Indica la frequenza del termine ponderata in quanto è inversamente proporzionale alla frequenza del documento e misura quanto importate è una determinata parola in un documento e nel corpus di analisi totale, cioè in tutti i documenti nell’ambiente analizzato.Formula:  Frequenza del termine * Frequenza inversa del documento© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 35
SEOManticaTF/IDF (Term Frequency / Inverse Document Frequency)L’evoluzione TF/IDFFormula:  Frequenza del termine * Frequenza inversa documentoFrequenza del termine = Nr. ripetizioni/Tot. Parole DocumentoFrequenza inversa = log(tot. doc. / tot. doc. che contengono la key)x© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 36
SEOManticaTF/IDF (Term Frequency / Inverse Document Frequency)L’evoluzione TF/IDF - ESEMPIOTesto = parole totali 1.000
Keyword osservata = marketing
Occorrenze Keyword = 9Calcolo TF = 9/1.000 = 0,009Totale documenti del corpus = 10 Mld (indicizzate da Google)
Documenti con “Marketing” = 535 MilCalcolo IDF = log(10.000.000.000/535.000.000) = 1,27TF/IDF = TF * IDF = 0,009 * 1,27 = 0,01143© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 37
SEOManticaTF/IDF (Term Frequency / Inverse Document Frequency)TF/IDF Calculator Ver. 1.0Il mio tool per velocizzare il calcolo del TF/IDFLINKScaricalo gratis qui: http://lab.prima-posizione.it/seo-tools/tf-idf.zip © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 38
SEOManticaLSA (Latent Semantic Analysis)Tecnica di elaborazione del linguaggio naturale (semantica vettoriale basata su matrici matematiche)
Analizza le relazioni fra insiemi di documenti e le condizioni in essi contenuti
Produce un insieme di concetti  correlati ai documenti e ai termini utilizzati
La TF/IDF è un esempio reale di LSALIMITAZIONI e SVANTAGGILSA non rileva la polisemia dei termini (parole che hanno più significati: formazione, subito, etc.)
Le variabili non sono osservabili, quindi sono LATENTI© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 39
SEOManticaLSI (Latent Semantic Indexing)Non è altro che l’applicazione della LSA in ambito IR, cioè di recupero delle informazioniQueste analisi semantiche, hanno comunque grosse limitazioni legate appunto ai problemi della LSA, quindi per quanto riguarda la SEO, ho rivolto i miei studi agli altri modelli matematici di Analisi Semantica dei contenuti.Vediamole… © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page   1 40
SEOManticaPLSA (Probabilistic Latent Semantic Analysis)Tecnica statistica utilizzata per l’analisi di due metodologie e co-occorrenze di dati.

La SEOmantica: misteri, potenzialità e sviluppi per il seo del futuro con la LDA e HTMM

  • 1.
    La SEOmantica: misteri,potenzialità e sviluppi per il seo del futuro con la LDA.Tutto ciò che non avresti mai voluto sentirti dire sulla SEO, oggi è sempre più realtà.A cura di Michele De CapitaniPrima Posizione Srl - Via dell’Industria, 60 – 35129 Padova – PD – www.prima-posizione.it 1
  • 2.
    SEOMantica“La SEO ècome la Fisica, solo quando la governi comprendi che ti servirà ad ottenere solamente una nuova prospettiva dell’universo quantistico.”Michele De Capitani - 2010© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 2
  • 3.
    SEOManticaEvoluzione della formuledel ranking nella SEO:1996-2000 = CONTENUTI2000-2003 = CONTENUTI + LINK POPULARITY (LP)2003-2006 = (CONTENUTI + LP) / PENALTY (PNY)2006-2008 = (CONTENUTI + LP + TRUST (TR)) / PNY2008-2010 = [(CONTENUTI + LP + TR) x SPEED)] / PNY© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 3
  • 4.
    SEOMantica1996-2000 = CONTENUTIFattorideterminanti per il rankingTag Title
  • 5.
  • 6.
    Ripetizioni e frequenzedella keyword all’interno del tag body (keyword density/frequency)© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 4
  • 7.
    SEOMantica2000-2003 = CONTENUTI+ LINK POPULARITY (LP)Fattori determinanti per il rankingTag Title
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
    Anchor text deibacklinks© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 5
  • 13.
    SEOMantica2003-2006 = (CONTENUTI+ LP) / PENALTY (PNY)Fattori determinanti per il rankingTag Title
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
    Lotta allo SPAM:in particolare a Keyword Stuffing, Doorways e cloaking.
  • 20.
    Utilizzo moderato ditutti i fattori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 6
  • 21.
    SEOMantica2006-2008 = (CONTENUTI+LP+TRUST(TR)) / PNYFattori determinanti per il rankingTag Title
  • 22.
  • 23.
  • 24.
  • 25.
    Google PageRank +TrustRank - BadRank
  • 26.
    Anchor text deibacklinks - Boombing
  • 27.
    Lotta allo SPAM:in particolare a Keyword Stuffing, Doorways e cloaking + filtraggio serrato sui duplicati.
  • 28.
    Utilizzo moderato ditutti i fattori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 7
  • 29.
    SEOMantica2008-2010 = [(CONTENUTI+LP+TR)x SPEED)]/PNYFattori determinanti per il rankingTag Title
  • 30.
    Meta tag (Descriptionsolo duplicazione)
  • 31.
  • 32.
    Google PageRank +TrustRank - BadRank
  • 33.
    Anchor text deibacklinks - Boombing
  • 34.
    Velocità e riduzionetempi di caricamento/accesso alle pagine web (Google Caffeine)
  • 35.
    Lotta allo SPAM:in particolare a Keyword Stuffing, Doorways e cloaking + filtraggio serrato sui duplicati.
  • 36.
    Utilizzo moderato ditutti i fattori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 8
  • 37.
    SEOManticaTutte queste conoscenzee ogni esperienza acquisita fanno il bagaglio professionale di ciascun SEO…© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 9
  • 38.
    SEOManticaMa…© Prima PosizioneSrl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page _10
  • 39.
    SEOMantica…essendo esseri umani(sembra strano a dirsi ma lo siamo ) …© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 11
  • 40.
    SEOManticatutte queste CREDENZEdecuplicano le nostre PAURE!© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 12
  • 41.
    SEOManticaQuali sono lenostre Paure?Breve, ma significativa classifica..© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 13
  • 42.
    SEOManticaCERTEZZA“… ma seiproprio sicuro?!”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 14
  • 43.
    SEOManticaLe MAPPE“… azz..Sempre queste fra le pillole!!”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 15
  • 44.
    SEOManticaSCRIVERE TESTI AMANO“… sti benedetti contenuti unici, originali e interessanti!!”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 16
  • 45.
    SEOManticaLA FINE DELLASEO“… Google mi odia e mi vuole mandare in pensione...”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 17
  • 46.
    SEOManticaSTO SBAGLIANDO TUTTO“…Le mie tecniche sono obsolete ...”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 18
  • 47.
    SEOManticaPotremmo andare avantiall’infinito, basta pensare un po’ ai nostri clienti.. © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 19
  • 48.
    SEOManticaE’ risaputo, lePaure sono degli ostacoli al raggiungimento di nuovi traguardi© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 20
  • 49.
    SEOManticaOra, qui inquesto preciso momento, sei di fronte ad una scelta…© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 21
  • 50.
    SEOMantica© Prima PosizioneSrl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 22
  • 51.
    SEOManticaE’ la tuaultima occasione, se rinunci non ne avrai altre:Pillola Azzurra – “Fine della storia, domani ti troverai alla tua scrivania e continuerai a fare SEO così come l’hai sempre fatta.”Pillola Rossa – “Resti nel paese delle meraviglie e vedrai quant’è profonda la tana del Bianconiglio…”© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 23
  • 52.
    SEOManticaRicorda, ti stooffrendo solo la verità!© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 24
  • 53.
    SEOManticaMetti da partele credenze e apri le porte a nuove prospettive© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 25
  • 54.
    SEOMantica© Prima PosizioneSrl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 26
  • 55.
    SEOManticaIstantanea dei fattoriche determinano il ranking:Valutazione interna ed esternaLINK e TRUST = calcolo quantitativo e qualitativo dei backlinks. Potenzialità Sviluppo: poche, perché già a buon livelloPENALTY = penalizzare significa giudicare, per giudicare occorre scrivere delle leggi e formare giudici imparziali. Potenzialità Sviluppo: buone, ma faticano a stare al passo coi tempi e l’esplosione esponenziale del web e delle tecnologie.© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 27
  • 56.
    SEOManticaIstantanea dei fattoriche determinano il ranking:Valutazione interna ed esternaCONTENUTI = basata su parametri matematici superficiali e soprattutto legati alla presenza o meno delle keywords in tag/punti particolari della pagina (tag title, h1, h2, etc.).Potenzialità Sviluppo: Enormi, perché attualmente la “macchina è stupida”, ma mediante l’applicazione di appositi modelli matematici si può trasformare da STUPID a INTELLIGENT (IA – Intelligenza Artificiale) la comprensione dei contenuti, grazie alla semantica© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 28
  • 57.
    SEOManticaInformation Retrieval (IR)L’analisidel contenuto in ambito di ricerca delle informazioni© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 29
  • 58.
    SEOManticaLa “SEOMantica”© PrimaPosizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 30
  • 59.
    SEOManticaCos’è la SEOMantica?Sitratta dell’utilizzo dell’analisi semantica (IR) ai fini della SEO e quindi del Ranking sui motori© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 31
  • 60.
    SEOManticaLe keywords dioggi legate alla SEOMantica:IR (Information Retrieval) = composta da 7 sottosezioni: Psicologia Cognitiva, Ontologia, Design, Linguistica, Semiotica, Informazione e Informatica
  • 61.
    TF/IDF (Term Frequency/ Inverse Document Frequency)= Frequenza del termine / Frequenza del documento inversa
  • 62.
    LSA (Latent SemanticAnalysis) = Analisi Semantica Latente
  • 63.
    LSI (Latent SemanticIndexing) = Indicizzazione Semantica
  • 64.
    PLSA (Probabilistic LatentSemantic Analysis) = Analisi Semantica Probabilistica LatenteLDA (Latent Dirichlet Analysis) = Analisi Latente di Dirichlet
  • 65.
    HTMM (Hidden TopicMarkov Models) = Modelli di Markov sugli argomenti nascosti © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 32
  • 66.
    SEOManticaRicorda, ti stooffrendo solo la verità… © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 33
  • 67.
    SEOManticaTF/IDF (Term Frequency/ Inverse Document Frequency)PassatoKeyword Frequency = Nr. di ripetizioni di una keywords all’interno di un testoFormula: Conteggio delle ripetizioniKeyword Density= Ripetizioni della Keywords rapportate al numero totale di parole presenti nel documento Formula: Keyword Frenquency * 100 / Totale Keywords © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 34
  • 68.
    SEOManticaTF/IDF (Term Frequency/ Inverse Document Frequency)L’evoluzione TF/IDFTF/IDF = Indica la frequenza del termine ponderata in quanto è inversamente proporzionale alla frequenza del documento e misura quanto importate è una determinata parola in un documento e nel corpus di analisi totale, cioè in tutti i documenti nell’ambiente analizzato.Formula: Frequenza del termine * Frequenza inversa del documento© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 35
  • 69.
    SEOManticaTF/IDF (Term Frequency/ Inverse Document Frequency)L’evoluzione TF/IDFFormula: Frequenza del termine * Frequenza inversa documentoFrequenza del termine = Nr. ripetizioni/Tot. Parole DocumentoFrequenza inversa = log(tot. doc. / tot. doc. che contengono la key)x© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 36
  • 70.
    SEOManticaTF/IDF (Term Frequency/ Inverse Document Frequency)L’evoluzione TF/IDF - ESEMPIOTesto = parole totali 1.000
  • 71.
  • 72.
    Occorrenze Keyword =9Calcolo TF = 9/1.000 = 0,009Totale documenti del corpus = 10 Mld (indicizzate da Google)
  • 73.
    Documenti con “Marketing”= 535 MilCalcolo IDF = log(10.000.000.000/535.000.000) = 1,27TF/IDF = TF * IDF = 0,009 * 1,27 = 0,01143© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 37
  • 74.
    SEOManticaTF/IDF (Term Frequency/ Inverse Document Frequency)TF/IDF Calculator Ver. 1.0Il mio tool per velocizzare il calcolo del TF/IDFLINKScaricalo gratis qui: http://lab.prima-posizione.it/seo-tools/tf-idf.zip © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 38
  • 75.
    SEOManticaLSA (Latent SemanticAnalysis)Tecnica di elaborazione del linguaggio naturale (semantica vettoriale basata su matrici matematiche)
  • 76.
    Analizza le relazionifra insiemi di documenti e le condizioni in essi contenuti
  • 77.
    Produce un insiemedi concetti correlati ai documenti e ai termini utilizzati
  • 78.
    La TF/IDF èun esempio reale di LSALIMITAZIONI e SVANTAGGILSA non rileva la polisemia dei termini (parole che hanno più significati: formazione, subito, etc.)
  • 79.
    Le variabili nonsono osservabili, quindi sono LATENTI© Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 39
  • 80.
    SEOManticaLSI (Latent SemanticIndexing)Non è altro che l’applicazione della LSA in ambito IR, cioè di recupero delle informazioniQueste analisi semantiche, hanno comunque grosse limitazioni legate appunto ai problemi della LSA, quindi per quanto riguarda la SEO, ho rivolto i miei studi agli altri modelli matematici di Analisi Semantica dei contenuti.Vediamole… © Prima Posizione Srl – Vietata la copia e la distribuzione non autorizzataLa SEOMantica - Page 1 40
  • 81.
    SEOManticaPLSA (Probabilistic LatentSemantic Analysis)Tecnica statistica utilizzata per l’analisi di due metodologie e co-occorrenze di dati.