Le penalizzazioni di Google dalle più recenti alle classiche di mister.jinx del Forum GT
In questo intervento vedremo... <ul><ul><li>La ricetta di Google per preparare un buon sito web  </li></ul></ul><ul><ul><l...
La ricetta per preparare un buon sito  <ul><li>Per preparare un buon sito segui le   linee guida per webmaster  di Google ...
Design e contenuto <ul><ul><li>Progetta un sito con gerarchia e link testuali comprensibili. Ogni pagina dovrà essere ragg...
Zoom sul numero di link per pagina <ul><ul><li>Progetta un sito con  gerarchia  e link testuali comprensibili </li></ul></...
Ancora sul numero di link per pagina <ul><li>Nell' intervista di Randfish  (SEOMoz, 2007) Matt Cutts dice: </li></ul><ul><...
Un grosso menu è un grosso problema <ul><li>Riconosci il  Megamenu  cercando in SERP il tuo sito per chiavi specifiche, an...
Megamenu: come evitarlo <ul><ul><li>Riduci il numero di link presenti sul menu </li></ul></ul><ul><ul><li>Razionalizzi il ...
Link e Footer <ul><li>Esempio da Apple: </li></ul><ul><ul><li>Il footer è organizzato in sezioni </li></ul></ul><ul><ul><l...
Altro ingrediente: l'aspetto tecnico... <ul><li>Tra le linee guida dell'aspetto tecnico c'è questa frase:   </li></ul><ul>...
Il 3° ingrediente: la Qualità <ul><ul><li>Progetta le tue pagine per gli utenti, non per i motori di ricerca. Non ingannar...
Qualità: evita link a siti spam... <ul><ul><li>Lo  Spam  inficia la qualità delle SERP </li></ul></ul><ul><ul><li>Per migl...
Contro lo spam <ul><li>Tutti i brevetti sono Novembre 2006. </li></ul><ul><ul><li>Data iniziale </li></ul></ul><ul><ul><li...
Phrase Rank contro lo spam <ul><li>Dicembre 2006 </li></ul><ul><li>Tra i 6 brevetti del Phrase Rank di Ann Patterson c'è  ...
Qualità: evita i link a siti spam <ul><li>Come ti puoi accorgere se il tuo sito linka pagine spam ?  </li></ul><ul><li>Usi...
Uso di linkfromdomain da Live.com <ul><li>Ecco un esempio recente e concreto: </li></ul>
Ecco un esempio concreto <ul><li>Controllo da Live.com i link spammosi di chi-cerca-trova.net </li></ul>
La cache di Google (27/11/2008) <ul><li>La cache di Google del 21/11/2008 mostra ancora la pagina con il template incrimin...
Ecco i link spammosi nel template <ul><li>Dalla cache di Google si vede questo codice HTML: </li></ul>
Ma il sito com'è posizionato? <ul><ul><li>Il template è stato ripulito DOPO il 21/11/2008 </li></ul></ul><ul><ul><li>Il si...
Case History www.QuelliCheBravo.it
Link a siti spam/cattivi vicini <ul><li>Case History sul Forum GT del blog  www.QuelliCheBravo.it    </li></ul><ul><ul><li...
Riepilogando... <ul><li>Per i 2 casi visti (1 ban e 1 forte penalizzazione)... </li></ul><ul><ul><li>intervento al 100% de...
Brevetto contro i documenti fastidiosi <ul><ul><li>For instance, the documents may be identified according to their  offen...
Boilerplate: Butta via cosa non serve <ul><li>Il  brevetto boilerplate  riassume la relazione tra algoritmi diversi che pr...
Boilerplate: link e footer <ul><li>Casi analizzati: </li></ul><ul><ul><li>Portale incoming turistico in Google.co.uk e Goo...
Perché è difficile riciclare (con Google) <ul><li>Brin e Google non amano i duplicati già nel 1995 ne parla  di server ded...
Qual'è la direzione di Google? <ul><li>Dai brevetti si vede come Google negli anni sia sempre un motore di ricerca più  ra...
Evoluzione del filtro antiduplicazione <ul><li>Da Reattivo a Proattivo </li></ul><ul><li>Ieri   </li></ul><ul><ul><li>un &...
Duplicati, Similarità e Spiderizzazione <ul><li>&quot;The near-duplicate detection techniques have a number of important p...
Ma è sempre colpa nostra ? <ul><li>Quando un sito viene penalizzato è sempre colpa di un webmaster o SEO che ha esagerato ...
#6 Position Penalty <ul><li>Scoperta  qui  in WMW  </li></ul><ul><li>I siti in posizioni 1-2 scivolavano alla 6°. </li></u...
IFRAME fix <ul><li>Documentato da Matt Cutts (sempre lui eh!) il 1° dicembre 2008 in  Google Groups  su un blog penalizzat...
Ho finito <ul><li>:-) </li></ul>
Upcoming SlideShare
Loading in...5
×

Le Penalizzazioni Di Google

3,757

Published on

Slide dell'intervento al convegno GT 2008 sulle penalizzazioni di Google

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
3,757
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
64
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide
  • Le Penalizzazioni Di Google

    1. 1. Le penalizzazioni di Google dalle più recenti alle classiche di mister.jinx del Forum GT
    2. 2. In questo intervento vedremo... <ul><ul><li>La ricetta di Google per preparare un buon sito web  </li></ul></ul><ul><ul><li>Quando un grosso menu diventa un grosso problema </li></ul></ul><ul><ul><li>Consigli anti-ecologici: </li></ul></ul><ul><ul><ul><li>perché non è così facile &quot;riciclare&quot; ... </li></ul></ul></ul><ul><ul><ul><li>... e perché è utile buttare via cosa non serve. </li></ul></ul></ul><ul><ul><li>Anche le penalizzazioni &quot;scadono&quot; </li></ul></ul>
    3. 3. La ricetta per preparare un buon sito  <ul><li>Per preparare un buon sito segui le linee guida per webmaster  di Google </li></ul><ul><li>Ci sono  3 ingredienti principali : </li></ul><ul><ul><li>Design e contenuto </li></ul></ul><ul><ul><li>Aspetto tecnico </li></ul></ul><ul><ul><li>Qualità </li></ul></ul>
    4. 4. Design e contenuto <ul><ul><li>Progetta un sito con gerarchia e link testuali comprensibili. Ogni pagina dovrà essere raggiungibile da almeno un link testuale statico. </li></ul></ul><ul><ul><li>Offri agli utenti una mappa del sito con link che puntano alle sezioni più importanti. Se la mappa del sito contiene più di 100 link, suddividila in pagine distinte. </li></ul></ul><ul><ul><li>Crea un sito utile e ricco di informazioni, con pagine che descrivano in modo chiaro e accurato i contenuti del sito. </li></ul></ul><ul><ul><li>Pensa alle parole che gli utenti potrebbero digitare per cercare le tue pagine e assicurati che siano incluse nel tuo sito. </li></ul></ul><ul><ul><li>Prova ad utilizzare del testo anziché immagini per visualizzare nomi, contenuti o link importanti. Il crawler di Google non riconosce il testo contenuto nelle immagini. </li></ul></ul><ul><ul><li>Assicurati che i tag <title> e gli attributi ALT siano descrittivi e precisi. </li></ul></ul><ul><ul><li>Verifica l'eventuale presenza di link inaccessibili e la correttezza del codice HTML. </li></ul></ul><ul><ul><li>Se decidi di utilizzare pagine dinamiche (ad esempio, se l'URL contiene un carattere &quot;?&quot;) tieni presente che non tutti gli spider dei motori di ricerca eseguono la scansione sia delle pagine dinamiche che di quelle statiche. È utile prevedere un numero esiguo di parametri brevi. </li></ul></ul><ul><ul><li>Limita a un numero ragionevole (meno di 100) i link a una determinata pagina. </li></ul></ul>
    5. 5. Zoom sul numero di link per pagina <ul><ul><li>Progetta un sito con gerarchia e link testuali comprensibili </li></ul></ul><ul><ul><li>Offri agli utenti una mappa del sito con link che puntano alle sezioni più importanti. Se la mappa del sito contiene più di 100 link , suddividila in pagine distinte. </li></ul></ul><ul><ul><li>Limita a un numero ragionevole ( meno di 100 ) i link a una determinata pagina. </li></ul></ul>
    6. 6. Ancora sul numero di link per pagina <ul><li>Nell' intervista di Randfish  (SEOMoz, 2007) Matt Cutts dice: </li></ul><ul><ul><li>Pagine con PageRank elevato dovrebbero evitare di linkare altre 100 pagine; </li></ul></ul><ul><ul><li>Googlebot può arrivare: </li></ul></ul><ul><ul><ul><li>fino a 150-200 link con pagine a basso PageRank </li></ul></ul></ul><ul><ul><ul><li>a 200-300 link per pagine di elevata qualità; </li></ul></ul></ul><ul><ul><li>E' consigliato avere sottopagine in caso di pagine con oltre 100 link anche per come viene diluito il PageRank.  </li></ul></ul>
    7. 7. Un grosso menu è un grosso problema <ul><li>Riconosci il Megamenu cercando in SERP il tuo sito per chiavi specifiche, anche longtail. </li></ul><ul><li>Il mio sito in SERP compare con pagina giusta ma descrizione errata letta da un'altra pagina del sito. </li></ul><ul><li>Il Megamenu dipende dai troppi link sulle pagine. Ci sono  2 casi : </li></ul><ul><ul><li>menu verticale troppo esteso (tipico dei blog) oppure secondo tedster concentrato nel footer della pagina  </li></ul></ul><ul><ul><li>menu AJAX con molti div hidden </li></ul></ul>
    8. 8. Megamenu: come evitarlo <ul><ul><li>Riduci il numero di link presenti sul menu </li></ul></ul><ul><ul><li>Razionalizzi il menu pensando agli utenti </li></ul></ul><ul><li>Lo aveva detto Matt Cutts nella stessa intervista: </li></ul><ul><li>The &quot;keep the number of links to under 100&quot; is in the technical guideline section, not the quality guidelines section. That means we're not going to remove a page if you have 101 or 102 links on the page. [...]. Originally, Google only indexed the first 100 kilobytes or so of web documents, so keeping the number of links under 100 was a good way to ensure that all those links would be seen by Google. These days I believe we index deeper within documents, so that's less of an issue. But it is true that if users see 250 or 300 links on a page, that page is probably not as useful for them, so it's a good idea to break a large list of links down (e.g. by category, topic, alphabetically, or chronologically) into multiple pages so that your links don't overwhelm regular users. </li></ul>
    9. 9. Link e Footer <ul><li>Esempio da Apple: </li></ul><ul><ul><li>Il footer è organizzato in sezioni </li></ul></ul><ul><ul><li>Aiuta la navigazione e l'usabilità dell'utente </li></ul></ul><ul><ul><li>Unico problema: replica link già presenti nella pagina. </li></ul></ul>
    10. 10. Altro ingrediente: l'aspetto tecnico... <ul><li>Tra le linee guida dell'aspetto tecnico c'è questa frase:   </li></ul><ul><ul><li>&quot;Utilizza il file robots.txt per impedire la scansione delle pagine dei risultati di ricerca o delle pagine generate automaticamente che non sono di particolare interesse per gli utenti provenienti dai motori di ricerca&quot;. </li></ul></ul><ul><li>Inoltre ti ricordo che il tag nofollow: </li></ul><ul><ul><li>non fa scattare red flag per penalizzazioni; </li></ul></ul><ul><ul><li>non fa passare PageRank verso pagine non interessanti (es: pagine di login) </li></ul></ul>
    11. 11. Il 3° ingrediente: la Qualità <ul><ul><li>Progetta le tue pagine per gli utenti, non per i motori di ricerca. Non ingannare i tuoi utenti o sottoporre ai motori di ricerca contenuti diversi da quelli che mostri agli utenti, pratica comunemente nota come &quot;cloaking&quot; . </li></ul></ul><ul><ul><li>Evita i trucchi per migliorare il posizionamento nei motori di ricerca. Una buona regola generale è chiederti se ti sentiresti a tuo agio nello spiegare il tuo comportamento a un sito web concorrente. Un altro test utile consiste nel chiedersi se quanto stai facendo sarà d'aiuto ai tuoi utenti e che cosa faresti se i motori di ricerca non esistessero. </li></ul></ul><ul><ul><li>Non  partecipare a schemi di link  progettati per migliorare la posizione del tuo sito o il punteggio PageRank. In modo particolare, evita i link a siti di spam o &quot;cattivi vicini&quot; poiché ciò potrebbe influire negativamente sul tuo posizionamento. </li></ul></ul><ul><ul><li>Non utilizzare programmi non autorizzati per inviare le pagine, verificare il posizionamento e così via. Tali programmi sfruttano le risorse di elaborazione e vìolano i  Termini di servizio  di Google. Google sconsiglia l'utilizzo di prodotti come WebPosition Gold™ che inviano query automatiche o programmatiche a Google. </li></ul></ul>
    12. 12. Qualità: evita link a siti spam... <ul><ul><li>Lo  Spam  inficia la qualità delle SERP </li></ul></ul><ul><ul><li>Per migliorare la qualità delle SERP Google nel 2008  ha introdotto molte variazioni nell'algoritmo. </li></ul></ul>
    13. 13. Contro lo spam <ul><li>Tutti i brevetti sono Novembre 2006. </li></ul><ul><ul><li>Data iniziale </li></ul></ul><ul><ul><li>Aggiornamento contenuti </li></ul></ul><ul><ul><li>Traffico </li></ul></ul><ul><ul><li>Analisi delle query </li></ul></ul><ul><ul><li>Criteri dei link </li></ul></ul>
    14. 14. Phrase Rank contro lo spam <ul><li>Dicembre 2006 </li></ul><ul><li>Tra i 6 brevetti del Phrase Rank di Ann Patterson c'è &quot;Detecting Spam Documents&quot;  qui . </li></ul><ul><li>Aggiorna i precedenti in quanto si parla di ordinamento  </li></ul><ul><ul><li>per frasi; </li></ul></ul><ul><ul><li>per ancore;  </li></ul></ul><ul><ul><li>per intervalli di date </li></ul></ul><ul><li>Si usano le frasi per filtrare i documenti Spam e duplicati. </li></ul>
    15. 15. Qualità: evita i link a siti spam <ul><li>Come ti puoi accorgere se il tuo sito linka pagine spam ?  </li></ul><ul><li>Usi linkfromdomain in Live.com </li></ul><ul><li>linkfromdomain:nomedominio.com sex porn </li></ul><ul><li>linkfromdomain:nomedominio.com viagra cialis </li></ul>
    16. 16. Uso di linkfromdomain da Live.com <ul><li>Ecco un esempio recente e concreto: </li></ul>
    17. 17. Ecco un esempio concreto <ul><li>Controllo da Live.com i link spammosi di chi-cerca-trova.net </li></ul>
    18. 18. La cache di Google (27/11/2008) <ul><li>La cache di Google del 21/11/2008 mostra ancora la pagina con il template incriminato: </li></ul>
    19. 19. Ecco i link spammosi nel template <ul><li>Dalla cache di Google si vede questo codice HTML: </li></ul>
    20. 20. Ma il sito com'è posizionato? <ul><ul><li>Il template è stato ripulito DOPO il 21/11/2008 </li></ul></ul><ul><ul><li>Il sito da una verifica fatta il  27/11/2008 è posizionato in testa alle SERP: http://www.google.it/search?q=hotel+famiglia&pws=0   </li></ul></ul>
    21. 21. Case History www.QuelliCheBravo.it
    22. 22. Link a siti spam/cattivi vicini <ul><li>Case History sul Forum GT del blog www.QuelliCheBravo.it    </li></ul><ul><ul><li>Blog bannato da Google per link a cattive risorse (alcool, anfetamine) presenti nel footer </li></ul></ul><ul><ul><li>15/05/2008 : Segnalazione sul Forum </li></ul></ul><ul><ul><li>15/05/2008 : Ripulitura del template </li></ul></ul><ul><ul><li>16/05/2008 : Rientro in SERP </li></ul></ul>
    23. 23. Riepilogando... <ul><li>Per i 2 casi visti (1 ban e 1 forte penalizzazione)... </li></ul><ul><ul><li>intervento al 100% dei casi algoritmico </li></ul></ul><ul><ul><li>rapido rientro in SERP </li></ul></ul><ul><li>Conclusione: è attivo un algoritmo che filtra/penalizza i risultati GiorgioTave ha suggerito il BadRank. Matt Cutts parlava di TrustRank inteso come filtro antiphising e secondo me trova riscontro nel brevetto 2005 (2007) sul  rifiuto di documenti fastidiosi </li></ul>
    24. 24. Brevetto contro i documenti fastidiosi <ul><ul><li>For instance, the documents may be identified according to their offensiveness / appropriateness characteristics, associated keywords, associated site (e.g., a site explicitly or implicitly linked from the document, such as through an embedded hypertext link), status of associated site (e.g., whether a link in a document is broken and/or points to an invalid URL), flesh content (e.g., state of undress of human images), pornographic or other prurient content , adult content , drug- or alcohol-related content , children's content .  </li></ul></ul><ul><ul><li>The documents may also contain annoying actions such as flashing, strobing, repetitive movement, infinitely looping animation, use of streaming video and/or audio, open network connections, involve game playing, or other actions which the provider may wish to use for criteria for approving or rejecting a document .  </li></ul></ul><ul><ul><li>For example, although many of the embodiments disclosed herein have been described with reference to image ads, the principles herein are equally applicable to other documents, such as websites </li></ul></ul>
    25. 25. Boilerplate: Butta via cosa non serve <ul><li>Il brevetto boilerplate riassume la relazione tra algoritmi diversi che presi singolarmente non funzionerebbero così bene: </li></ul><ul><ul><li>identificazione di parti inutili o secondarie di pagine web come le ultime righe di copyright o i link nel footer che rimandano alla home </li></ul></ul><ul><ul><li>gestione dei duplicati più rigorosa </li></ul></ul><ul><ul><li>query personalizzate in base al profilo e al comportamento dell'utente </li></ul></ul><ul><ul><li>click-through sulle SERP </li></ul></ul>
    26. 26. Boilerplate: link e footer <ul><li>Casi analizzati: </li></ul><ul><ul><li>Portale incoming turistico in Google.co.uk e Google.de risale in SERP dalla 850° alla 4° posizione in meno di 48 ore. Il problema? I link nel footer quasi del tutto identici a quelli del menu principale di navigazione. </li></ul></ul><ul><ul><li>Varie segnalazioni sul Forum GT come quella discussa  qui : sito penalizzato per link sul footer del template di un sito. </li></ul></ul>
    27. 27. Perché è difficile riciclare (con Google) <ul><li>Brin e Google non amano i duplicati già nel 1995 ne parla  di server dedicati a contenere i contenuti duplicati in </li></ul><ul><ul><li>&quot;Copy detection mechanism for Digital Documents&quot; (S. Brin, J. Davis, H. Garcia-Molina, Stanford, 1995) </li></ul></ul><ul><li>I brevetti di Google filtrano da sempre i duplicati  </li></ul><ul><ul><li>2000 (2003) : duplicati per query specifiche   </li></ul></ul><ul><ul><li>2001 (2003) : individuare documenti near duplicates   </li></ul></ul><ul><ul><li>2001 (2007) : stimare la similarità   </li></ul></ul><ul><ul><li>2003 (2008) : duplicati e near duplicates </li></ul></ul><ul><ul><li>2007 (2008) : ricerche duplicate   </li></ul></ul>
    28. 28. Qual'è la direzione di Google? <ul><li>Dai brevetti si vede come Google negli anni sia sempre un motore di ricerca più raffinato e incisivo .  </li></ul><ul><li>I filtri antiduplicazione seguono l'evoluzione di Google: </li></ul><ul><ul><li>1999-2003 : ricerca per parole  </li></ul></ul><ul><ul><li>2004-2006 : ricerca per frasi  </li></ul></ul><ul><ul><li>2006-2008 : ricerca universale, personalizzata, 1-to-1 </li></ul></ul><ul><li>Il brevetto del 2007(2008) sulle ricerche duplicate  amplia il filtro antiduplicazione a video, audio e immagini. </li></ul>
    29. 29. Evoluzione del filtro antiduplicazione <ul><li>Da Reattivo a Proattivo </li></ul><ul><li>Ieri   </li></ul><ul><ul><li>un &quot;semplice&quot; filtro di Google </li></ul></ul><ul><ul><li>agisce a livello testuale </li></ul></ul><ul><ul><li>non mostra il risultato in SERP (finisce nell'indice supplementare) </li></ul></ul><ul><li>Oggi </li></ul><ul><ul><li>si parla di &quot;similarità&quot; </li></ul></ul><ul><ul><li>agisce (o dovrebbe agire) su più elementi  </li></ul></ul><ul><ul><li>risparmia banda in fase di indicizzazione </li></ul></ul>
    30. 30. Duplicati, Similarità e Spiderizzazione <ul><li>&quot;The near-duplicate detection techniques have a number of important practical applications. In the context of a search engine for example, these techniques can be used during a crawling operation to speed-up the crawling and to save bandwidth by not crawling near-duplicate Web pages or sites , as determined from documents uncovered in a previous crawl.  </li></ul><ul><li>Further, by reducing the number of Web pages or sites crawled, these techniques can be used to reduce storage requirements of a repository, and therefore, other downstream stored data structures.  </li></ul><ul><li>These techniques can instead be used later, in response to a query, in which case a user is not annoyed with near-duplicate search results. These techniques may also be used to &quot;fix&quot; broken links. That is, if a document (e.g., a Web page) doesn't exist (at a particular location or URL) anymore, a link to a near-duplicate page can be provided.&quot; </li></ul><ul><li>Link al brevetto  . </li></ul>
    31. 31. Ma è sempre colpa nostra ? <ul><li>Quando un sito viene penalizzato è sempre colpa di un webmaster o SEO che ha esagerato ? </li></ul><ul><li>Oppure ci sono altri casi ? </li></ul><ul><li>Ecco due casi in cui non dipende da noi: </li></ul><ul><ul><li>#6 position penalty </li></ul></ul><ul><ul><li>IFRAME bug </li></ul></ul>
    32. 32. #6 Position Penalty <ul><li>Scoperta  qui  in WMW  </li></ul><ul><li>I siti in posizioni 1-2 scivolavano alla 6°. </li></ul><ul><li>Caratteristiche: </li></ul><ul><ul><li>siti ottimamente posizionati da tanto tempo </li></ul></ul><ul><ul><li>discesa per chiavi specifiche a volte singola o plurali </li></ul></ul><ul><li>Confermata  da Matt Cutts: dopo aver corretto un elemento particolare sull'algoritmo è sparita. </li></ul>
    33. 33. IFRAME fix <ul><li>Documentato da Matt Cutts (sempre lui eh!) il 1° dicembre 2008 in Google Groups  su un blog penalizzato perché aveva una vasta area con IFRAME. </li></ul><ul><li>La penalizzazione è automatica! </li></ul><ul><li>&quot;Essentially, our search algorithm saw a large area on the blog that was due to an IFRAME included from another site and that looked spammy to our automatic classifier. I believe that this bug has been fixed now . We also added additional safety checks to the relevant system that would escalate to an  engineer if this site had the same issue in the future.&quot;  </li></ul>
    34. 34. Ho finito <ul><li>:-) </li></ul>
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×