Sitemap.xml i robots.txt

227 views

Published on

Que és sitemap.xml i robots.txt?

Més manuals a: http://www.exabyteinformatica.com

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
227
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Sitemap.xml i robots.txt

  1. 1. Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware© Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/Sitemap.xml i robots.txtQuè és i per a què serveix el sitemap?El posicionament en buscadors dels llocs que dissenyem o que simplement estem administrantté una gran importància en un entorn tan competitiu com és la web avui en dia. Delposicionament web depèn moltes vegades l’èxit o el fracàs del site i per això hem de fer tot elpossible per informar als buscadors de la existència del nostre lloc web.Un sitemap.xml és un arxiu que conté una llista de les pàgines del lloc web junt amb algunainformació extra, tal com en quina freqüència la web canvia els seus continguts, quan va ser laúltima vegada que es va actualitzar i com d’important és respecte a la resta de pàgines delmateix site.El robots.txt és un arxiu que tots els buscadors han de llegir.Com construim el sitemap.xmlLa programació de l’arxiu sitemap.xml ha de seguir una sèrie de pautes especificades en elprotocol de sitemaps i després hem d’informar als buscadors de la existència del mateix,estigueu al cas dels següents passos:· Continguts obligatoris del sitemap.xml:El sitemap.xml es construeix fent servir etiquetes XML o tags incloses en un arxiu sempre ambcodificació UTF8. Els valors de dades (contraposats a les mateixes etiquetes) han de fer servircodis d’escapament per certs caràcters especials, tal com s’acostuma a fer en HTML. Veiem unexemple:Les cometes dobles “ s’han de substituir per “Els signes de major > i menor < per > i < respectivament.· Exemple senzill d’un sitemap.xml:Amb la primera etiqueta, definim la versió de XML que fem servir i la codificació en aquest cas(com en la majoria) de UTF8En la segona línia, fem referència al protocol d’ús: 0.9· Etiquetes que formen el sitemap.xml:<loc>http://www.xxx.xxxx….</loc> adreça de la pàgina que forma part del sitemap.xml<lastmod>Data</lastmod>, data de la última modificació.
  2. 2. Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware© Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/El format de la data és: ANY-MES-DIA (On ANY és de 4 xifres, el MES de 2 i el DIA de 2).Exemple: 2013-03-13<changefrec>Freqüència</changefrec>, Freqüència o cada quan es produeix el canvi.always, sempre per pàgines que canvien cada vegada que es mostren. Principalment lesdinàmiques.hourly, la freqüència de canvi es produeix cada hora.daily, la freqüència de canvi es produeix diàriament.weekly, la freqüència de canvi es produeix setmanalment.monthly, la freqüència de canvi es produeix mensualment.Yearly, la freqüència de canvi es produeix anualment.never, mai, típicament per a pàgines arxivades o històriques.<priority>Value</priority> La prioritat es refereix a la importància que té la pàgina que estroba en respecte de les demès que composen el site. És simplement una manera d’indicarprioritats relatives dins del site, sense efecte cap a l’exterior del mateix. El valor o value potprendre valors entre el 0 i el 1, considerarem el valor per defecte el 0.5Allotjament del sitemap.xmlL’arxiu sitemap.xml programat, s’allotja en el servidor com un arxiu més del site, amb lapeculiaritat de que pot contenir les adreces web contingudes en el mateix directori en que estroba o en d’altres continguts en ell mateix. Normalment, es posa a l’arrel del server com asitemap.xmlEnviament del sitemap.xml als serversA través de les eines per a webmasters de Google o el Yahoo site explorer, podemproporcionar directament la informació del nostre sitemap.xml als buscadors. Però també hopodem fer amb l’arxiu robots.txtPodeu trobar més informació relativa a robots.txt en la següent adreça web:http://www.sitemaps.org/protocol.php#submit_robots
  3. 3. Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware© Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/Programació de l’arxiu robots.txtL’arxiu robots.txt diu als motors de recerca a quines parts del teu site poden accedir perindexar i rastrejar. Aquest arxiu s’ha d’anomenar sempre robots.txt i ha d’estar situat a l’arreldel teu site.Un exemple seria:User-Agent: *Disallow: /privat/theme.cssDisallow: /confidencial/Disallow: /webadmin/Disallow: /sessions/Sitemap: http://www.exabyteinformatica.com/sitemap.xmlEn primer lloc amb el paràmetre User-Agent: * estem dient que tots els buscadors tenencabuda per rastrejar i indexar el lloc web (tal com indica el *), es pot posar també per exemplegoogle per indicar que només volem que sigui aquest buscador el que pugui indexar.La resta de paràmetres del disallow, indiquen quines carpetes o directoris tenen la indexacióprohibida o quins resultats NO volem que el buscador indexi.La línia del sitemap, indica als buscadors i robots crawlers, on està situat l’arxiu sitemap.xmlperquè el puguin llegir i a l’hora indexar.

×