SEO y Web Semántica en Congreso Web

13,123
-1

Published on

Conferencia sobre el SEO y la semántica en Congreso Web Zaragoza. Microformatos, microdatos, ontologías etc.

Published in: Technology
6 Comments
20 Likes
Statistics
Notes
No Downloads
Views
Total Views
13,123
On Slideshare
0
From Embeds
0
Number of Embeds
28
Actions
Shares
0
Downloads
188
Comments
6
Likes
20
Embeds 0
No embeds

No notes for slide

SEO y Web Semántica en Congreso Web

  1. 1. SE O MÁNTICA @lakil - SEO-20.com Lakil Essady
  2. 2. Modelo clásico de indexación
  3. 3. Funcionamiento actual de los buscadores Bases de datos de Google Índice inverso G g l e
  4. 4. P recio, entrada, incluyen,conferencias,talleres,total, suman, horas, contenidos impartidos,4,salas,paralelas,ponentes, importante, networking, 500,asistentes España.
  5. 5. La búsqueda en el índice es muy fácil usando booleanos OR y AND
  6. 6. <ul><li>Meter todas las palabras en un saco no permite tener en cuenta las relaciones semánticas y sintácticas entre ellas. </li></ul><ul><li>Para mejorar este sistema se está trabajando en 2 líneas: </li></ul><ul><li>Entender las relaciones entre palabras ( semántica ) </li></ul><ul><li>Identificar grupos de palabras ( sintaxis ) </li></ul>
  7. 7. ¿SEMÁNTICA?
  8. 10. Belén Esteban la caga con la cirugía estética Belén estaban ha intentado mejorar su cara y la ha cagado todavía más… su nariz parece de una adicta a la droga… http://www.exemple.com/answers/belen-esteban-321/ * La noticia es solo ejemplo y no es un contenido real
  9. 12. Resultados no relevantes
  10. 13. ¿Porqué ocurre esto?
  11. 14. Falta de ontologías una ontología define los términos que se usan para describir y representar un cierto dominio.
  12. 15. Objeto Sujeto Predicado Estructura de una Ontología El recurso que vayamos a describir Propiedad o relación del sujeto El Valor del sujeto o el otro objeto con el que se quiere establecer una relación
  13. 16. Congreso Web reunión charla Ponentes personas expertos 4 de junio SEO buscadores marketing día fecha tiempo ahora actualmente mes hoy Evento seo conferencia Esta semana Ejemplo de una ontología
  14. 17. Congreso Web reunión charla Ponentes personas expertos 4 de junio SEO buscadores marketing día fecha tiempo ahora actualmente mes hoy Evento seo conferencia Esta semana Ejemplo de una ontología El buscador entenderá las relaciones entre palabras, y devolverá un resultado relevante
  15. 18. Congreso SEO Profesional reunión charla Ponentes personas expertos Miguel López 4 de junio SEO buscadores marketing día fecha tiempo ahora actualmente mes hoy Evento conferencia Esta semana Ejemplo de una ontología SEO es marketing se lleva acabo en buscadores Conferencia se lleva a cabo en un evento Congreso Web es un evento Congreso Web habla de SEO semana período de tiempo de siete días consecutivos 4 de junio es hoy Hoy forma parte de esta semana Congreso Web es esta semana Conferencia seo esta semana = Congreso Web
  16. 19. El problema es que necesitamos muchísimas ontologías para que esto funcione.
  17. 20. Ontologías más usadas
  18. 21. <ul><li>FOAF (http://xmlns.com/foaf/0.1/): describiendo personas, las relaciones entre ellas y las cosas que crean y hacen. </li></ul><ul><li>Geospatial (http://www.w3.org/2003/01/geo/wgs84_pos#): describiendo la posición de los objetos. </li></ul><ul><li>DOAP (http://usefulinc.com/ns/doap#): Describiendo proyectos de software libre mediante RDF, y que así puedan ser procesados fácilmente de una manera automática. </li></ul><ul><li>GoodRelations es un vocabulario estándar para comercio electrónico. </li></ul><ul><li>RDFa </li></ul><ul><li>OWL </li></ul><ul><li>ETC… </li></ul>
  19. 22. RDF
  20. 23. RDFa <div> Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal: <a href=&quot;http://www.example.com&quot;> www.example.com </a>. Vivo en Alcobendas (Madrid) y trabajo de ingeniero en ACME S.A. </div> HTML sin RDF
  21. 24. RDFa HTML con RDFa <div xmlns:v=&quot; http://rdf.data-vocabulary.org/# &quot; typeof=&quot;v:Person&quot;> Mi nombre es <span property=&quot;v:name &quot;> Roberto Sánchez </span> , pero me llaman <span property=&quot;v:nickname&quot; > Rober </span>. Esta es mi página principal: <a href=&quot;http://www.example.com&quot; rel=&quot;v:url&quot; > www.example.com </a>. Vivo en Alcobendas (Madrid) y trabajo de <span property=&quot;v:title&quot; > ingeniero </span> en <span property=&quot;v:affiliation&quot; > ACME S.A. </span>. </div> Declarar el NameSpace que vaymos a usar
  22. 25. RDFa HTML con RDFa http://rdf.data-vocabulary.org/# <rdfs:Class rdf:ID=&quot; Person &quot;> <rdfs:comment>Represents a Person, living/dead/fictional.</rdfs:comment> <rdfs:subClassOf rdf:resource=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource&quot;/> </rdfs:Class> <rdf:Property rdf:ID=&quot; name &quot;> <rdfs:domain rdf:resource=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource&quot;/> </rdf:Property> <rdf:Property rdf:ID=&quot; nickname &quot;> <rdfs:domain rdf:resource=&quot;#Person&quot;/> </rdf:Property> <rdf:Property rdf:ID=&quot; photo &quot;> <rdfs:domain rdf:resource=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource&quot;/> </rdf:Property>
  23. 26. RDFa HTML con RDFa http://rdf.data-vocabulary.org/# Postal-code Adress Postal-code Street-adress region Country-name
  24. 27. RDFa HTML con RDFa http://rdf.data-vocabulary.org/# Para visualizar Datos de archivos RDFa como http://rdf.data-vocabulary.org/# Se puede usar RDF Gravity 1.0
  25. 29. HTML5 y los microdatos
  26. 31. Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal: www.example.com. Vivo en Alcobendas (Madrid) y trabajo de ingeniero en ACME S.A. Texto <div> Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal: <a href=&quot;http://www.example.com&quot;> www.example.com </a>. Vivo en Alcobendas (Madrid) y trabajo de ingeniero en ACME S.A. </div> HTML clásico
  27. 32. HTML enriquecido con Microdatos <div itemscope itemtype=&quot; http://data-vocabulary.org/Person &quot;> Mi nombre es <span itemprop=&quot;name&quot;> Roberto Sánchez </span> , pero me llaman <span itemprop=&quot;nickname&quot;> Rober </span> . Esta es mi página principal: <a href=&quot;http://www.example.com&quot; itemprop=&quot;url&quot;> www.example.com </a> . Vivo en Alcobendas (Madrid) y trabajo de <span itemprop=&quot;title&quot;> ingeniero </span> en <span itemprop=&quot;affiliation&quot;> ACME S.A. </span> . </div>
  28. 33. Microdatos http://data-vocabulary.org/Person
  29. 34. schema.org Una serie de microdatos esquemas que los Webmasters podrían utilizar para sus Páginas Web para mejorar su apariencia en buscadores, pactados por Google Yahoo y Bing
  30. 35. <ul><li>Painting </li></ul><ul><li>Photograph </li></ul><ul><li>Recipe </li></ul><ul><li>Review </li></ul><ul><li>Sculpture </li></ul><ul><li>TVEpisode </li></ul><ul><li>TVSeason </li></ul><ul><li>TVSeries </li></ul><ul><li>WebPage </li></ul><ul><li>WebPageElement </li></ul><ul><li>Event </li></ul><ul><li>Organization </li></ul><ul><li>Person </li></ul><ul><li>Place </li></ul><ul><li>Product </li></ul><ul><li>CreativeWork </li></ul><ul><li>Article </li></ul><ul><li>Blog </li></ul><ul><li>Book </li></ul><ul><li>ItemList </li></ul><ul><li>Map </li></ul><ul><li>MediaObject </li></ul><ul><li>Movie </li></ul><ul><li>MusicPlaylist </li></ul><ul><li>MusicRecording </li></ul>
  31. 42. Si le estructuramos tanto nuestros datos, será posible que Agentes inteligentes como Google accedan a nuestros datos, que las puedan compartir , y presentar de la forma (diseño) que ellos quieran.
  32. 43. Posible impacto comercial
  33. 44. Interpretación de estructuras sintácticas
  34. 45. <ul><li>La separación de las palabras usando métodos estadísticos no permite identificar expresiones hechas o nombres de identidades. </li></ul><ul><li>Tirar cohetes </li></ul><ul><li>Tocar los huevos </li></ul><ul><li>De puta madre </li></ul><ul><li>Dar la lata </li></ul>
  35. 46. Puta AND Madre Puta OR Madre Puta Madre – estupendo - genial
  36. 47. El gran incendio de Chicago del siglo XX
  37. 48. Para ello tiene que entender bien las sintagmas. <ul><li>Hay muchísimas posibles sintagmas: </li></ul><ul><li>El gran incendio </li></ul><ul><li>Chicago en el siglo XX </li></ul><ul><li>El grán incendio de chicago del siglo XX </li></ul>
  38. 50. El gran incendio de Chicago del siglo XX
  39. 51. El video del incendio subido a facebook
  40. 52. Para entender los núcleos de las sintagmas Google estaría usando ya los llamados N-gramas: N-gramas: se usan para procesar estadísticamente el lenguaje humano, y detectar las posibles sintagmas. Unigramas: unidades de una sola palabra Bigramas: unidades de dos palabras Trigramas: unidades de tres palabras …
  41. 54. En 2006 Google proceso una base de datos de 1.024.908.267.229 palabras en inglés (Un archivo comprimido de 24 GB) y se ha encontrado: Número de fichas: 1.024.908.267.229 Número de frases: 95.119.665.584 Número de unigramas: 13.588.391 Número de bigramas: 314.843.401 Número de trigramas: 977.069.902 Número de fourgrams: 1.313.818.354 Número de fivegrams: 1.176.470.663
  42. 55. Con la nueva infraestructura de Cafeine, probablemente esto ya esté en funcionamiento El gran Gran incendio Gran de chicago De chicago gran Chicago XX Siglo XX ….
  43. 56. Comprar los resultados en un texto con otros resultados en otros documentos y calcular la probabilidad de aparición de un término determinado: G-gramas Probabilidad de aparición El gran SI Gran incendio NO Gran de chicago SI De chicago gran NI Siglo XX SI … …
  44. 57. Con la nueva infraestructura de Cafeine , probablemente esto ya esté en funcionamiento
  45. 58. <ul><li>Implicaciones de los avances en la interpretación del lenguaje humano: </li></ul><ul><li>Usar siempre que podamos un etiquetado semántico </li></ul><ul><li>El orden en el que se escriben las palabras es importante, la presencia de las palabras clave de forma aislada no funcionará igual de bien. </li></ul><ul><li>Las preposiciones vuelven a ser importantes, los n-gramas los toman en cuenta para poder identificar el núcleo del sintagma. </li></ul><ul><li>La Relevancia supera a popularidad. </li></ul>
  46. 60. ¿PREGUNTAS? Twitter @lakil Blog SEO-20.com Gracias 
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×