Nova Spivack Semantic Web Talk, Entendiendo la web semánticaPresentation Transcript
Nova Spivack CEO & Founder Radar Networks Entendiendo La web semántica
Sobre esta charla
Entendiendo el sector semántico
Haciendo la web semántica más usable
Perspectivas futuras
Twine.com
Preguntas y respuestas
La gran oportunidad… Mejores búsquedas Anuncios más enfocados, mejores targets Colaboración más inteligente Integración más profunda Contenido enriquecido Mayor personalización El gráfico social sólo conecta personas Gente Grupos El gráfico semántico lo conecta todo… Emails Compañías Productos Servicios Páginas web Multimedia Documentos Eventos Proyectos Actividades Intereses Lugares
La tercera década de la web
Un periodo de tiempo, no una tecnología….
Enriquece la estructura de la web
Mejora la calidad de las búsquedas, la colaboración, la publicación, la publicidad
Hace las aplicaciones más integradas e inteligentes.
Transforma la Web desde servidora de archivos a base de datos
Las tecnologías semánticas van a jugar un rol clave
La inteligencia está en las conexiones Connections between people Connections between Information Email Social Networking Groupware Javascript Weblogs Databases File Systems HTTP Keyword Search USENET Wikis Websites Directory Portals 2010 - 2020 Web 1.0 2000 - 2010 1990 - 2000 PC Era 1980 - 1990 RSS Widgets PC’s 2020 - 2030 Office 2.0 XML RDF SPARQL AJAX FTP IRC SOAP Mashups File Servers Social Media Sharing Lightweight Collaboration ATOM Web 3.0 Web 4.0 Semantic Search Semantic Databases Distributed Search Intelligent personal agents Java SaaS Web 2.0 Flash OWL HTML SGML SQL Gopher P2P The Web The PC Windows MacOS SWRL OpenID BBS MMO’s VR Semantic Web Intelligent Web The Internet Social Web Web OS
Más allá de los límites de la búsqueda en base a keywords Amount of data Productivity of Search Databases 2010 - 2020 Web 1.0 2000 - 2010 1990 - 2000 PC Era 1980 - 1990 2020 - 2030 Web 3.0 Web 4.0 Web 2.0 The World Wide Web The Desktop Keyword search Natural language search Reasoning Tagging Semantic Search The Semantic Web The Intelligent Web Directories The Social Web Files & Folders
Web de alta resolución Coldplay Band Palo Alto City Jane Person IBM Company Dave Person Bob Person Design Team Group Stanford Alumnae Group IBM.com Web Site 123.JPG Photo Dave.com Weblog Sue Person Joe Person Dave.com RSS Feed Lives in Publisher of Friend of Depiction of Depiction of Member of Married to Member of Member of Member of Fan of Lives in Subscriber to Source of Author of Member of Employee of Fan of
Cinco aproximaciones a la web semántica
Tagging (etiquetado, marcadores sociales)
Estadísticas
Lingüísticas
Web semántica
Inteligencia artificial
Etiquetado
Pros
Para el usuario es fácil añadir y leer tags
Los tags son sólo cadenas, sin complicados algoritmos y ontologías.
No es necesario aprender ninguna tecnología
Contras
Para el usuario es fácil añadir y leer tags
Los tags son sólo cadenas, sin complicados algoritmos y ontologías.
No es necesario aprender ninguna tecnología
Technorati
Del.icio.us
Flickr
Wikipedia
Aproximación estadística
Pros:
Algoritmos matemáticos puros
Masivamente escalables
Independientes del lenguaje
Contras:
No hay comprensión del contenido
Es difícil hacer buenas consultas
Mejores para encontrar tópicos populares, no para encontrar una aguja en un pajar
No son buenos para datos estructurados
Google
Lucene (software para búsquedas)
Autonomía
La aproximación lingüística
Pros:
Entienden el lenguaje natural
Extraen conocimiento del texto
Los mejores para encontrar hechos particulares o relaciones.
Consultas más precisas
Contras:
Necesitan muchos recursos computacionales
De difícil escalabilidad
Bastante erráticos
Dependientes del lenguaje
Powerset
Hakia
Inxight, Attensity, y otros…
Enfoque semántico
Pros:
Consultas más precisas
Aplicaciones más inteligentes con menos trabajo
No requieren de tantos recursos computacionales
Compartir y enlazar datos entre aplicaciones.
Funciona en datos estructurados y desestructurados
Cons:
Ausencia de herramientas
Difíciles de escalar
¿Quien crea todos los metadatos?
Radar Networks (Twine)
DBpedia Project
Metaweb
Enfoque de la Inteligencia artificial
Pros:
Inteligencia en dominios restringidos
Contestar cuestiones de forma inteligente
Razonamiento y aprendizaje
Contras:
Computacionalmente intensivo
Difícil de escalar
Extremadamente difícil de programar
No funciona bien fuera de dominios restringidos
El entrenamiento es difícil, requiere mucho trabajo
Cycorp
Los acercamientos, comparados Crear software más inteligente Crear o hacer datos más inteligentes Estadístico Lingüistico Web semántica Inteligencia Artificial Tagging- Etiquetado
Dos formas de añadir “significado semántico”
“ De abajo-arriba” (Clásico)
Añadir metadatos semánticos a páginas y bases de datos en la web
Cada website se hace semántico
Hay que aprender RDF/OWL
“ De arriba-Abajo” (Contemporáneo)
Generar de forma automática metadatos semánticos para dominios verticales.
Crear servicios que proporcionen semantización como una capa sobre la web no semántica
Nadie tiene que aprender RDF/OWL
-- Alex Iskold
En la práctica lo que mejor funciona es un enfoque híbrido
Etiquetado
Web semántica
De arriba abajo
estadísticas
Lingüístico
De abajo arriba
Inteligencia artificial
La web semántica establece claves
La inteligencia está fuera de las aplicaciones, en los propios datos
Los datos se convierten en auto-descriptores; El significado de los datos se convierte en parte de los mismos
Las aplicaciones se convierten en más inteligentes con menos trabajo porque los datos conllevan conocimiento sobre que son y cómo usarlos.
Los datos pueden ser compartidos y enlazados más fácilmente
Web semántica = Base de datos abierta, como una capa sobre la web Perfiles de usuario Contenido web Registro de datos Apps & Servicios Anuncios Y listas Mapeado abierto de datos Registro abierto de datos Reglas abiertas Ontologías abiertas Interfaces consulta abierta
Los estándares abiertos en la web
RDF – Almacena los datos como “triples”
OWL – Define sistemas de conceptos denominados “ontologías”
Sparql – Consultas en RDF
SWRL – Define reglas
GRDDL – Transforma datos a RDF
RDF “Triples”
El sujeto, que es una referencia RDF URI o un nodo vacío
El predicado, que es una referencia RDF URI
El objeto, que es una referencia RDF URI , un literal o un nodo vacío
Los datos de la web semántica describen en sí mismos datos enlazados Data Record ID Field 1 Value Field 2 Value Field 3 Value Field 4 Value Definition Definition Definition Definition Definition Definition Definition Ontologías
RDBMS vs Triplestore S P O Person Table f_name jim nova chris lew ID 001 002 003 004 l_name wissner spivack jones tucker Colleagues Table SRC-ID 001 001 001 001 002 002 002 002 003 003 003 003 004 004 004 004 TGT-ID 001 002 003 004 001 002 003 004 001 002 003 004 001 002 003 004 Subject Predicate Object 001 isA Person 001 firstName Jim 001 lastName Wissner 001 hasColleague 002 002 isA Person 002 firstName Nova 002 lastName Spivack 002 hasColleague 003 003 isA Person 003 firstName Chris 003 lastName Jones 003 hasColleague 004 004 isA Person 004 firstName Lew 004 lastName Tucker
Mezclar bases de datos en RDF es fácil S P O S P O S P O
La web es la base de datos! Application A Application B Coldplay Band Palo Alto City Jane Person IBM Company Dave Person Bob Person Design Team Group Stanford Alumnae Group IBM.com Web Site 123.JPG Photo Dave.com Weblog Sue Person Joe Person Dave.com RSS Feed Lives in Publisher of Friend of Depiction of Depiction of Member of Married to Member of Member of Member of Fan of Lives in Subscriber to Source of Author of Member of Employee of Fan of
¿Son los RDF/OWL la única forma de expresar la semantización?
Otras formas:
Cadenas de etiquetas
Taxonomías y vocabularios controlados
Microformatos
Ad hoc [nombre, valor] pares
Notación semántica de metadatos alternativa
¿Una o varias web semánticas?
Ambas cosas.
La web semántica es una web de webs semánticas
Cada uno de nosotros tiene su propia web semántica…
¿Porque está tardando tanto?
El sueño de la web semántica está tardando en llegar
La visión original estuvo demasiado focalizada en la Inteligencia Artificial.
Las tecnologías y herramientas eran insuficientes.
La necesidad de datos abiertos no era lo suficientemente fuerte.
La bísqueda por palabras clave y el etiquetado no eran lo suficientemente buenos.
Ausencia de aplicaciones para el usuario final.
Muchas confusiones que aclarar.
Cruzando la brecha…
Comunicando la vision
El foco está en los datos abiertos, no en la I.A (Inteligencia artificial).
Progreso tecnológico
Los estándares y herramientas finalmente maduran
Las necesidades no eran lo suficientemente fuertes
La búsqueda por keywords y etiquetas no es ya tan productiva
Las aplicaciones necesitan formas mejores de compartir datos
Aplicaciones y contenidos
Varias empresas empiezan a exponer daots a la web semántica. Pronto habrá muchos datos.
Educar al mercado
Mostrar los beneficios de la web semántica al mercado
Futuro, perspectivas:
2007 – 2009
Inicio incipiente
Emergen algunas killer apps (aplicaciones)
Otras aplicaciones inician el proceso de integración
2010 – 2020
Adopción mayoritaria
Los contenidos semánticos son usados de forma mayoritaria en webs y herramientas
2020 +
El próximo gran ciclo: Razonamiento y Inteligencia Artificial.
La web inteligente
La web aprende y piensa de forma colectiva
El futuro de la plataforma….
1980’s -- El escritorio es la plataforma
1990’s -- El explorador es la plataforma
2000’s -- La web es la plataforma
2010’s -- El gráfico es la plataforma
2020’s -- La red es la plataforma
2030’s -- ¿El cuerpo es la plataforma…?
Una de las principales aplicaciones de la web semántica…
¿Qué es Twine?
Twine es un nuevo servicio de gestión compartida de información en la web
Trabaja con contenido, conocimiento, datos o cualquier otro tipo de información.
Diseñado para individuos y grupos que quieran organizar, buscar, compartir y ser informados de su información de una forma más efectiva.
Funcionamiento de Twine
Colección de información estructurada o desestructurada sobre el autor en Twine via email, Web o escritorio
Twine crea automáticamente conocimiento en web
Entiende los tags & links de forma automática
Busca de forma automática en la Web
Organiza de forma automática la información
Proporciona búsquedas semánticas, descubrimientos y registro de términos de interés
Ayuda a conectar con otra gente y grupos para hacer crecer el conocimiento compartiendo lugares con intereses comunes
Casos de uso
Individuales
Información colectiva y de autor para distintos intereses.
Compartir con colegas y amigos
Encontrar y descubrir cosas más relevantes
Groups & Teams
Gestionar contenido & conocimiento relativos a intereses comundes, objetivos o actividades.
Aumentar, contribuir a la inteligencia colectiva
Colaboracíon más productiva
Información de contacto
Visita www.twine.com para solicitar una invitación.
Email: [email_address]
Blog del autor: http://www.mindingtheplanet.net
Traducción al castellano: http://elcaparazon.net
Gracias!
Derechos
This presentation is licensed under the Creative Commons Attribution License.
Details: This work is licensed under the Creative Commons Attribution 3.0 Unported License. To view a copy of this license, visit http://creativecommons.org/licenses/by/3.0/ or send a letter to Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.
If you reproduce or redistribute in whole or in part, please give attribution to Nova Spivack, with a link to http://www.mindingtheplanet.net
Gracias! 4 years ago