Personalización de contenidos Web del dominio de egobierno mediante ontologías

869 views

Published on

La World Wide Web se ha convertido en un instrumento de uso cotidiano en nuestra sociedad,
comparable a otros medios tan importantes como la radio, la televisión o el teléfono, su aplicación
se ha extendido a diversos dominios como la educación , el gobierno y el comercio electrónico en
los que actualmente se advierte una sobrecarga de información que dificulta la navegación y uso
de los mismos, por este motivo los usuarios deben explorar espacios excesivamente densos,
convirtiendo la selección de información que les interesa en una tarea tediosa. Un mecanismo
para suplir esta tarea son los sistemas de recomendación los cuales seleccionan de forma
automática y personalizada los contenidos que mejor se adapten a las preferencias o necesidades
de cada usuario. En la literatura se han propuesto diversas estrategias de personalización que los
investigadores han adoptado de forma generalizada en sus trabajos.
En los últimos años ha surgido una prometedora línea de investigación bajo el nombre de Web
Semántica. Esta iniciativa propone describir los recursos Web mediante metadatos procesables
por las máquinas, para que éstas puedan razonar sobre su semántica e inferir relaciones entre
ellos, es decir, descubrir nuevo conocimiento a partir del ya conocido. Los procesos de
razonamiento semántico requieren que las colecciones de datos a los que acceden las máquinas
estén definidas y estructuradas de una forma adecuada como las ontologías, que son una
formalización consensuada y reutilizable en la que se identifican los conceptos y relaciones típicas
en un dominio de aplicación.
En este trabajo de investigación se presenta un sistema de personalización de contenidos Web
que hace uso de una mecanismo de razonamiento semántico a través de reglas de inferencia que
asocian a un tipo de usuario, extrayendo sus atributos de una ontología de perfiles, para
relacionarlos con los conceptos de una ontología de dominio, de tal manera que obtengan una
recomendación de contenidos de su interés.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
869
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Personalización de contenidos Web del dominio de egobierno mediante ontologías

  1. 1. cenidet Centro Nacional de Investigación y Desarrollo Tecnológico Departamento de Ciencias Computacionales TESIS DE MAESTRÍA EN CIENCIASPersonalización de contenidos Web del dominio de e- gobierno mediante ontologías presentada por Jenifer Torres Tapia Ing. en Sistemas Computacionales por el I. T. de Cuautla como requisito para la obtención del grado de: Maestría en Ciencias en Ciencias de la Computación Director de tesis: Dr. Juan Gabriel González Serna Co-Director de tesis: Dr. Guillermo Rodríguez Ortiz Jurado: Dr. Hugo Estrada Esquivel – Presidente Dr. Juan Gabriel González Serna – Secretario Dra. Alicia Martínez Rebollar – Vocal Cuernavaca, Morelos, México. 24 de Febrero de 2011
  2. 2. DEDICATORIA A mi Hijo: Ian Galindo Torres es lo mejor que me ha pasado, ha venido a este mundo para ser mifuente de inspiración para el término del trabajo de investigación, es sin duda mi referente para el presente y el futuro. A mi esposo: Juan Antonio Galindo García por su confianza, empeño, comprensión y amor. A mis padres:Ignacio Germán Torres Martínez y Andrea Tapia Núñez por su comprensión, paciencia y su ayuda en todos los momentos de la vida, me han dado todo lo que soy como persona, mis valores, principios y perseverancia. A mis hermanos: Ignacio Germán y Andrés Torres Tapia por su comprensión y apoyo incondicional. A mi tío: Zacarías Torres Martínez por su confianza y apoyo.
  3. 3. AGRADECIMIENTOS A CONACYT por su apoyo económico otorgado para la realización de este trabajode investigación. A DGEST por su apoyo económico para la finalización de este trabajo deinvestigación. Al CENIDET por brindarme la oportunidad para seguir en esta formación continua. A mi director de tesis, el Dr. Juan Gabriel González Serna por brindarme su consejo,confianza, comprensión y paciencia para terminar este trabajo de tesis. A mi codirector detesis, el Dr. Guillermo Rodríguez Ortiz por sus comentarios. A los revisores de este trabajo de investigación, la Dra. Alicia Martínez Rebollar y elDr. Hugo Estrada Esquivel, por su tiempo dedicado, observaciones, y comentarios paramejorar este trabajo de investigación. A mis compañeros del CENIDET: Elizabeth, Lizeth, Marino, Carlos, Cesar, Hugo yAdair por su tiempo, confianza y amistad. En especial a Cesar y Hugo porque siempreestuvieron ahí para apoyarme. A todos, mil gracias. Jenifer Torres Tapia
  4. 4. RESUMENLa World Wide Web se ha convertido en un instrumento de uso cotidiano en nuestra sociedad,comparable a otros medios tan importantes como la radio, la televisión o el teléfono, su aplicaciónse ha extendido a diversos dominios como la educación , el gobierno y el comercio electrónico enlos que actualmente se advierte una sobrecarga de información que dificulta la navegación y usode los mismos, por este motivo los usuarios deben explorar espacios excesivamente densos,convirtiendo la selección de información que les interesa en una tarea tediosa. Un mecanismopara suplir esta tarea son los sistemas de recomendación los cuales seleccionan de formaautomática y personalizada los contenidos que mejor se adapten a las preferencias o necesidadesde cada usuario. En la literatura se han propuesto diversas estrategias de personalización que losinvestigadores han adoptado de forma generalizada en sus trabajos.En los últimos años ha surgido una prometedora línea de investigación bajo el nombre de WebSemántica. Esta iniciativa propone describir los recursos Web mediante metadatos procesablespor las máquinas, para que éstas puedan razonar sobre su semántica e inferir relaciones entreellos, es decir, descubrir nuevo conocimiento a partir del ya conocido. Los procesos derazonamiento semántico requieren que las colecciones de datos a los que acceden las máquinasestén definidas y estructuradas de una forma adecuada como las ontologías, que son unaformalización consensuada y reutilizable en la que se identifican los conceptos y relaciones típicasen un dominio de aplicación.En este trabajo de investigación se presenta un sistema de personalización de contenidos Webque hace uso de una mecanismo de razonamiento semántico a través de reglas de inferencia queasocian a un tipo de usuario, extrayendo sus atributos de una ontología de perfiles, pararelacionarlos con los conceptos de una ontología de dominio, de tal manera que obtengan unarecomendación de contenidos de su interés.
  5. 5. ABSTRACTThe World Wide Web has become an everyday tool in our society, comparable to other majormedia such as radio, television or telephone, its application has been extended to various fieldssuch as education, government and e-commerce where currently the information overload makesit difficult to navigate and use them, is because of this that users should explore areas too dense,making the selection of information they are interested in a tedious task. A mechanism to meetthis task are recommendation systems which automatically select and customize the content thatbest suit the preferences and needs of each user. In the literature have proposed differentpersonalization strategies that researchers have widely adopted in their work.In recent years there has been a promising line of research under the name of the Semantic Web.This initiative aims to describe Web resources with machine-processable metadata, so that theycan reason about the semantics and infer relationships among them, that is, discovering newknowledge from already known. Semantic reasoning processes require that data collections beingaccessed by machines are defined and structured in an appropriate manner such as ontologies,which are consensual and reusable formalization which identifies the concepts and relationships ina domain of application.In this research we present a system for customizing Web content that uses a semantic reasoningmechanism through inference rules associated with a type of user, extracting attributes ofontology of profiles, to relate the concepts in domain ontology, so they get a recommendation ofcontent of interest.
  6. 6. CONTENIDOCapítulo 1 : INTRODUCCIÓN................................................................................................................ 1 1.1 INTRODUCCIÓN ........................................................................................................... 2 1.2 DESCRIPCIÓN DEL PROBLEMA ......................................................................................... 2 1.3 OBJETIVO ................................................................................................................... 3 1.4 JUSTIFICACIÓN ............................................................................................................. 3 1.5 ALCANCES Y LIMITACIONES ............................................................................................ 4 1.6 ORGANIZACIÓN DEL DOCUMENTO................................................................................... 4Capítulo 2 : MARCO TEÓRICO ............................................................................................................. 5 2.1 WEB SEMÁNTICA ......................................................................................................... 6 2.2 ONTOLOGÍAS .............................................................................................................. 6 2.3 OWL ......................................................................................................................... 7 2.4 PERSONALIZACIÓN WEB................................................................................................ 8 2.4.1 PERSONALIZACIÓN WEB SEMÁNTICA ........................................................................ 9Capítulo 3 : ESTADO DEL ARTE .......................................................................................................... 13 3.1 INTRODUCCIÓN ......................................................................................................... 14 3.2 PERSONALIZACIÓN SEMÁNTICA DE CONTENIDOS DE PORTALES WEB.................................... 14 3.3 SISTEMA DE PERSONALIZACIÓN WEB (SEWEP) .............................................................. 15 3.4 CREACIÓN DE ONTOLOGÍAS BASADAS EN PERFILES DE USUARIO .......................................... 16 3.5 PERSONALIZACIÓN DE NAVEGACIÓN WEB CON PERFILES PERSONALES ENRIQUECIDOS SEMÁNTICAMENTE .................................................................................................................... 17 3.6 RECUPERACIÓN DEL CONTENIDO DEL CONTEXTO PERSONALIZADO UTILIZANDO CONTENIDO ONTOLÓGICO............................................................................................................................ 17 3.7 RAZONAMIENTO SEMÁNTICO: UNA RUTA DE NUEVAS POSIBILIDADES DE PERSONALIZACIÓN .... 18 3.8 UN ENFOQUE DE LA WEB SEMÁNTICA PARA LA PERSONALIZACIÓN DEL CONTENIDO ............... 18 3.9 MODELADO MANEJADO POR ONTOLOGÍAS PARA LA PERSONALIZACIÓN DE CONTENIDO WEB .. 19 3.10 COMPARATIVA .......................................................................................................... 19Capítulo 4 : METODOLOGÍA PARA LA PERSONALIZACIÓN DE CONTENIDOS WEB............................ 23 4.1 INTRODUCCIÓN ......................................................................................................... 24 4.2 FASE 1: DESARROLLO DE ONTOLOGÍA DE E-GOBIERNO ...................................................... 25 i|Página
  7. 7. 4.2.1 PROCESO 1: SELECCIÓN DE PORTALES GUBERNAMENTALES......................................... 25 4.2.2 PROCESO 2: EVALUACIÓN DE PORTALES GUBERNAMENTALES...................................... 28 4.2.3 PROCESO 3: CREACIÓN DE ONTOLOGÍA DE GOBIERNO ............................................... 31 4.2.3.1 METODOLOGÍA PARA LA CREACIÓN DE ONTOLOGÍA DE E-GOBIERNO....................... 32 4.3 FASE 2: SELECCIÓN DE ATRIBUTOS DE ONTOLOGÍA DE USUARIO ......................................... 41 4.4 FASE 3: CATÁLOGO DE REGLAS DE INFERENCIA (SWRL).................................................... 43 4.4.1 REGLAS PARA EL PERFIL DE ADULTOS....................................................................... 44 4.4.2 REGLAS PARA EL PERFIL DE ADULTOS MAYORES......................................................... 45 4.4.3 REGLAS PARA EL PERFIL DE PERSONAS CON DISCAPACIDAD .......................................... 47 4.4.4 REGLAS PARA EL PERFIL DE JÓVENES ....................................................................... 48 4.4.5 REGLAS PARA EL PERFIL DE MUJERES ....................................................................... 50 4.4.6 REGLAS PARA EL PERFIL DE NIÑOS........................................................................... 51 4.4.7 REGLAS GENERALES ............................................................................................. 52 4.4.8 REGLAS EN LENGUAJE SWRL .................................................................................. 53 4.5 FASE 4: DESARROLLO DEL SISTEMA DE PERSONALIZACIÓN WEB ......................................... 62Capítulo 5 : ANÁLISIS, DISEÑO E IMPLEMENTACIÓN ........................................................................ 63 5.1 ARQUITECTURA DEL SISTEMA DE PERSONALIZACIÓN DE CONTENIDOS WEB........................... 64 5.2 ANÁLISIS .................................................................................................................. 66 5.2.1 DIAGRAMAS DE CASOS DE USO ............................................................................. 66 5.3 DISEÑO .................................................................................................................... 70 5.3.1 DIAGRAMA DE CLASES ......................................................................................... 70 5.4 CARACTERÍSTICAS DE IMPLEMENTACIÓN ........................................................................ 72 5.5 IMPLEMENTACIÓN...................................................................................................... 72Capítulo 6 : PRUEBAS ........................................................................................................................ 78 6.1 INTRODUCCIÓN ......................................................................................................... 79 6.2 RESULTADOS ............................................................................................................. 80 6.2.1 CASO DE ESTUDIO CE-SRC-A01 ............................................................................ 80 6.2.2 CASO DE ESTUDIO CE-SRC-A02 ............................................................................ 83 6.2.3 CASO DE ESTUDIO CE-SRC-AM01 ........................................................................ 85 6.2.4 CASO DE ESTUDIO CE-SRC-J01 ............................................................................. 87 6.2.5 CASO DE ESTUDIO CE-SRC-J02 ............................................................................. 89 ii | P á g i n a
  8. 8. 6.2.6 CASO DE ESTUDIO CE-SRC-M01 ........................................................................... 90 6.2.7 CASO DE ESTUDIO CE-SRC-M02 ........................................................................... 92 6.2.8 CASO DE ESTUDIO CE-SRC-N01............................................................................ 95 6.2.9 CASO DE ESTUDIO CE-SRC-N02............................................................................ 96 6.2.10 CASO DE ESTUDIO CE-SRC-D01 .......................................................................... 97 6.2.11 RESULTADO ...................................................................................................... 98Capítulo 7 : CONCLUSIONES ............................................................................................................ 100 7.1 CONCLUSIONES........................................................................................................ 101 7.2 APORTACIONES ....................................................................................................... 101 7.3 TRABAJOS FUTUROS ................................................................................................. 102REFERENCIAS ................................................................................................................................... 103ANEXO A .......................................................................................................................................... 105 A1: Herramientas para el análisis de datos. ....................................................................... 105 A2: Clases de ontología de e-gobierno con propiedad tipo dato....................................... 106 A3: Grafo jerárquico de ontología de e-gobierno. ............................................................. 107 A4: Relaciones no taxonómicas de ontología de e-gobierno. ............................................ 108 iii | P á g i n a
  9. 9. Capítulo 1 :INTRODUCCIÓN 1|Página
  10. 10. «INTRODUCCIÓNEn este capítulo se presenta una introducción, el problema que dio origen a la tesis, sus alcances ylimitaciones. Finalmente se describe la organización del documento.1.1 INTRODUCCIÓNUno de los servicios que más éxito ha tenido el Internet, es la World Wide Web (WWW, o "laWeb”), que se ha convertido en un instrumento cotidiano de comunicación en nuestra sociedad.La información está representada en forma de páginas Web que los usuarios pueden acceder yexplorar, y la forma de hacerlo depende en gran medida de lo que estén buscando. Debido a lacantidad de información contenida en la Web la ha llevado a evolucionar de ser una Web basadaen documentos a una Web basada en aplicaciones y servicios (Web 2.0) en donde los usuariosparticipan y deciden los contenidos actuales de la Web. Actualmente la nueva visión de la Web sedefine como “Web semántica” *Berners-Lee 2001], la cual propone describir los recursos de laWeb con representaciones procesables (es decir, entendibles) no sólo por personas, sino porprogramas, donde es más fácil localizar, compartir e integrar información y servicios para sacar unmayor partido de los recursos disponibles en la Web. El punto clave de la Web semántica son lasontologías que permiten crear, interpretar y comparar el contenido semántico de un recurso Web.Esto ha generado la necesidad, por parte de los proveedores de sitios Web, de hacer sitios másintuitivos y accesibles para los usuarios.Hoy en día los sitios Web definen grupos de usuarios, de tal manera que un usuario se identifiquecon algún grupo y obtenga información pertinente del sitio Web de acuerdo a las característicasdel grupo elegido, tal es el caso de los sitios Web existentes para e-gobierno en donde definengrupos de usuarios para canalizar la diversidad de información que manejan los sitios en esedominio, sin embargo la información suele ser general y no tener relaciones con otros grupos deinformación.Una solución a esta problemática es la personalización de contenidos Web, que pretendeequilibrar la sobrecarga de la información contenida en los sitios Web mediante la selección deinformación que sea pertinente y de interés para el usuario. Esto permite dar recomendaciones alos usuarios, ya sea por simples páginas, o por la construcción de nuevos mapas de contenidos desitio Web para los grupos de usuarios. Con la ayuda de las ontologías que nos permiten tener unamejor representación y organización de la información que facilite el mejor filtrado de contenidopara las recomendaciones de los usuarios.El objetivo de este proyecto de investigación es personalizar los contenidos Web en el dominio dee-gobierno de acuerdo a grupos de usuarios. La estrategia es desarrollar una ontología querepresente lo contenidos de sitios Web de gobierno y una ontología que represente los intereses ypreferencias de los usuarios, con el fin de perfilar al usuario en un grupo y ofrecerlerecomendaciones de acuerdo a su perfil.1.2 DESCRIPCIÓN DEL PROBLEMALa llamada Sociedad de la Información [Masuda 1968] es una consecuencia natural del rápidocrecimiento de Internet desde su nacimiento. Este contexto genera nuevos retos para los usuariosde integrarse de acuerdo a sus exigencias (tecnologías). En la lucha por alcanzar tales desafíos 2|Página
  11. 11. «INTRODUCCIÓNtropiezan con la gran cantidad de información que se ha extendido a diversos dominios, en esteescenario los usuarios deben explorar espacios densos de información para seleccionar lo queestán buscando lo que resulta ser una tarea tediosa. Un mecanismo para suplir esta tarea son lossistemas de recomendación los cuales seleccionan de forma automática y personalizada loscontenidos que mejor se adapten a las preferencias o necesidades de cada usuario. Por lo tanto,se ha generado la necesidad de mejorar los sitios Web de acuerdo a las necesidades de losusuarios.Los sitios Web existentes para e-gobierno enfrentan la problemática de ofrecer contenidos deinterés a los diferentes tipos de usuario que acceden a ellos. Aunque algunos sitios estánimplementando grupos definidos de usuarios para canalizar la diversidad de información quemanejan los sitios en este dominio, sin embargo, requieren que se aborden diferentes perfiles, esdecir, el poder identificar las diversas preferencias de los usuarios y mostrarles la información querequieran de acuerdo a sus necesidadesEn este trabajo de investigación se desarrolló un sistema de personalización de contenidos Webque permita encontrar reglas que puedan asociar a un tipo de usuario, extrayendo sus atributosde una ontología de perfiles, para asociarlos a los conceptos de una ontología de dominio, de talmanera que tenga una recomendación de contenidos de su interés.1.3 OBJETIVOPersonalizar el contenido de un sitio Web, a través de reglas de inferencia que definan lasrelaciones de un perfil de usuario con el contenido del sitio Web, mediante ontologías definidaspara el dominio de e-gobierno.1.4 JUSTIFICACIÓNLa necesidad de herramientas de personalización se ha manifestado claramente, desde hace yamucho tiempo, en numerosos dominios de aplicación, de ahí la gran diversidad de enfoques quehan ido surgiendo en el campo de los sistemas de recomendación en los últimos años[Adomavicius 2005] y [Demiriz 2001]. En los trabajos de [Tziviskou 2007], [Magdalini 2005] y[Ankolekar 2005] utilizan reglas de asociación que descubren acciones predecibles del usuariopara lo cual necesitan un historial de su navegación. Los trabajos [Trajkova 2004], [Vallet 2007],[Brambilla 2008] asignan una ponderación a los contenidos de mayor interés para los usuariospara posteriormente mostrarlos de mayor escala. En [Blanco 2008] utilizan asociacionessemánticas para descubrir relaciones ocultas entre los contenidos de interés del usuario. Sinembargo cada trabajo tiene diferente dominio y técnica de aplicación lo cual da por hecho que lapersonalización Web está relacionada con los requerimientos que se deseen cubrir, en general,cada enfoque es hecho a la medida de cada requerimiento específico de la aplicación en cuestión,entre estos enfoques podemos encontrar varias soluciones técnicas y esto es una evidencia de queno hay una metodología globalmente aceptada y genérica para permitir la personalización. Elcomún denominador de estas aplicaciones es que son orientadas hacia un enfoque basadas en elconocimiento. La mayoría de ellas explotan de alguna manera técnicas de representación deconocimiento formal, por ejemplo (ontologías y reglas) [Tsetos 2008]. Con este trabajo de 3|Página
  12. 12. «INTRODUCCIÓNinvestigación se propone la personalización de contenidos de un sitio Web en el dominio de e-gobierno.1.5 ALCANCES Y LIMITACIONESEn esta sección se presentan los alcances y limitaciones para el presente trabajo de investigación.Alcances: Definir los atributos del perfil de usuario de acuerdo a la estructura de un sitio Web. Analizar, extender e implementar la ontología de usuario de acuerdo a los atributos de mayor interés. Identificar relaciones entre ontología de dominio y de usuario Generar las reglas de asociación entre la ontología del dominio y de usuario. Personalizar los contenidos del sitio Web de acuerdo al perfil de usuario.Limitaciones: La personalización de contenidos Web está dirigida al dominio de e-gobierno. La personalización de contenidos Web está enfocada solo a los contenidos. La ejecución de reglas de inferencia se realiza con la máquina de inferencia Jess [Jess 2010].1.6 ORGANIZACIÓN DEL DOCUMENTOEl presente documento se encuentra organizado de la siguiente manera: Capítulo 2. Marco Teórico: en este capítulo se presentan los fundamentos teóricos de la presente investigación. Capítulo 3. Estado del arte: en este capítulo se presenta un resumen de los trabajos relacionados que sirven como punto de referencia y comparación con el presente trabajo de investigación. Capítulo 4. Metodología para la personalización de contenidos Web: en este capítulo se presenta la metodología para la personalización de contenidos de e-gobierno aplicando un proceso de razonamiento semántico. Capítulo 5. Análisis, Diseño e Implementación: en este capítulo se presenta la arquitectura del sistema de personalización de contenidos, sus detalles de análisis como los casos de uso y de diseño como el diagrama de clases, así también la implementación de la arquitectura. Capítulo 6. Pruebas: en este capítulo se presenta el plan de prueba para el prototipo de recomendación de contenidos web y los resultados obtenidos. Capítulo 7. Conclusiones: en este capítulo se presentan las conclusiones derivadas de este trabajo, las principales aportaciones y los posibles trabajos futuros que se pueden realizar a partir de esta investigación. 4|Página
  13. 13. Capítulo 2 :MARCO TEÓRICO 5|Página
  14. 14. «MARCO TEÓRICOEn este capítulo se presenta la teoría relacionada con el tema aplicado en este trabajo de tesis. Seinicia describiendo los conceptos relacionados con la investigación en el ámbito semántico y losconceptos generales que se utilizarán en el transcurso de este documento.2.1 WEB SEMÁNTICALa Web semántica [Berners-Lee 2001] propone superar las limitaciones de la Web actual mediantela introducción de descripciones explícitas del significado, la estructura interna y la estructuraglobal de los contenidos y servicios disponibles en la Web. Frente al crecimiento de información, yla ausencia de una organización clara de la Web actual, la Web semántica aboga por clasificar,dotar de estructura y anotar con semántica los contenidos en la Web.Para construir la Web semántica se necesita poder representar el conocimiento de forma que sealegible por las computadoras, esté consensuado, y sea reutilizable. Las ontologías proporcionan lavía para representar este conocimiento.La Web no se limita únicamente a proporcionar acceso a contenidos, también ofrece interacción yservicios (comprar un libro, reservar un vuelo, hacer una transferencia bancaria, simular unahipoteca). Los servicios Web semánticos son una línea importante de la Web semántica, quepropone describir no sólo información sino definir ontologías de funcionalidad y procedimientospara describir servicios Web: sus entradas y salidas, las condiciones necesarias para que se puedanejecutar, los efectos que producen, o los pasos a seguir cuando se trata de un servicio compuesto.Estas descripciones procesables por máquinas permitirían automatizar el descubrimiento, lacomposición, y la ejecución de servicios, así como la comunicación entre unos y otros [Castells2004].2.2 ONTOLOGÍASLa representación del conocimiento se hace para homogeneizar los datos y para hacerlosmanejables. Las ontologías expresan universos de objetos y conceptos lógicamente estructurados.Gruber define una ontología como una especificación formal de una conceptualización compartida[Gruber 1993]. Una ontología es una jerarquía de conceptos con atributos y relaciones, que defineuna terminología consensuada para definir redes semánticas de unidades de informacióninterrelacionadas. Una ontología proporciona un vocabulario de clases y relaciones para describirun dominio, poniendo énfasis en la compartición del conocimiento y el consenso en larepresentación de éste. Por ejemplo, una ontología sobre arte podría incluir clases como Pintor,Cuadro, Estilo o Museo, y relaciones como autor de un cuadro, pintores pertenecientes a un estiloartístico u obras localizadas en un museo.Continuando con Gruber las ontologías tienen los siguientes componentes que sirven pararepresentar el conocimiento de algún dominio. 6|Página
  15. 15. «MARCO TEÓRICO Conceptos: son las ideas básicas que se intentan formalizar. Los conceptos pueden ser clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc. Relaciones: representan la interacción y enlace entre los conceptos del dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva- de, conectado-a, etc. Funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden parecer funciones como categorizar-clase, asignar fecha, etc. Instancias: se utilizan para representar objetos determinados de un concepto. Axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Por ejemplo: “Si A y B son de la clase C, entonces A no es subclase de B”, “Para todo A que cumpla la condición C1, A es B”, etc.Una ontología es el resultado de seleccionar un dominio, y aplicar sobre el mismo un método paraobtener una representación formal de los conceptos que contiene y las relaciones que existenentre los mismos. Para poder explotar la Web semántica, se necesitan lenguajes de marcadoapropiados que representen el conocimiento de las ontologías. Existe un lenguaje de marcadopara publicar y compartir datos usando ontologías, el Lenguaje de Ontologías Web (OWL, “WebOntology Lenguaje”) *W3C OWL 2004+, el cual se describe en el siguiente punto.2.3 OWLEl Lenguaje de Ontologías Web (OWL) es el sucesor de DAML + OIL, como sus predecesores, elvocabulario OWL incluye un conjunto de elementos y atributos XML, con un significado biendefinido. Estos se utilizan para describir los términos de dominio y sus relaciones en una ontología.OWL está diseñado para ser usado en aplicaciones que necesitan procesar el contenido de lainformación en lugar de únicamente representar información para los humanos. OWL facilita unmejor mecanismo de interoperabilidad de contenido Web que los mecanismos admitidos por XML,RDF, y esquema RDF (RDF-S) proporcionando vocabulario adicional junto con una semánticaformal. OWL tiene tres sub-lenguajes, con un nivel de expresividad creciente: OWL Lite, OWL DL, yOWL Full [W3C OWL 2004].OWL es un lenguaje para describir datos con semántica en la Web y no como protocolo deintercambio de información. Sus funciones principales se resumen en: 1. Formaliza dominios mediante clases y propiedades. 2. Define individuos y propiedades entre individuos. 3. Permite un razonamiento formal (inferencia) basado en la semántica adoptada en la definición de clases propiedades e individuos.OWL proporciona tres lenguajes, cada uno con nivel de expresividad mayor que el anterior,diseñados para ser usados por comunidades específicas de desarrolladores y usuarios. 7|Página
  16. 16. «MARCO TEÓRICO 1. OWL Lite está diseñado para aquellos usuarios que necesitan principalmente una clasificación jerárquica y restricciones simples. Por ejemplo, a la vez que admite restricciones de cardinalidad, sólo permite establecer valores cardinales de 0 ó 1. OWL Lite proporciona una ruta rápida de migración para tesauros y otras taxonomías. OWL Lite tiene también una menor complejidad formal que OWL DL. 2. OWL DL está diseñado para aquellos usuarios que quieren la máxima expresividad conservando completitud computacional (se garantiza que todas las conclusiones sean computables). OWL DL incluye todas las construcciones del lenguaje de OWL, pero sólo pueden ser usados bajo ciertas restricciones (por ejemplo, mientras una clase puede ser una subclase de otras muchas clases, una clase no puede ser una instancia de otra). OWL DL es denominado de esta forma debido a su correspondencia con la lógica de descripción (Description Logics, en inglés), un campo de investigación que estudia la lógica que compone la base formal de OWL. 3. OWL Full está diseñado a usuarios que quieren máxima expresividad y libertad sintáctica de RDF. Por ejemplo, en OWL Full una clase puede ser considerada simultáneamente como una colección de clases individuales y como una clase individual propiamente dicha. OWL Full permite una ontología para aumentar el significado del vocabulario preestablecido (RDF u OWL). Es poco probable que cualquier software de razonamiento sea capaz de obtener un razonamiento completo para cada característica de OWL Full. Cada uno de estos sub-lenguajes es una extensión de su predecesor más simple.Los desarrolladores de ontologías que adoptan OWL deberían considerar cuál es el sublenguajeque mejor se adapta a sus necesidades. La elección entre OWL Lite y OWL DL depende de lasnecesidades de los usuarios sobre la expresividad de las construcciones, proporcionando OWL DLlas más expresivas. La elección entre OWL DL y OWL Full depende principalmente de lasnecesidades de los usuarios sobre los recursos de metamodelado del esquema RDF (por ejemplo,definir clases de clases, o definir propiedades de clases). Cuando se usa OWL Full en comparacióncon OWL DL, el soporte en el razonamiento es menos predecible, ya que no existen en estemomento implementaciones completas de OWL Full.2.4 PERSONALIZACIÓN WEBLa personalización Web es la habilidad de un sitio para mantener la atención de los usuarios a unnivel más alto de lo común y guiarlos de forma satisfactoria a obtener información útil ypertinente, de acuerdo con [Mombasher 2005].La personalización Web contempla el modelado deobjetos Web como páginas y tópicos, la categorización de esos objetos, la búsqueda decoincidencias entre estos, así como el conjunto de acciones que se deben tomar, para realizar lapersonalización. Puede ser basada en sistemas de reglas de decisión manuales, agentes de filtradobasados en el contenido o sistemas de filtrado colaborativo. La personalización Web consta de dosdefiniciones: 8|Página
  17. 17. «MARCO TEÓRICODefinición 1. Sistema Adaptable y Adaptativo.Un sistema es llamado "adaptable" cuando permite a un usuario ajustar el comportamiento de unsistema a sus preferencias y necesidades actuales. Por otra parte, un sistema “adaptativo”, esaquel que permite ajustar de manera autónoma las preferencias y necesidades actuales delusuario. El sistema “adaptativo” captura las necesidades del usuario (preferencias, intereses,experiencia, etc.) y automáticamente se adapta a estas necesidades inferidas [Baldoni 2005].Definición 2. Personalización.Es el proceso de presentar contenido y/o servicios a un usuario sobre la base de sus preferencias,intereses, necesidades y contexto en general. El propósito de este proceso es adaptar el contenidoy servicios a las características específicas del usuario con el fin de lograr un óptimo rendimiento(la definición de "rendimiento" es dependiente del dominio) [Tsetsos 2008].En consecuencia llamamos a una aplicación como personalizada o adaptativa al usuario, si estáconsciente del perfil del usuario, puede detectar el contexto del usuario y necesidades, y es capazde adaptarse a sí misma para satisfacer esas necesidades.2.4.1 PERSONALIZACIÓN WEB SEMÁNTICALa creciente demanda de aplicaciones por usuarios, ha generado muchos métodos parapersonalizar las aplicaciones, de acuerdo a sus requerimientos. En general, cada enfoque es hechoa la medida de cada requerimiento específico de la aplicación en cuestión, entre estos enfoquepodemos encontrar varias soluciones técnicas y esto es una evidencia de que no hay unametodología globalmente aceptada y genérica para permitir la personalización.El común denominador de estas aplicaciones es que son orientadas hacia un enfoque basadas enel conocimiento. La mayoría de ellas explotan de alguna manera técnicas de representación deconocimiento formal, por ejemplo (ontologías y reglas). En [Tsetsos 2008] se presenta unaarquitectura para la Web semántica personalizada. Los principales componentes de estaarquitectura se muestran en la Figura 2-1: aplicación de la lógica del negocio, modelos y contexto,mecanismos de detección del contexto, modulo de razonamiento.  Aplicación de la lógica de negocio:Se define como una aplicación que presenta los servicios o contenidos a cada uno de los usuariosde manera óptima, dado el contexto actual. Con óptimo nos referimos a la facilidad de uso, altorendimiento, comportamiento proactivo, recuperación efectiva del contenido, filtrado ypresentación. 9|Página
  18. 18. «MARCO TEÓRICO Figura 2-1: Arquitectura de una aplicación para la personalización Web semántica [Tsetsos 2008]  Modelos y ContextoSe ha puesto énfasis en el modelo basado en la personalización, es decir todos los conocimientospertinentes para la aplicación destino se describe a través de modelos. En el caso de lapersonalización Web Semántica, la manera común de representar estos modelos es el lenguaje deontologías de Web Semántica, el lenguaje de ontologías Web (OWL) y/o el Esquema de ResourceDescription Framework (RDFS). Los modelos (es decir, ontologías) pueden describir diversosaspectos de la arquitectura general del sistema. En la Figura 2-1, se identifican los cinco principalesmodelos que se espera encontrar en la personalización de aplicaciones Web Semánticas: 1. Modelo de aplicación: es un modelo que describe detalles específicos de aplicaciones, tales como solicitud de los estados, procesos, y su semántica. 2. Modelo de usuario: es un modelo obligatorio centrado en el humano. Puede describir varios aspectos del perfil del usuario tales como: información demográfica, situación actual, intereses y preferencias, es decir, especifica una clasificación de usuarios, de acuerdo a su perfil. 3. Modelo del entorno: es un modelo que especifica elementos periféricos del modelado, por ejemplo, el estado del entorno que rodea al usuario o aplicaciones externas que pueden afectar el comportamiento de la aplicación en cuestión. 4. Modelo de Actividad: es un modelo que describe todas las posibles interacciones del usuario con el sistema y otras actividades que pueden ser realizadas y proveen alguna retroalimentación para un futuro comportamiento de la aplicación. En cierto sentido, este modelo es una descripción formal de registros de actividad. Por ejemplo, las varias clases que las que el usuario es clasificado durante un periodo de tiempo puede ser información 10 | P á g i n a
  19. 19. «MARCO TEÓRICO útil para disparar acciones de adaptación. Las instancias de este modelo capturan conocimiento que puede incluir información accedida antes por el usuario, patrones temporales del uso de la aplicación etc. Este tipo de información es, generalmente obtenido por el sistema de una manera transparente, dicha información es una entrada común para mecanismos de aprendizaje de perfiles. 5. Modelo de Contenido: es un modelo que describe la semántica del contenido usado por la aplicación. Se puede suponer que en la mayoría de los casos el contenido no cambia dinámicamente.  Mecanismos de detección de contextoEn este módulo se realiza la actualización del contexto de usuario, utilizando dos mecanismos: unsensor de contexto y una traducción del contexto. El sensor de contexto se encarga de obtenerdatos de acuerdo a la ubicación de usuario, temperatura ambiental, recabar información delcontexto en el que se encuentre el usuario. La traducción del contexto, realiza la transformaciónde los datos de contexto a rutinas para que sean procesadas por la aplicación correspondiente.  Módulo de RazonamientoEste módulo se encarga del mecanismo de razonamiento para la adaptación de personalización.Como entrada recibe reglas, que son la especificación de los modelos, que describen todo elcontexto de la aplicación para su correspondiente personalización.Como resultado se obtiene las decisiones y acciones que adoptará la aplicación para adaptarse alcontexto de usuario. Dependiendo de la representación, el conocimiento técnico y la expresividadque se utilicen para los modelos y la adaptación de políticas, este módulo podrá realizar diversostipos de inferencia.  MODELADO DE INGENIERIA DE USUARIO: DEFINICIONESEl modelo de usuario juega un papel clave en todos los sistemas de personalización. Obviamente,dada la actual tecnología de la Web semántica, la ontología es la "Herramienta" para expresar estemodelo. El modelo de usuario tiene 2 aspectos de conocimiento: 1. El aspecto funcional: divide el modelo de ingeniería de usuario en categorías basadas en su uso real en la solicitud del usuario. Las categorías típicas son: Demografía usuario: este tipo de categoría recoge información general del usuario. Esta información del usuario puede incluir: nombre, edad, dirección de correo electrónico, etc., normalmente, previsto por el usuario. Preferencias del usuario: en esta categoría un usuario puede tener varias preferencias en relación con su interacción con un sistema. Esta información ayuda al sistema para optimizarlo y así proporcionar el acceso, la presentación y la recuperación de la 11 | P á g i n a
  20. 20. «MARCO TEÓRICO información para el usuario. Tales preferencias pueden incluir los intereses del usuario o sus necesidades de información. Capacidades de usuario: en esta categoría un usuario también puede tener las capacidades individuales o discapacidad que debería afectar la forma en que el sistema funciona. Por ejemplo, en un escenario de navegación peatonal, considerar un usuario en un edificio público que utiliza una silla de ruedas. Por otra parte, asumir que el edificio ofrece un servicio de navegación a los usuarios con teléfonos inteligentes. Obviamente, el servicio de navegación debe excluir todas las rutas que contienen las escaleras, debido a la discapacidad del usuario para acceder a ellas.2. El aspecto estructural: divide al modelo de usuario en categorías de acuerdo a [Cali 2004]: Un conjunto de alto nivel, clases de usuario (UC): la UC es utilizada para clasificación de los usuarios con respecto al dominio de aplicación. Un conjunto de clases que representan las características del perfil (FC): estas clases constituyen el super conjunto de los intereses, capacidades y preferencias que un usuario pueda tener. Las características reales que se aplican a un usuario están representadas como instancias de las respectivas FC. Un conjunto de relaciones (o función de las propiedades) (FP), asignan funciones (FC casos) a usuarios (UC casos): según el lenguaje OWL, se trata de relaciones binarias y se especifica como objeto-propiedad. Un conjunto de atributos, A, que asignan valores literales a las características del usuario: una característica típica podría ser el nombre, la edad, el sexo, etc., según el lenguaje OWL, estos son como el modelo de relaciones binarias y se especifican como dato-propiedad. 12 | P á g i n a
  21. 21. Capítulo 3 :ESTADO DEL ARTE 13 | P á g i n a
  22. 22. «ESTADO DEL ARTEEn este capítulo se revisan las propuestas definidas en la literatura en el campo de los sistemas depersonalización de contenidos Web. Dicha revisión incluye el tipo de modelo en cómo presentanlos contenidos Web, el modelado de usuario para crear sus perfiles con las características de suspreferencias y los mecanismos para adaptar las recomendaciones de contenidos de acuerdo alperfil de usuario, al final del capítulo se muestra una comparativa de los trabajos analizados.3.1 INTRODUCCIÓNCon el fin de conocer el contexto de la investigación se presentan los ochos trabajos relacionadoscon los puntos de revisión considerados (modelo del sitio Web, modelo de usuario y técnica depersonalización). Los ochos trabajos relacionados: 1) Personalización semántica de contenidosWeb, 2) Personalización Web, integrando contenido semántico y patrones de navegación, 3)Improvisando ontologías basadas en perfiles de usuario, 4) Personalización de navegación Webcon perfiles personales enriquecidos semánticamente, 5) Recuperación del contenido del contextopersonalizado utilizando contenido ontológico, 6) Razonamiento semántico: una ruta a nuevasposibilidades de personalización, 7) Un enfoque de la Web semántica para la personalización delcontenido y 8) Modelado manejado por ontologías para la personalización de contenido Web sedescriben a continuación.3.2 PERSONALIZACIÓN SEMÁNTICA DE CONTENIDOS DE PORTALES WEBEl modelo conceptual propuesto en [Tziviskou 2007] para la recomendación de contenidos Web sebasa en un algoritmo que asocia pesos (cantidad) a los contenidos visitados el usuario.Posteriormente realizar un consenso de los contenidos más visitados y así mostrarle los de mayorinterés.El modelo conceptual se basa en las declaraciones explícitas e implícitas de las preferencias delusuario y en un proceso iterativo de análisis de su historial de navegación. Para la realización delmodelo conceptual se enfocaron en tres partes: 1. Ontología del perfil de usuario: se identifican datos y la navegación de los usuarios, para crear objetos que categoricen sus preferencias, mientras un usuario visite más el sitio Web, la ontología se poblará de más objetos que describan más específicamente al usuario. 2. Ontología del dominio: se utiliza WebML que es una metodología para la creación de aplicaciones Web, con la cual se extrae el esquema de datos del sitio Web para encontrar las categorías de los contenidos presentados en el sitio y crear la ontología del dominio, como se muestra en la Figura 3-1. 14 | P á g i n a
  23. 23. «ESTADO DEL ARTE Figura 3-1: Modelo de datos ontológico para un portal Web [Tziviskou 2007]. 3. Razonamiento de personalización: crearon un algoritmo para la extracción de los objetos representados en la ontología del dominio para darle las recomendaciones necesarias al usuario. El algoritmo consta de 3 pasos: Primer paso: el algoritmo especifica las relaciones y los correspondientes pesos asignados para la extracción de objetos similares en la página. Segundo paso: el algoritmo descarta los objetos recuperados que no están relacionados (de manera directa) o que no están contenidas en los intereses del usuario. Tercer paso: el algoritmo califica los objetos recuperados calculando el total de peso de las relaciones que las conectan a los intereses del usuario.3.3 SISTEMA DE PERSONALIZACIÓN WEB (SEWEP)La herramienta propuesta en [Magdalini 2005] utiliza reglas de asociación para relacionar lanavegación del usuario con los contenidos representados en una taxonomía del sitio Web. Laherramienta nombrada SeWep consta de seis módulos: 1. Recuperación de Contenido: este módulo se encarga de rastrear el sitio Web, extrae el texto de una variedad de formatos de archivo (html, doc, php, ppt, pdf, flash, etc.) y las almacena en su base de datos. 2. Extracción de palabras clave: este módulo se encarga de extraer los contenidos a los que haya accedido el usuario, para encontrar un conjunto de palabras prioritarias que identificarán el tipo de contenido al cual el usuario accedió, estas palabras son almacenadas en una base de datos con la frecuencia que fueron solicitadas. 3. Categorización de palabras claves: en este módulo las palabras claves extraídas son clasificadas en categorías de acuerdo a un dominio específico (taxonomía). El sistema utiliza un tesauro (WordNet) para realizar la categorización. Ponderado estas categorías se almacenan en archivos XML y / o en la base de datos. 4. Administración de sesiones: en este módulo se extrae la navegación de los usuarios, el sistema hace uso de la sesionización sobre la base de diferentes direcciones IP y un usuario definido en el tiempo límite entre los períodos de sesiones. Las distintas sesiones se almacenan en archivos XML y / o tablas de base de datos. 15 | P á g i n a
  24. 24. «ESTADO DEL ARTE 5. Reglas de la Asociación: en este módulo se extrae las categorías de mayor frecuencia que un usuario accedió, creando reglas de asociación, es decir, relaciona los criterios que al usuario le interesaron para posteriormente mostrarle esos criterios. Los resultados se almacenan en archivos de texto para su posterior análisis o para su utilización en el motor de recomendación. 6. Recomendaciones: este módulo relaciona las reglas de asociación con las categorías de palabras claves, de tal manera que genera recomendaciones dinámicas para el visitante de la Web.3.4 CREACIÓN DE ONTOLOGÍAS BASADAS EN PERFILES DE USUARIOLa metodología propuesta en [Trajkova 2004] propone la generación automática de perfiles deusuario basados en ontologías, se basa en la captura del comportamiento de un usuario medianteel análisis de su exploración Web habitual. Lo cual, alimenta una estructura jerárquicaproponiendo como niveles más altos a los puntos con más interés y viceversa, a partir de uncálculo predefinido de ponderaciones, tomando en cuenta que se utilizará el perfil cuando seconsidere lo suficientemente maduro para ello.Para construir el perfil usan como entrada las páginas que ha visitado el usuario, toman la cantidadmínima de 5 segundos que haya tardado el usuario en las páginas. El sistema clasifica cada páginaWeb de acuerdo a un concepto definido en la ontología. El proceso de construcción del perfilconsta de 3 fases: 1) Clasificador de entrenamiento: Esta fase se encarga de clasificar páginas que están relacionadas a un concepto particular para crear un superdocumento, uno por cada concepto relevante que identifique los contenidos del sitio Web. 2) Recogedor de datos de usuario: Esta fase almacena en un archivo de registro las URL´s, fecha y hora de visita, tamaño de la página, por un servidor Proxy. Utilizan un programa que extrae las URL para cada usuario y los filtros para eliminar los documentos que se consideran demasiado cortos para tener cualquier contenido menos de un KB) y aquellos sobre los que el usuario está poco tiempo (menos de 4 segundos), ya sea porque la página no tiene contenido de interés o debido a que la página fue actualizada. 3) Clasificador de páginas Web de los recogidos URL´s: Esta fase se encarga de clasificar las páginas Web de acuerdo a los datos recogidos de los usuarios (fase 2). Todos los conceptos accedidos por los usuarios son almacenados en un vector y los objetos relacionados a los conceptos se identifican mediante el algoritmo de k-vecinos. De los conceptos se extraen palabras clave que ayudarán a describir las páginas Web y poder encontrar la relación de los objetos con los conceptos. Se crean categorías a través de la relación objeto – concepto para generar una ontología de usuario. 16 | P á g i n a
  25. 25. «ESTADO DEL ARTE3.5 PERSONALIZACIÓN DE NAVEGACIÓN WEB CON PERFILES PERSONALES ENRIQUECIDOS SEMÁNTICAMENTEEl método propuesto en [Ankolekar 2005] se basa en la ampliación del método HTTP GET paraincluir un nuevo parámetro que apunta a la URL de un archivo del usuario denominado FOAF(Friend of a Friend) [Miller 00] el cual tiene información que describe a una persona en términosde varios atributos, tales como páginas Web, afiliaciones, fotografías y datos de contacto, así comoespecificaciones de los conocidos y amigos del usuario, está extensión permite que el servidorWeb pueda utilizar la información de la persona contenida en el archivo FOAF para personalizar laspáginas web. Como caso de estudio lo implementaron en un portal de un centro de investigacióncon el fin de recomendar enlaces de los investigadores que el usuario tenía relación.El servidor web con la nueva cabecera es capaz de acceder a los archivos FOAF del usuario, buscapersonas que el usuario conoce. En la página principal del portal el usuario cuenta con enlacesdirectos a esas personas. A partir de ahí, se puede explorar la lista de la publicación, los datosactuales de contacto, los cursos, los proyectos que la persona trabaja, y así sucesivamente.3.6 RECUPERACIÓN DEL CONTENIDO DEL CONTEXTO PERSONALIZADO UTILIZANDO CONTENIDO ONTOLÓGICOEl método propuesto en [Vallet 2007] se basa en una ontología de representación del dominio deldiscurso, asignando diferentes pesos de acuerdo a los intereses del usuario que haya registrado ya la navegación que ha tenido de tal manera que se le muestre una página con los enlaces que másle hayan interesado. Las preferencias de los usuarios se abordan de manera implícita y explicita a lo largo de la historia de sus acciones. Ponderan semánticamente metadatos que describen los contenidos del discurso en términos de una ontología del dominio. Utilizan una técnica de vectores para establecer los pesos por concepto de la ontología del dominio indicando su relación con las preferencias de los usuarios. Los usuarios se representan con vectores haciendo una correspondencia de acuerdo a la intensidad de sus intereses por cada concepto de la ontología de dominio, creando reglas de asociación y transitividad.Una vez que se obtuvieron los contenidos que tuvieron mayor preferencia se filtran y se clasificande manera personalizada. 17 | P á g i n a
  26. 26. «ESTADO DEL ARTE3.7 RAZONAMIENTO SEMÁNTICO: UNA RUTA DE NUEVAS POSIBILIDADES DE PERSONALIZACIÓNEl método propuesto en [Blanco 2008] se basa en asociaciones semánticas para la recomendaciónde programas de televisión que se presentan a los espectadores de la televisión digital interactiva(IDTV). El método descubre relaciones semánticas entre las preferencias del usuario con losprogramas de televisión representados en una ontología de dominio. Para su implementaciónconsideraron dos modelos: 1. Modelo del dominio: este modelo realiza la descripción semántica de los programas de televisión que se pueden sugerir a los usuarios, este modelo representa la ontología del domino de los programas de televisión. 2. Modelo de usuario: este modelo representan los atributos necesarios para definir las preferencias de los usuarios de acuerdo a los programas de televisión.La estrategia basada en el razonamiento que proponen cuenta con dos fases, con las cuales serealiza la inferencia para poder sugerir los programas de televisión de acuerdo a las preferenciasdel usuario. 1. Fase de Filtrado: está fase selecciona de la ontología del dominio las instancias de clases y propiedades que son relevantes para el usuario, es decir, aquellas que cumplan con los atributos que tienen relación con los programas de televisión considerando las preferencias personales. 2. Fase de Recomendación: esta fase detecta los conceptos que están estrechamente relacionados con las preferencias del usuario mediante la exploración de las entidades y asociaciones semántica, las cuales permiten crear relaciones entre entidades de recursos. Estas relaciones captan la conectividad entre las entidades y la similitud entre ellas.La estrategia es capaz de descubrir que un programa de televisión es atractivo para el usuario, lainformación es desplegada en forma de guía de canales con programación que podría ser atractivapara el usuario.3.8 UN ENFOQUE DE LA WEB SEMÁNTICA PARA LA PERSONALIZACIÓN DEL CONTENIDOEl método propuesto en [Wolowski 2007] se basa en un sistema de software que darecomendaciones de compras a través de mensajes de texto a su celular a los usuarios. Laarquitectura propuesta se basa en la premisa de que hay un registro de usuarios que representa lahistoria de su comportamiento (sus compras).El método que utilizaron para inferir sobre los artículos a comprar fue un árbol de decisión, con elcual se construyen predicciones para representar y categorizar una serie de sucesos. El árbol dedecisión representa un modelo para las preferencias de usuario. El árbol de decisión se transformaen un perfil de preferencias, marcado en forma de metadatos RDF, y se almacena en el dispositivodel usuario. 18 | P á g i n a
  27. 27. «ESTADO DEL ARTEPara el proceso de personalización de contenidos, se realiza una consulta de metadatosespecíficos y se crea automáticamente una plantilla genérica, utilizando las preferencias delusuario generados a partir de un árbol de decisión. Esta consulta puede ejecutar la búsqueda delos productos representados en forma de metadatos RDF (por ejemplo, artículos de compra) quesatisfacen las preferencias del usuario. El contenido personalizado es entregado en un mensajeque contiene el resultado del proceso, se envía al nodo del mismo nivel, lo que representa eldispositivo móvil de un usuario dentro de una red peer-to-peer.3.9 MODELADO MANEJADO POR ONTOLOGÍAS PARA LA PPERSONALIZACIÓN DE CONTENIDO WEBEl método propuesto en [Brambilla 2008] se basa en un proceso de monitoreo iterativo de lanavegación del usuario. Se recolectan sus búsquedas, estas se almacenan como preferencias enuna ontología de perfil de usuario la cual se correlaciona con una ontología de dominio,finalmente la información obtenida se consulta para entregar contenido personalizado.El método propuesto evalúa el contexto de contenidos Web para incluir enlaces ad-hoc en laspáginas de navegación. El contexto de los contenidos de la página se describe con esquemas deontologías. El método consiste de 3 pasos: 1. Un modelo entidad – relación que representa los metadatos que describen el contexto Web representado en ontologías. 2. Un conjunto de primitivas de alto nivel para la gestión de hipertexto. 3. Un mecanismo de personalización para la gestión de contenidos Web, el cual clasifica Las preferencias del usuario asignando un peso a las diferentes contribuciones de las preferencias explícitas e implícitas que el usuario provee. Este mecanismo consta de cuatro partes: a. Un modelo conceptual para representar el perfil de usuario, en término de ontologías. b. Un modelo conceptual para el registro de preferencias de los usuarios. c. Un modelo conceptual para almacenar el comportamiento implícito del usuario. d. Un modelo conceptual para la publicación de metadatos de contenido personalizado basado en el hipertexto de las páginas, de acuerdo a la información recogida de los modelos anteriores.3.10 COMPARATIVAEn esta sección se describe una comparativa con los puntos de interés interrelacionados con lostrabajos del estado del arte y el trabajo de investigación. La comparativa se detalla en la Tabla 3-1,los criterios de comparación son: 19 | P á g i n a
  28. 28. «ESTADO DEL ARTEModelo de usuario: este punto de interés especifica a qué nivel maneja el modelo deusuario, es decir, si el modelo es una ontología, si está basado en un modelo conceptual, oestá registrado en una Base de Datos.En los trabajos de [Tziviskou 2007], [Trajkova 2004], [Blanco 2008], [Wolowski 2007] y[Brambilla 2008] utilizan una ontología para representar los intereses y /o preferencias delusuario al igual que la tesis, sin embargo la ontología creada en los trabajos deinvestigación se desarrolló de acuerdo al historial de navegación del usuario, por lo cualhay una relación más estrecha con los contenidos del sitio y/o portal Web al que accedióel usuario. La tesis maneja una ontología de usuario general, que al no estar relacionada alsitio Web, tiene atributos que perfilan al usuario en diferentes contextos. Una ventaja deesta ontología es que no se requiere conocer lo que el usuario ha visitado, para ofrecerlelas recomendaciones. La diferencia con esta tesis con el resto de los trabajos es que hacenrecomendaciones de acuerdo a las personas con las que tiene alguna relación el usuario, aexcepción de [Ankolekar 2005] que hace uso del archivo FOAF el cual contieneinformación general de un usuario.Modelo de sitio: este punto de interés especifica a qué nivel maneja el modelo del sitio, esdecir, si el modelo cuenta con un esquema semántico (ontología del dominio), modeloconceptual, o una simple taxonomía.En los trabajos de [Tziviskou 2007], [Vallet 2007], [Blanco 2008], [Wolowski 2007] y[Brambilla 2008] manejan una ontología que representa los contenidos del sitio y /o portalWeb debido a su factibilidad para extraer el contenido y la utilización de la URI querepresenta cada contenido, en esta tesis desarrolló una ontología que representa loscontenidos del sitio Web de gobierno estatal con el fin de tener una mayor interacciónentre los conceptos y los intereses del usuario además de que esta tesis inmersa en laWeb Semántica. En otros trabajos como [Magdalini 2005], [Trajkova 2004], [Ankolekar2005] únicamente consideran la representación de los contenidos a nivel de taxonomía deacuerdo al historial de navegación del usuario.Método de relación: este punto de interés especifica la técnica de personalizaciónutilizada.En [Tziviskou 2007], [Magdalini 2005] y [Ankolekar 2005] la técnica aplicada son reglas deasociación que descubren acciones predecibles del usuario para lo cual necesitan unhistorial de su navegación. En los trabajos [Trajkova 2004], [Vallet 2007], [Brambilla 2008]utilizan vectores por peso, ponderan en la escala de 0-1 aquellos contenidos en donde elusuario estuvo más interesado, representándolos en un vector, asocian la ponderacióncon los contenidos de interés. En [Blanco 2008] utilizan asociaciones semánticas paradescubrir relaciones ocultas entre los contenidos de interés del usuario, es decir, buscaninformación que tenga relación con los contenidos que en principio, el usuario consideró;de esta forma se selecciona y presentan los contenidos de interés para el usuario y otrosque podrían interesarle. En [Wolowski 2007] utilizan un árbol de decisión, el cual se basaen datos de entrenamiento que previamente se cargan, con estos datos se identifica lainformación que puede ser de interés al usuario. Con respecto a la tesis se utilizó unamáquina de inferencia definiendo reglas semánticas en lenguaje SWRL (Semantic Web 20 | P á g i n a
  29. 29. «ESTADO DEL ARTE Rule Lenguaje), para explotar el modelo de recomendación se implementaron dos ontologías, una de usuario y otra del contenido de un sitio Web de gobierno estatal, las máquinas de inferencia permiten relacionar conceptos entre ontologías, lo cual no realizan los trabajos relacionados que sólo manejan una ontología de usuario o de contenido, por lo que requieren del historial de navegación de usuario para conocer qué contenidos le interesan y partir de esto generar las asociaciones entre sus intereses y los contenidos, en esta tesis se necesita conocer atributos de interés que el usuario reflejó en la ontología de usuario y buscar los contenidos que se relacionen con esos atributos, por lo que no se requiere historial de navegación para mostrarle lo que más haya visitado. Personalización: este punto de interés define el nivel de personalización y la manera en cómo se muestra el contenido personalizado al usuario. En [Tziviskou 2007] y [Brambilla 2008] insertan enlaces directos a los contenidos de interés del usuario. En [Magdalini 2005] muestra los documentos (.html, .doc, .pdf, etc.) que para el usuario fueron de mayor interés de acuerdo a su historial. En [Trajkova 2004], [Ankolekar 2005] y [Vallet 2007] muestran una página en la cual se muestran los contenidos que más visitó el usuario. En [Blanco 2008] se muestra una guía de los contenidos que le interesaría al usuario a través de un mensaje en la pantalla de su televisor y en [Wolowski 2007] envía mensajes al teléfono celular del usuario para mostrarle los contenidos de su interés. En esta tesis se muestra una página con diferentes enlaces clasificándolos por categorías para su mejor distribución. Hasta el momento en la literatura analizada no se ha encontrado algún trabajo que extraiga la estructura del sitio para mostrar una página personalizada con el diseño del sitio mostrando únicamente los contenidos que podrían ser de interés para el usuario. Tabla 3-1: Cuadro comparativo de trabajos relacionados Modelo de Método de Nombre Modelo del sitio Personalización usuario relación[Tziviskou 2007] ontología ontología Reglas por pesos Enlaces Reglas de[Magdalini 2005] BD taxonomía Documentos asociación Vectores por[Trajkova 2004] ontología Si Páginas pesos Reglas de[Ankolekar 2005] ontología categorías Página asociación Vectores por[Vallet 2007] si ontología Página pesos Asociaciones[Blanco 2008] ontología ontología Mensajes Semánticas[Wolowski 2007] ontología ontología Árbol de decisión Mensajes Vectores por[Brambilla 2008] ontología ontología Enlaces pesos Reglas semánticas Categorías /Tesis ontología ontología (SWRL) Enlaces 21 | P á g i n a
  30. 30. «ESTADO DEL ARTEComo conclusión se han clasificado los sistemas de personalización de contenidos Web definidosen el estado del arte, de acuerdo a los mecanismos de personalización tales mecanismos incluyen: La representación de perfiles de usuario. Los métodos empleados pata lograr la recomendación de contenidos a medida de las preferencias de los usuario. Los mecanismos de personalización para la recomendación de contenidos Web.En los siguientes capítulos abordamos la descripción del método para la personalización decontenidos web, la implementación de la herramienta en el contexto de e-gobierno, pruebas yconclusiones. 22 | P á g i n a
  31. 31. Capítulo 4 :METODOLOGÍA PARA LA PERSONALIZACIÓN DE CONTENIDOS WEB 23 | P á g i n a
  32. 32. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEBEn este capítulo se presenta la metodología para la personalización de contenidos Web para larealización de un sistema de recomendación de contenidos de e-gobierno con el propósito depromover un uso generalizado de las capacidades de personalización. Dado que nuestrametodología aplica un proceso de razonamiento semántico sobre las preferencias de los usuarios ylos contenidos de e-gobierno son tres características fundamentales sobre los que asienta susbases: la ontología que formaliza el conocimiento sobre el dominio de e-gobierno los perfiles que registran las preferencias de los usuarios. la estrategia de recomendación basándose en el razonamiento semántico con la utilización de reglas de inferencia (SWRL).4.1 INTRODUCCIÓNLa metodología para la personalización de contenidos Web se conforma de cuatro fases que sefundamentan en las características anteriormente mencionadas con el fin de llevar a cabo lapersonalización de contenidos Web a través de reglas de inferencia que permitan asociar loscontenidos de una ontología del dominio con las preferencias relevantes de un usuario. Enprimera instancia se consideró el desarrollo de una ontología de dominio debido a que los portalesde gobierno actuales no tienen ontologías que describan sus contenidos, lo cual limitaba laestrategia de recomendación basada en reglas de inferencia la cual necesita de ontologías pararealizar el razonamiento semántico. Nuestra metodología considera como primer fase eldesarrollo de ontología de gobierno, como segunda fase la selección de atributos de ontología deusuario desarrollada por [Rojas 2009] con el fin de filtrar aquellos atributos que sirvan para perfilara un usuario en el dominio de e-gobierno, como tercer fase la construcción de un catalogo dereglas de inferencia que se encargan del razonamiento semántico al asociar los contenidos de e-gobierno con el perfil de usuario y como última fase el desarrollo del sistema de personalizaciónde contenidos Web, la metodología para la personalización de contenidos Web se puede observaren la Figura 4-1. Cabe mencionar que en esta sección se describe el proceso que conforma unprototipo para la personalización de contenidos Web, los detalles relativos al prototipo desoftware se presentan en el capítulo 5. Figura 4-1: Metodología para la personalización de contenidos Web. 24 | P á g i n a
  33. 33. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB4.2 FASE 1: DESARROLLO DE ONTOLOGÍA DE E-GOBIERNOEsta fase consiste en la generación de una ontología de gobierno que represente los contenidos delos portales gubernamentales mexicanos por el motivo que la estrategia de recomendación decontenidos Web se realiza a través de reglas de inferencia que permiten asociar los contenidos deuna ontología de dominio con las preferencias del usuario, es decir, las reglas de inferenciaseleccionan información de ontologías y no de texto plano. La motivación principal para eldesarrollo de ontología de e-gobierno se debió a que los portales de gobierno actuales no tienenontologías que describan sus contenidos, lo cual limitaba la estrategia de recomendación basadaen reglas de inferencia la cual necesita de ontologías para realizar el razonamiento semántico.Para el desarrollo de esta fase se consideraron tres procesos: 1) Selección de portalesgubernamentales, dedicado a obtener una muestra de los portales más representativos conrespecto a la manera que presenta la información hacia el usuario, 2) Evaluación de portalesgubernamentales, dedicado a la evaluación de los portales gubernamentales de acuerdo a laselección del proceso uno con el fin de identificar aquellos portales gubernamentales que cuentencon las características del buen diseño de portales gubernamentales en cuanto estructura yorganización, 3) Creación de ontología de e-gobierno, dedicado a la generación de la ontología dee-gobierno partiendo de la iniciativa de los portales gubernamentales seleccionados y evaluadosno tienen ontología que representen sus contenidos tomando en cuenta la metodología para lacreación de ontologías por [F. Noy 2005]. Los procesos involucrados en la fase 1 se esquematizanen la Figura 4-2. Figura 4-2: Fase 1-Desarrollo de ontología de e-gobierno.4.2.1 PROCESO 1: SELECCIÓN DE PORTALES GUBERNAMENTALESEste proceso consiste en la selección de portales gubernamentales que presenten su informaciónen la Web de manera que el usuario pueda encontrarla fácilmente con el fin de adquirir unamuestra de los portales gubernamentales más representativos de la información y sirvan de basepara la generación de la ontología de e-gobierno. Para tal propósito se consideró el índice deGobierno Electrónico Estatal (IGEE 2009) de los portales gubernamentales de los 31 estados y unDistrito Federal que se presento en el ranking de [Política Digital 2009]. La medición del IGEEE2009 toman en cuenta las característica de: información, interacción, integración y participacióncon tales características permiten ofrecer una aproximación integral sobre la utilidad que ofrece elportal gubernamental a los ciudadanos, la evaluación dio un total de 16 mil 992 datos para laconsolidación del IGEE 2009, en la Tabla 4-1 se detalla cada una de las características para elranking con sus atributos y descripción correspondiente. 25 | P á g i n a
  34. 34. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB Tabla 4-1: Características evaluadas por ranking de [Política Digital 2009]CARACTERISTICA: 1. Información ATRIBUTO DESCRIPCIÓN Información completa y El portal debe contar con información completa y detallada detallada: sobre fuentes de información, estadísticas, etc., que exista en la página de inicio varios bloques de información relacionados por ejemplo con noticias, trámites o eventos. Información Multimedia: Integración de soporte o de procedimientos que emplean sonidos, imágenes o textos para difundir información, especialmente de forma interactiva. Organización de la Forma en que se encuentra la información dentro del sitio Web. Información: Accesibilidad de la Fácil acceso a la información dentro del portal. Información: Transparencia: Acceso público a una información completa, exacta y clara acerca del gobierno.CARACTERISTICA: 2. Interacción ATRIBUTO DESCRIPCIÓN Contacto con Webmaster El portal debe contar con información completa y detallada y atención ciudadana: sobre fuentes de información, estadísticas, etc., que exista en la página de inicio varios bloques de información relacionados por ejemplo con noticias, trámites o eventos. Obtención de formatos en Obtención de formatos que se puedan bajar y guardar en línea: nuestro equipo para realizar algún trámite o llenarlo en línea. Búsquedas de Realizar búsquedas dentro del portal para encontrar de manera Información: más rápida información. Personalización: Adaptar el portal conforme a preferencias o gustos. Información dinámica: Evaluar la interactividad dentro del portal de gobierno. Obtención de formatos en Obtención de formatos que se puedan bajar y guardar en línea: nuestro equipo para realizar algún trámite o llenarlo en línea.CARACTERISTICA: 3. Transacción ATRIBUTO DESCRIPCIÓN Pagos en línea: Evaluar si dentro del portal se pueden realizar transacciones en línea. Seguridad: Evaluar la seguridad con la que cuenta el portal de gobierno para llevar a cabo transacciones en línea.CARACTERISTICA: 4. Integración ATRIBUTO DESCRIPCIÓN Integración vertical: Existe información de otros gobiernos tanto federal como municipal. Integración horizontal: Evaluar si el portal da información completa sobre el gobierno estatal. Integración transaccional Realizar transacciones en línea de otras dependencias o carrito de compras: gubernamentales y niveles de gobierno. 26 | P á g i n a
  35. 35. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEBCARACTERISTICA: 5. Participación ATRIBUTO DESCRIPCIÓN Debates en línea de Se llevan a cabo discusiones o debates con funcionarios. asuntos públicos: Voto electrónico: Se lleva a cabo algún tipo de votación electrónica.CARACTERISTICA: 6. Diseño y EstiloDESCRIPCIÓN: Evaluar el diseño y estilo que cuenta el portal gubernamental.En la Figura 4-3 se muestra el producto final de la evaluación de los portales gubernamentales,destacando las puntuaciones de cada característica evaluada: información, interacción,transacción, integración y el número de posición correspondiente a cada estado. Figura 4-3: Índice de gobierno electrónico estatal 2009 [Política digital 09]. 27 | P á g i n a
  36. 36. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB4.2.2 PROCESO 2: EVALUACIÓN DE PORTALES GUBERNAMENTALESEste proceso consiste en la evaluación de portales gubernamentales con las características delbuen diseño de portales gubernamentales. Tales características se tomaron en cuenta paraevaluar los portales gubernamentales para obtener aquellos que presenten su información deacuerdo a las características consideradas para el buen diseño de portales gubernamentales con elfin de generar una ontología de e-gobierno con la información que muestran los sitios Webgubernamentales pero solo con aquellos que presenten un buen nivel en estructura, organizacióny facilidad de acceso a la información de interés de los usuarios.El diseño de un portal gubernamental debe tomar en cuenta la experiencia que vivirá el usuariopor sus páginas y lograr que encuentre lo que está buscando de manera simple [Aceves 2008]. Porlo que se considera ciertas características como: Diseño y estructura, arquitectura, tramites yservicios, accesibilidad, participación ciudadana y transparencia que determinan si un portalgubernamental tiene una buena estructura y organización en su contenido y diseño.En la Tabla 4-2 se describen las características: diseño y estructura, arquitectura, trámites yservicios, accesibilidad, participación ciudadana y transparencia para el desarrollo de portalesgubernamentales centrados en el usuario y en estándares de certificación, cada una con sucorrespondiente descripción. Tabla 4-2: Características para el desarrollo de portales gubernamentales. CARACTERÍSTICA DESCRIPCIÓN 1. Diseño y estructura Se refiere a los conceptos para determinar la composición visual de un sitio (look and feel). Diseño visual: identidad del portal Estructura: la forma en que será presentada la información. Multimedia: nos permite tener un portal dinámico (animación, audio y video). Imágenes con intención: utilizar imágenes representativas y contar con un texto descriptivo. Estándares de estructura: XHTML, XML. Estándares de presentación: diseño con hojas de estilo CSS. 2. Arquitectura De acuerdo a [Rosenfeld 00], la arquitectura de la información para la Web se compone de cuatro componentes. a) Sistema de organización: Se refiere a las formas en que la información y contenidos de un sitio se catalogan. b) Sistema de navegación: Son los esquemas mediante los cuales el usuario se moverá a través del sitio. 28 | P á g i n a
  37. 37. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB c) Sistema de rotulado (labeling): Se refiere a la manera en que se representará la información de un sitio de forma que el usuario comprenda la terminología. d) Sistema de búsqueda: Es la forma en que los usuarios tratarán de localizar la información en el sitio.3. Trámites y servicios Una de las formas en que el ciudadano percibe la transformación de un gobierno a e-gobierno está en la posibilidad de realizar trámites y servicios en línea. Se deben de cuidar los siguientes aspectos: Facilidad para encontrar y acceder al trámite o servicio. Estado del proceso del trámite. Diseño de formularios. Esquemas de seguridad. Flexibilidad y eficiencia en el uso.4. Accesibilidad La accesibilidad Web significa que personas con algún tipo de discapacidad pueden hacer uso de la Web, es decir, al hablar de accesibilidad Web se hace referencia a un diseño que va a permitir que estas personas puedan percibir, entender, navegar e interactuar con la Web, independientemente de sus limitantes físicas o técnicas.5. Participación En cualquier gobierno democrático, la participación ciudadana Ciudadana debe representar uno de los principales objetivos a fomentar. Para lograr la participación ciudadana se debe: o Promover y fomentar la participación a través de la publicación de información dirigida a diferentes sectores de la sociedad (e- Information). o Facilitar consultas vía electrónica donde los ciudadanos pueden enterarse de las acciones de sus autoridades, así como deliberar opiniones sobre éstas (e-Consultation). o Realizar peticiones para convertirse en parte proactiva en las decisiones, o en su caso recibir una respuesta directa sobre algún asunto específico (e-Decisión making).6. Transparencia La transparencia de la información es una consecuencia de la participación ciudadana. La transparencia de la información comprende: a) La publicación de información relevante para la sociedad relacionada con el hacer y qué hacer de una entidad pública, alineándose generalmente a una ley o regulación de acceso a la información. 29 | P á g i n a
  38. 38. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB b) La fácil localización (findability) de datos relacionados con la labor de una dependencia gubernamental por parte de cualquier usuario. Si se requiere información adicional deberá ser solicitada en línea. c) La presentación de información en un lenguaje claro, de manera que cualquier ciudadano pueda comprender el significado de los contenidos, independientemente de su experiencia en el uso de herramientas tecnológicas.De acuerdo en la evaluación de portales gubernamentales en [Política digital 09] se tomaron losprimeros ocho portales de gobierno estatales: Nuevo León, Sinaloa, Puebla, Estado de México,Distrito Federal, Yucatán, Veracruz y Guerrero, estos se reevaluaron tomando en cuenta lascaracterísticas del diseño de portales gubernamentales: Diseño y estructura, arquitectura,tramites y servicios, accesibilidad, participación ciudadana y transparencia. Se consideró unaponderación de 0 a 1 tomando en cuenta sí cumplían con todas o algunos de los atributos deevaluación. En la Tabla 4-3 se muestra los resultados obtenidos para cada portal gubernamentalestatal.Tabla 4-3: Evaluación de portales gubernamentales de acuerdo a las características de diseño de portales gubernamentales. Distrito Federal Nuevo León Estado de Guerrero Veracruz Yucatán México Sinaloa Puebla Diseño y estructura Diseño visual 1 1 1 1 1 1 1 1 Estructura 1 1 1 1 1 1 1 1 Sistema visual 1 1 1 1 1 1 1 1 Iconografía 1 1 1 .5 .8 0 1 1 Multimedia .5 .5 .5 .8 .8 .5 1 .5 Imágenes con intención 1 1 1 1 1 1 1 1 Estándares de estructura 1 .5 1 1 1 1 1 1 Estándares de presentación 1 1 1 0 1 1 0 1 Arquitectura Sistema de organización 1 .8 .8 1 1 .8 .8 1 Sistemas de navegación 1 1 1 1 1 1 1 1 Sistema de rotulado 1 1 1 1 1 1 1 1 Sistema de búsqueda .8 .8 .5 .8 .5 .5 .3 .5 Trámites y servicios 1 1 .5 1 .8 1 .8 1 30 | P á g i n a
  39. 39. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB Accesibilidad Nivel A (1 punto) 1 0 0 0 0 0 0 0 Nivel AA (2 puntos) Nivel AAA (3 puntos) Participación ciudadana Civismo 0 0 1 1 1 0 1 0 Audiencias publicas 1 1 1 1 1 1 1 1 Consulta de opiniones 1 1 0 0 1 1 0 1 Interacción sincrónica 1 0 1 1 1 1 0 1 Transparencia 1 1 1 1 1 1 1 1 Puntuación 17.3 14.6 15.3 15.1 16.9 14.8 13.9 164.2.3 PROCESO 3: CREACIÓN DE ONTOLOGÍA DE GOBIERNOEste proceso consiste la creación de una ontología de e-gobierno tomando en cuenta unametodología para la creación de ontologías con la iniciativa de que no se encontró una ontologíaen los portales gubernamentales que se tomaron de la actividad de selección de portalesgubernamentales. Con la falta de la ontología se consideró buscar alguna herramienta disponibleen la Web para la generación de ontologías, en el anexo A1 se muestran las herramientasutilizadas y el resultado que arrojaron, se usaron tres herramientas Ontogen, TouchGrahp y WebData Extracto. Sin embargo el resultado propuesto por las herramientas no fue satisfactorio, yaque no generaban una ontología, extraían palabras clave o enlaces de ligas externas, hasta elmomento no se encuentran herramientas que generan automáticamente una ontología, necesitande la intervención de un experto o algún usuario que tenga conocimiento en el área, para generarla base de la ontología. Con esta perspectiva se consideró generar una ontología de dominio parapruebas de la investigación, debido a que el objetivo de la tesis no es construir una ontología dedominio, pero sí utilizar alguna.La ontología cubrirá el dominio de e-gobierno con el fin de realizar recomendaciones a usuariossobre información de portales gubernamentales, para lo cual fue necesario observar cada portalgubernamental para extraer la guía de contenido que abordan y las categorías que existen en cadacontenido para realizar una clasificación, ordenación y búsqueda de relaciones entre los conceptosidentificados, para lo cual se utilizo una metodología para la creación de ontologías que sedescribe en el siguiente punto. 31 | P á g i n a

×