• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Buscador Semántico
 

Buscador Semántico

on

  • 1,772 views

En este proyecto se usan varias herramientas para crear un buscador semántico.

En este proyecto se usan varias herramientas para crear un buscador semántico.

Statistics

Views

Total Views
1,772
Views on SlideShare
1,622
Embed Views
150

Actions

Likes
0
Downloads
58
Comments
0

2 Embeds 150

http://fpcuenca.wordpress.com 148
http://www.slideshare.net 2

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Buscador Semántico Buscador Semántico Document Transcript

    • 55124353810000<br />UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA<br />108585141605000<br />Sistemas Basados en El Conocimiento<br />Temas del Proyecto<br />“Buscador Semántico de Libros”<br />Elaborado por: <br />Flor Cuenca<br />Luis Sancho<br />Docente: Ing. Priscila Valdivieso<br />Ciclo: 10<br />DOMINIO DEL PROYECTO<br />Contar con un buscador que facilite encontrar recursos de una manera mucho más precisa es un objetivo bastante ansiado por los internautas de hoy, sin embargo es de mucha utilidad contar con un buscador que nos faciliten las búsquedas de catálogo de recursos digitales dentro de una biblioteca, razón por la cual este proyecto va enfocado en aquello que es de mucha utilidad al momento de buscar información acerca de un tema en específico, generando al usuario la posibilidad de asignarle una valoración sobre su contenido para así mejorar los resultados presentados.<br />El eje principal de este proyecto va enfocado en la búsqueda de recursos educativos que traten sobre un tema en específico, brindándole al usuario los metadatos del recurso que le será de utilidad para lo que está buscando.<br />Cabe recalcar que el buscador que se pretende desarrollar se limitará únicamente a realizar búsquedas de recursos que pertenezcan al área técnica y que estén dentro de las categorías que posteriormente serán definidas.<br />Para concluir lo que se busca con este aplicativo es inferir el conocimiento almacenado en una ontología o en una base de datos e ir alimentado a la base del conocimiento con nueva información (rating) y con ello obtener un resultado muchos más acorde a lo que estamos buscando, siendo como agente activo el usuario con sus aportaciones para contribuir a la Base de Conocimientos.<br />ALCANCE<br />Nuestro proyecto tiene como objetivo permitir realizar las siguientes actividades dentro del buscador de catálogos para una determinada biblioteca.<br />1. Metadatos.- Ésta información se refiere a los datos que describirán un recurso y contendrá los siguientes campos:<br />* Titulo: Titulo del recurso.<br />* Autor: Autor o autores<br />* Año: Año de publicación del recurso<br />* Edición: Número o año de edición<br />* Descripción: Información que permitirá al buscador inferir a que categoría pertenece, será de mucha utilidad al momento de buscar resultados para el usuario.<br />* Editorial: Editorial que se encarga de la distribución de los ejemplares.<br />2. Buscador.- El buscador únicamente obtendrá información de la base de conocimiento que se encuentra almacenada en la ontología y en una base de datos que será alimentada con información que el usuario ingrese acerca de un determinado libro, siendo el recurso priorizado en la siguiente búsqueda que realice un usuario.<br />3. Opciones de usuario.- El usuario podrá catalogar a un recurso dentro de una escala de valoración entre 1 y 10 de acuerdo a su utilidad, dicha información será almacenada en la BD para ser tomada en cuenta en las próximas búsquedas.<br />4. Recursos.- La información que se presentará al usuario es únicamente lo que se describe en los metadatos, no existirá la posibilidad de descargar el material en ningún formato, simplemente serán de solo lectura.<br />5. Opciones de búsqueda.- El buscador presentara resultados únicamente para aquellos recursos que se encuentren dentro del área técnica, por lo tanto si se utiliza terminología que no pertenece a dicha área no arrojará ningún resultado.<br />6.-Terminología a utilizar.- Para realizar una búsqueda se puede utilizar vocabulario que se encuentre únicamente dentro de los recursos que pertenecen al área técnica.<br />“Ejemplo: Si estamos buscando información que hable acerca de logaritmos, el buscador automáticamente sabrá que el usuario está buscando un recurso que pertenece al área técnica y por ende presentará en orden de prioridad todos aquellos recursos que pertenecen a dicha área.”<br />7. Prioridad de resultados.- En caso de que dos o más recursos tenga el mismo nivel de aceptación en base a lo que el usuario busca, se tomará en cuenta el rating (número de aceptaciones dadas por los usuarios) que contiene el recurso y se presentaran en forma descendente.<br />Herramientas a usar<br />Para el desarrollo del proyecto “Buscador Semántico” se usaron las siguientes herramientas:<br />CmapTools Coe: nos permitirá describir las relaciones que existen en cada una de las clases con los objetos.<br />SPARQL: lenguaje estandarizado para la consulta de grafos RDF, tecnología clave en el desarrollo de la Web Semántica.<br />Jena: es un framework Java para la creación de la Web Semántica aplicaciones. Proporciona un entorno de programación para RDF , RDFS y de OWL , SPARQL e incluye una base del motor de inferencia de la regla.<br />Richfaces: es una librería de componentes visuales para JSF, escrita en su origen por Exadel y adquirida por Jboss. Además, RichFaces posee un framework avanzado para la integración de funcionalidades Ajax en dichos componentes visuales, mediante el soporte de la librería Ajax4JSF.<br />Mysql: es un sistema de gestión de base de datos relacional, multi-hilo y multiusuario con más de seis millones de instalaciones.<br />Protege: es una de código abierto plataforma gratuita que proporciona una creciente comunidad de usuarios con un conjunto de herramientas para construir modelos de dominio y aplicaciones basadas en el conocimiento con ontologías.<br />Java: lenguaje de programación y la primera plataforma informática creada por Sun Microsystems en 1995.<br />Categorías<br />Las principales categorías que se manejaran serán:<br />Matemáticas<br />Proyectos<br />Electrónica<br />InteligenciaArtificial<br />Redes<br />Física<br />Web<br />Software<br />Objetos<br />1.- Recurso<br />- Titulo<br />- Autor<br />- Área a la que pertenece.<br />- Año de publicación<br />2.- Usuario<br />Propiedades<br />- Username<br />- Nombre<br />- Apellido<br />- Dirección<br />- Nacionalidad<br />- Edad<br />Tarea 1: Construcción del Glosario de Términos <br />NombreSinónimoAcrónimoDescripciónTipoAccesibilidad -- Se refiere a la accesibilidad que tendrá un determinado recurso.Propiedad de claseAgentes --Término más usado en IA hacer referencia a robots que hacen el trabajo manual de los humanos los mismos está programados.Propiedad de claseAño de edición Anio_edicionHace referencia al año de edición de un determinado libro.Propiedad de claseAntenas --Dispositivo de formas muy diversas que, en los emisores y receptores de ondas electromagnéticas, sirve para emitirlas o recibirlasPropiedad de claseAplicaciones --Cada uno de los programas que, una vez ejecutados, permiten trabajar con el ordenadorPropiedad de claseAre --Dícese de que un objeto que es parte de una categoría o clase.RelaciónArtificial  -- Algo no natural.Propiedad de claseAutor --  Persona que realiza, causa u origina algo.Propiedad de claseCableado --  Conjunto de cables que forman parte de un aparato o sistema eléctrico.Propiedad de clasecan be --Dícese de que un objeto que puede ser parte de una categoría o clase.RelaciónCapas --  Cada una de las partes superpuestas que forman un todo en un cableado o estructura.Propiedad de claseCircuitos --  Conjunto de conductores que recorre una corriente eléctrica. Propiedad de claseCodigo --  Serie de líneas y números asociados para generar nuevas aplicaciones.Propiedad de claseCompuertas -- Se refiere a las compuertas dentro de los circuitos electrónicos.Propiedad de claseContenido -- Se refiere al contenido de un recurso.Propiedad de claseContiene --  Dícese de que una clase que contiene un objeto.relaciónControl -- Una de las etapas de la elaboración de un proyecto.Propiedad de claseDireccion --   Una de las etapas de la elaboración de un proyecto.Propiedad de claseDisenio -- Estructura de un proyecto, como se verá para el usuario final.Propiedad de claseEcuaciones -- Igualdad que contiene una o más funciones.Propiedad de claseEdicion -- Conjunto de ejemplares de una obra de una sola.Propiedad de claseEditorial -- Empresa que se dedica a imprimir recursos.Propiedad de claseElectronica --  Rama de la física que estudia los fenómenos basados en la influencia de campos electromagnéticos sobre el movimiento de los electrones libres en el vacío, en gases o en semiconductoresClaseEncriptacion -- Forma de seguridad para acceso a un sitio, se usan algoritmos.Propiedad de claseEnergia -- Calor, combustible, carburante, electricidad, petróleo, gasPropiedad de claseEstandares --Tipo, modelo, patrónPropiedad de claseFisica --Ciencia, mecánica, acústica, termodinámica, electricidad, radiactividad, ópticaClase -- Formulas -- Enunciado, expresión, ley, término, formulaciónPropiedad de claseFunciones -- Diferentes tareas que se han especificado y que se deben llevar a cabo.Propiedad de claseGestion -- Dirección, gobierno, administraciónPropiedad de claseHumana -- Hombre, persona, ser, individuo, ente, sujetoPropiedad de claseInformacion -- Aviso, reportaje, testimonio, comunicación, aclaración, advertencia, asesoría, averiguación, indagaciónPropiedad de claseInteligencia  -- Intelecto, mente, pensamiento, imaginación, comprensión, conocimiento, entendimiento, razonamiento, juicio, razónPropiedad de claseInteligencia Artificial --Esta expresión se usa para referirse a la disciplina de la informáticaClaseLeyes -- En la física se refiere a peso, medida, proporción, porcentaje.Propiedad de claseLibro -- Ejemplar, tomo, volumen, obra, texto, manual.ClaseLogaritmos -- Dícese del exponente, base.Propiedad de claseLogica -- Dícese de la dialéctica, razonamiento, métodoPropiedad de claseLogicas --  Dícese de la dialéctica, razonamiento, métodoPropiedad de claseMaquetacion --  Distribución de elementos en el diseño gráfico.Propiedad de claseMasa -- En física, es la cantidad de materia de un cuerpo.Propiedad de claseMatematicas -- Ciencia que, partiendo de axiomas y siguiendo el razonamiento lógico, estudia las propiedades y relaciones cuantitativas entre los entes abstractos.ClaseMetodologias --Hace referencia al conjunto de procedimientos basados en principios lógicos, utilizados para alcanzar una gama de objetivos que rigen en una investigación científica o en una exposición doctrinal.Propiedad de clasemust be -- Dícese de que un objeto puede ser parte de una categoría o clase.RelaciónNombre --Es la designación o denominación verbal.Propiedad de claseNumeros -- Es una entidad abstracta que representa una cantidad (de una magnitud).Propiedad de claseOperadores -- Símbolo matemático que indica que debe ser llevada a cabo una operación especificada sobre un cierto número de operandosPropiedad de claseOrden -- Propiedad de claseOwl -- Extensión de los archivos que se trabajan en Protégé.Propiedad de clasePaginas -- Cantidad de hojas de un libro o revista.Propiedad de clasePaginaWeb -- Sitio en el cual se encuentran varios recursos.ClasePaper -- Recurso digital de una investigación.ClasePeso -- Cantidad de medida.Propiedad de clasePlanificacion -- Una de las tareas dentro del proceso de desarrollo de un proyecto.Propiedad de clasePrimero --Haciendo referencia a ecuaciones de primer grado, es aquella que después de simplificada tiene la forma ax + b = c o sea una sola variable y con exponente 1Propiedad de claseProcesos -- Pasos que deben ejecutarse para la elaboración de un proyecto.Propiedad de claseProgramacion -- Acción y efecto de programar.Propiedad de claseProtocolos -- Las vías por donde cierto tipo de información va a circular.Propiedad de claseProyecto -- Tarea la cual concierne diferentes factores.ClaseRadiactividad -- Propiedad de los isótopos que son "inestables".Propiedad de claseRecurso --La palabra recurso se emplea en diversos ámbitos, pero siempre con el significado de ser medio para el logro de fines.ClaseRedes -- Hace referencia a un conjunto de entidades (objetos, personas, etc.) conectadas entre sí.ClaseResultados -- Efectos que se obtienen luego de aplicar alguna metodología de trabajo.Propiedad de claseRevista -- Recurso en el cual se publica temas de interés.ClaseRobótica -- Rama de la Electrónica.Propiedad de claseSe clasifican en -- Se define así para determinar la clasificación de varios objetos.RelaciónSegundo -- Hacer referencia a la igualdad que se nos forma al sustituir la " y " de una función cuadrática por 0, en una ecuación de segundo grado.Propiedad de claseSeguridad --Conjunto de medidas tomadas para protegerse contra robos, ataques tanto físicos como lógicos.Propiedad de claseSemantica --Estudio del significado de los signos lingüísticos; esto es, palabras, expresiones y oraciones.Propiedad de claseSoftware -- Conjunto de programas que tiene un PC.ClaseSon definidos como -- Se lo define así para hacer referencia a un conjunto de objetos.RelaciónTelecomunicaciones -- Sistema de Conmutación, Interconexión y finalmente subsistema de SoportePropiedad de claseTiene -- RelaciónTitulo -- Dícese del nombre de un recurso, libro o revista.Propiedad de claseTransporte -- En redes se dice de la capa que ayuda a transferir datos.Propiedad de claseTrigonometria -- Parte de la matemática que se encarga del cálculo de los elementos de los triángulos.Propiedad de claseurl -- Consiste en una secuencia de caracteres que identifica de forma única a algún recurso de Internet sea una imagen, una página o cualquier otro recursoPropiedad de claseUsuarios -- Clientes finales que se benefician de un resultado o proyecto.Propiedad de claseVectores --Es todo segmento de recta dirigido en el espacio.Propiedad de claseVulnerabilidades -- Se dice de las desventajas de un programa o proyecto tanto a nivel físico o lógico.Propiedad de claseWeb --Sistema de distribución de información basado en hipertexto o hipermedias enlazadas y accesibles a través de Internet.Clase<br />Tarea 2: Construcción de LA TAXONOmía<br />Para tener una mejor idea de las diversas relaciones entre las propiedades se creó una taxonomía en CmapTools Coe.<br />centercenter00<br />Tarea 3: Construcción de LAS RELACIONES BINARIAS<br />center92392500<br />50482537528500<br />implementación<br />Para la implementación de la funcionalidad del proyecto se realizaron las siguientes actividades:<br />Se seleccionó el framework Jena, el cual nos permite trabajar una ontología con una base de datos relacional utilizando para ello consultas sparql que son procesadas por dicho framework para posteriormente extraer los datos de la BD.<br />Se presenta un formulario donde se solicita al usuario que ingrese un tema en específico que quiere buscar.<br />En base al criterio ingresado por el usuario, se arma la consulta sparql que posteriormente será ejecutada por Jena para extraer los datos desde la BD.<br />Una vez que obtenemos los resultados de la consulta, estos son presentados al usuario dándole la posibilidad de seleccionar cualquiera de ellos y ver más detalle del libro.<br />En nuestro proyecto se puede apreciar las siguientes clases:<br />Área, Autor, Categoría, Editorial, Idioma, Libro, PaginaWeb, País.<br />A continuación tenemos los objetos que van a relacionar las clases:<br />Libro, país, idioma, area, paginaweb, autor, editorial, categoría, hasidioma, hascategoria, hasarea.<br />A continuación tenemos los atributos de las clases:<br />Y ahora las propiedades extrínsecas e intrínsecas identificadas de cada clase.<br />Extrínsecas(heredadas)Intrínsecas(propias)ÁREAlibroAUTORDirección , nombreCATEGORÍALibro IDIOMA Instancias LIBROAño de publicación, apellido.Dirección, url, descripción, volumen, nombre, titulo.PAGINAWEB Instancias PAÍSpaísIdioma<br />Conclusiones<br />Para el desarrollo de este proyecto se delimito acerca del entorno de trabajo en el que va a interactuar de manera que se pueda lograr el objetivo deseado.<br />Con la ayuda de herramientas como CmapTools Coe se puede diseñar las relaciones entre las clases de manera fácil.<br />Con la ayuda de Protégé se puede modelar la estructura que se diseñó en CmapTools Coe y en la cual se puede agregar diferentes características que ayudan a entender mejor la problemática con la que se está trabajando.<br />Recomendaciones<br />Se debe definir bien el alcance de manera que la Ontología no se expanda mucho y así se pueda tener resultados óptimos.<br />Bibliografía <br />Consultado abril del 2010, Sinbad Sistemas de Información y Base de datos: http://sinbad.dit.upm.es/docencia/doctorado/curso0809/curso0809.html<br />Consultado abril del 2010, RichFaces Developer Guide:<br />http://docs.jboss.org/richfaces/latest_3_3_X/en/devguide/html_single/<br />Consultado abril, mayo del 2010, Protégé:<br />http://protege.stanford.edu/<br />