Las bases de datos documentales.

897 views

Published on

Published in: Technology
  • Be the first to comment

Las bases de datos documentales.

  1. 1. UNIVERSIDAD DE GUADALAJARA SISTEMA DE UNIVERSIDAD VIRTUAL Licenciatura en Tecnologías e Información 2012A Recuperación de la información.Unidad 3: Uso de herramientas de recuperación de información Actividad 2 Las bases de datos documentales. Alumno: C. Alejandro Serralde Romero. 210219574
  2. 2. EbscoHost Web.Conjunto de bases de datos con miles de artículos de revistas y periódicos sobremedicina, ciencia, educación, agricultura, economía, biología, negocios, administraciónentre otras disciplinas.Justificación.Es una de las bibliotecas virtuales más grandes del mundo; provee accesoprincipalmente a artículos de revistas científico/técnico.Características de búsqueda y recuperación de la información.Dispone de versiones en PDF de cientos de publicaciones que se remontan hasta1975, o incluso a fechas anteriores, y permite buscar referencias de más de mil títulos.Se actualiza diariamente a través de EBSCOhost.Ella ofrece una atractiva interface, además de posibilitarnos realizar búsquedasmediante los operadores lógicos booleanos.Es posible realizar búsquedas básicamente en los siguientes idiomas: inglés, francés,español, italiano, alemán, portugués, chino y ruso.También puede seleccionarse un campo determinado: TX - Todo el texto AU - Autor TI - Título SU - Descriptores AB - Resumen KW - Palabras clave GE - Términos geográficos PE - Forma normalizada del nombre de un autor. PS - Título o nombre de revisiones o productos, útil, por ejemplo, para buscar revisiones de libros publicadas en revistas. CO - Forma normalizada del nombre de una compañía. IC NAICS - Código de industria según North American Industry Classification System.
  3. 3. DN DUNS Number - Data Universal Numbering System (DUNS), una identificación única para los establecimientos de negocios situados en Canadá, los Estados Unidos y el resto del mundo. TK - Símbolos o siglas de compañías y negocios. SO – Nombre de la revista IS ISSN IB IBSN AN Número de accesoPuede, a su vez, seleccionarse opciones como: Perfilar búsqueda Búsqueda en historial o alertasAdemás ofrece la opción de "Limitar los resultados": Texto completo. Hay referencias disponibles. Publicaciones académicas (arbitradas). Fecha de publicación (año a año). Publicación -puede escribirse el nombre de la publicación en caso de conocer el título deseado a priori. Tipo de publicación (todas, publicaciones periódicas, periódicos, libros, documentos primarios, informes de educación). Tipo de documento (todos, resúmenes, artículos, bibliografías). Número de páginas (todos, igual a, menor de, mayor de). Artículo de portada. Artículos con imágenes (todos,PDF, texto con imágenes).Otra opción posible es "Ampliar la búsqueda": Buscar también palabras relacionadas. Buscar también en el texto completo de los artículos. Hacer automáticamente una búsqueda "and".
  4. 4. ¿QUE SON LOS METADATOS?Los metadatos son datos altamente estructurados que describen información,describen el contenido, la calidad, la condición y otras características de los datos.Es "Información sobre información" o "datos sobre los datos".Algunos ejemplos de información que se puede describir usando metadatos son:impresa, audiovisual, geoespacial, etc.Los metadatos han estado con nosotros desde que el primer bibliotecario hizo una listade losdocumentos que tenía en un estante, en un pergamino escrito a mano. El término"meta" viene de una palabra griega que significa "junto a, con, después, siguiente". Eluso más reciente del latín y el inglés emplearía "meta" para indicar algo trascendental,o sobrenatural. Los metadatos, pues, pueden ser definidos como datos sobre otrosdatos. Es el término usado en la era de Internet para la información que losbibliotecarios tradicionalmente habían puesto en los catálogos, y más comúnmente serefiere a información descriptiva sobre recursos de la Web.Un registro de metadatos consiste en un conjunto de atributos, o elementos necesariospara describir la fuente en cuestión. Por ejemplo, un sistema de metadatos comúnentre los bibliotecarios, el catálogo de biblioteca, contiene un conjunto de registros demetadatos con elementos que describen un libro u otra publicación en una biblioteca:autor, título, fecha de creación o publicación, materia, y la signatura topográficaespecificando la localización de la publicación en el estante. La relación entre unregistro de metadatos y el recurso al que describe puede darse de una de estas dosformas:• Los elementos pueden estar en un registro separado del documento, como en elcaso del registro de un catálogo de bibliotecas; o,• Los metadatos pueden estar incluidos, incrustados, en el propio recurso.El concepto de metadatos antecede a Internet y a la Web pero, como se puedesuponer, el interés mundial por las normas y prácticas de metadatos ha estallado con elcrecimiento de la publicación electrónica y las bibliotecas digitales, y la concurrente"sobrecarga de información" que resulta de las grandes cantidades de datos digitalesdisponibles en línea. Actualmente hay un gran interés, y constituye una partefundamental del desarrollo del Web semántico, por adoptar a gran escala estándaresyprácticas descriptivas para los recursos electrónicos porque ello contribuirá a mejorarla recuperación de recursos relevantes en cualquier contexto.
  5. 5. Como señalan Weibel y Lagoze [Weibel,97], dos líderes en el campo del desarrollo demetadatos:"La asociación de metadatos descriptivos normalizados a los objetos de la red tiene elpotencial para mejorar sustancialmente las capacidades de localización/recuperación,facilitando búsquedas basadas en campos (p. ej. autor, título), permitiendo la indizaciónde objetos no textuales, y facilitando el acceso al contenido sustituido/referenciado quees distinto del acceso al contenido del propio recurso".Hay varias iniciativas de estandarización de metadatos dependiendo del dominio deaplicación, ya que un sólo estándar no puede recoger todos los requisitos específicos.Por ejemplo, los primeros campos en los que se empezó a investigar el uso demetadatos fueron en humanidades y lingüística a través de TEI, biología, y en lasciencias geoespaciales. A nosotros nos interesa conocer las iniciativas que tratan deestandarizar metadatos que permitan describir y recuperar recursos educativos.Tipos de MetadatosExisten diversos tipos de metadatos, cada uno con su propio formato para describirlos.Según la información que proporcionen, existen metadatos sobre: el contenido,aspectos formales, derechos de autor y el contexto. Según la función que proporcionan,se pueden clasificar en: Tipo Objetivo Describen e identifican recursos de información. Descriptivos Permite a los usuarios la búsqueda y recuperación de la información. Facilitan la navegación y la presentación de los recursos. Proporcionan información sobre Estructurales la estructura interna de los documentos, así como la relación entre ellos. Facilitan la gestión de conjuntos de Administrativos recursos. Incluye la gestión de derechos y sobre control de acceso y uso.
  6. 6. Hay varias iniciativas para tratar de normalizar y estandarizar los metadatos sobre losrecursos electrónicos. Quizá el más conocido sea el Dublin Core, creado inicialmentepara catalogar y compartir información sobre libros entre bibliotecas estadounidenses,pero que ahora se usa casi en la totalidad de las páginas web existentes en Internet.Existen otros muchos estándares con diferentes niveles de estructuración y de detalleoptimizados para el sistema por el fueron creados. Los metadatos pueden almacenarseen una base de datos, normalmente diseñada para tal efecto, o incrustados en lacabecera del propio documento sobre el que añaden información. En el contenido web,por ejemplo, la metainformación sobre una página web suele ir incluida en el propiodocumento HTML, mientras que otros contenidos como la sindicación de noticias ometadatos sobre archivos multimedia se proporcionan como documentos aparte.Usos de los Metadatos.Las aplicaciones son muy amplias. Principalmente se usan para la recuperación deinformación y para describir y catalogar documentos. Otros usos incluyen la definiciónde derechos de propiedad intelectual, valoración y evaluación de contenidos, etc. Losprincipales clientes suelen ser los robots y agentes de los motores de búsqueda. WEB SEMÁNTICA.La Web Semántica es la nueva generación de la Web, que intenta realizar un filtradoautomático preciso de la información. Para ello, es necesario hacer que la informaciónque reside en la Web sea entendible por las propias máquinas. Especialmente sucontenido, más allá de su simple estructura sintáctica.Con lo cual, podemos determinar que la Web Semántica trata sobre diferentes ámbitos,por un lado es un conjunto de lenguajes y procedimientos para poder añadir esasemántica a la información para que sea entendible por los agentes encargados deprocesarla. Y por el otro lado trata, el desarrollo y la construcción de los agentesencargados de procesar esa información y filtrar la que es útil para los usuarios o paraagentes que tienen que realizar una determinada función.Con este fin, los agentes deben recuperar y manipular la información pertinente, lo querequiere una integración sin fisuras con la Web y aprovechar totalmente lasinfraestructuras existentes.Al dotar a la Web por lo tanto, de semántica, se pueden obtener soluciones aproblemas habituales en la búsqueda de información gracias a la utilización de una
  7. 7. infraestructura común, mediante la cual, es posible compartir, procesar y transferirinformación de forma sencilla.Como punto adicional, la Web Semántica también trata la forma en la cual seimplementan servicios web fiables e interoperables a gran escala, creando una web deservicios interpretables e interoperables que agentes inteligentes puedan descubrir,ejecutar y componer automáticamente. RDF: estructura flexible para la recuperación de información basada en metadatos.El Resource Description Framework es una DTD (definición del tipo de documento) deXML o, como venimos diciendo, una aplicación de metadatos que utiliza XML a fin deproporcionar un marco estándar para la interoperabilidad en la descripción decontenidos web. Como señala [Miller, 1998], XML impone la necesidad de unarestricción estructural para proporcionar métodos inequívocos de expresión semántica.RDF no es más que la infraestructura que permite esa restricción gracias a lacodificación, reutilización e intercambio de metadatos estructurados. Con estasprerrogativas, interoperabilidad y estructuración, RDF es el modelo más promisoriopara asociar información sobre el contenido de los recursos web, y no es arriesgadodecir que promete ser el modelo de descripción de la información para las bibliotecasdigitales del siglo XXI, así como para optimizar, de forma generalizada, la búsqueda yrecuperación en la web.El RDF surge en agosto de 1997 el seno del Consorcio Web W3C, cuya actividad enrelación con los metadatos está apoyada por protagonistas muy influyentes en laescena industrial, tales como creadores de navegadores —Netscape, Microsoft— ymotores de búsqueda. Se nutre de los trabajos de varios colectivos como otrasiniciativas del W3C —PICS para el control de contenidos o P3P destinado asalvaguardar la privacidad en la web— y por supuesto, de los trabajos de la comunidadbibliotecaria en torno al Dublin Core (DC) que es uno de los modelos demetainformación que primero ha adoptado la sintaxis del RDF. En la fecha derealización de esta comunicación, y desde febrero de 1999, la especificación delmodelo y la sintaxis de RDF —tras muchos borradores de trabajo1 — es ya unarecomendación del Consorcio Web [W3C-RDF-R], y su esquema es, desde marzo deeste mismo año, una propuesta de recomendación [W3C-RDFS-PR].
  8. 8. WEB SERVICES.Un web service es una aplicación que puede ser descripta, publicada, localizada einvocada a través de una red, generalmente Internet. Combinan los mejores aspectosdel desarrollo basado en componentes y la Web.Al igual que los componentes, los web services son funcionalidades que se encuentrandentro de una caja negra, que pueden ser reutilizados sin preocuparse de cómo fueronimplementados. A diferencia de la actual tecnología de componentes, no son accedidospor medio de protocolos específicos del modelo de objetos como ser RMI, DCOM oIIOP; sino que son accedidos utilizando protocolos web como ser HTTP y XML.La interface de los web services esta definida en términos de los mensajes que elmismo acepta y retorna, por lo cual los consumidores de los web services pueden serimplementados en cualquier plataforma y en cualquier lenguaje de programación, solotiene que poder crear y consumir los mensajes definidos por la interface de los webservices.Conclusiones.La arquitectura de la información ha desarrollado grandes avances para la organizaciónde bases de datos bibliográficas, adaptando estas para que los procedimientos derecuperación de información sean más efectivos, rápidos y precisos.El uso de metadatos ha contribuido para que la clasificacion de la información tengamayores puntos de referencia, logrando con esto que se los sistemas de búsquedapuedan tomar mejores decisiones al momento de analizar que información puede serde mayor utilidad para mostrarse en los resultados.Lo anterior se enfoca en los nuevos sistemas de búsqueda inteligentes, basados en laweb semántica, que pretende interpretar las necesidades de información de losusuarios sin que estos últimos necesiten especificar complejos términos booleanospara obtener datos con mayor exactitud.Por último, la integración de servicios web para facilitar la arquitectura de la informaciónen la actualidad son de fácil acceso y de sencilla integración para los desarrolladoresde sitios web, esto con la finalidad de tener una world wide web mejor organizada.
  9. 9. Referencias. 1. Madrizova, C. (2008). Uso y manejo de la base de datos Ebsco Host. Consultado el 06 de julio de 2012, en http://www.tec.cr/sitios/Vicerrectoria/viesa/biblioteca/Documents/manual_ebsco.p df 2. Inegi. (s.f.). ¿Qué son los metadatos?. Consultado el 06 de julio de 2012, en http://antares.inegi.gob.mx/metadatos/metadat1.htm 3. Blanco, S. (s.f.). Metadatos. Consultado el 06 de julio de 2012, en http://www.infor.uva.es/~sblanco/Tesis/Metadatos.pdf 4. W3c. (s.f.). Guía breve de la web semántica. Consultado el 06 de julio de 2012, en http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica 5. MenéndezRodríguez, E. (s.f.). RDF: Un modelo de metadatos flexible para las bibliotecas digitales del próximo milenio. Consultado el 06 de julio de 2012, en http://www.bib.uc3m.es/~mendez/publicaciones/7jc99/rdf.htm 6. GX Technical. (s.f.). Web Services. Consultado el 06 de julio de 2012, en http://www.gxtechnical.com/gxdlsp/pub/genexus/internet/technicalpapers/web_se rvices.htm

×