Análisis documental

4,744 views

Published on

Operaciones que configuran el análisis documental, definiciones normativas de AD, análisis de páginas web, metadatos, Dublin Core Metadata

Published in: Education
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,744
On SlideShare
0
From Embeds
0
Number of Embeds
15
Actions
Shares
0
Downloads
81
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Análisis documental

  1. 1. Análisis Documental Descripción Física Análisis de Contenidos Indización Resumen Clasificación Otros datos Palabras Clave Descriptores
  2. 2. Teoría integradora AD > AC AD = DF + AC Teoría restrictiva AD=AC
  3. 3. Definición de AD El análisis documental es un conjunto de operaciones* encaminadas a representar un documento y su contenido bajo una forma diferente de su forma original, con la finalidad posibilitar su recuperación** posterior e identificarlo *Unas intelectuales y otras mecánicas **A partir de los máximos elementos posibles y de modo automatizadoBBDD
  4. 4. AD Definición de la norma UNE 50-113 Operación que consiste en examinar un documento para encontrar sus elementos esenciales y las relaciones entre ellos
  5. 5. En el análisis documental se produce un triple proceso 1.- Un proceso de comunicación, ya que posibilita y permite la recuperación de información para transmitirla 2.- Un proceso de transformación, en el que un documento primario sometido a las operaciones de análisis se convierte en otro documento secundario de más fácil acceso y difusión 3.- Un proceso analítico-sintético, porque la información es estudiada, interpretada y sintetizada minuciosamente para dar lugar a un nuevo documento que lo representa de modo abreviado pero preciso
  6. 6. Toda la información registrada, en el soporte que sea, puede ser objeto de análisis documental
  7. 7. Núm.Registro:255203 Autores:KEEFER, ALICE Título:FIRSTSEARCH: SERVICIO EN LINEA PARA EL USUARIO FINAL Título otros idiomas: FIRSTSEARCH: SERVEI EN LINIA PER A L'USUARI FINAL ISSN:0214-0349 Revista:Item. Revista de Biblioteconomía i Documentació Datosfuente:1994,(16):34-42 Tipodocumento:Artículo de revista Lengua:Catalán Resumen: FirstSearch es el nuevo servicio de teledocumentación de OCLC, que cubre tanto el acceso y la consulta de bases de datos como la obtención del documento original. 5.753 instituciones lo utilizan actualmente. En Europa hay 152 bibliotecas usuarias: 68 universitarias, 6 bibliotecas públicas y 78 de empresas. De las 50 bases de datos que el servicio ofrece, 5 se distribuyen exclusivamente a través del mismo. Se describen ArticleFirst, ContentsFirst, FastDoc, NetFirst y PapersFirst. Se describen las modalidades de consulta y los resultados de una encuesta que revelan una gran aceptación por parte de los usuarios y se ilustran los costes de obtención de documentos a partir de diversos proveedores y medios de envío Descriptores: Catálogos de acceso público en línea ;Bases de datos ; Acceso a la información ; Acceso al documento Identificadores:OCLC ; FIRSTSEARCH Clasificación: 200501 Catálogos convencionales y automatizados (OPACS) 200402 Catalogación
  8. 8. •PUBLICACIO: EL PAIS •DATA DE PUBLICACIO: 24-06-2001 •MES DE PUBLICACIO: JUNIO •ANY DE PUBLICACIO: 2001 •PAGINA INICIAL:30 •PAGINA FINAL:30 •RESUMEN: Evolución de los incendios forestales en España de 1994 a 2000 •AMBIT: ESPANYA •CLASSIFICACIO: MEDI AMBIENT •DESCRIPTORS: INCENDIS FORESTALS •PARAULES CLAU: SUPERFICIE FORESTAL CREMADA •DATA DE CARREGA: 26-06-2001 •TIPUS DE DOCUMENT:DADES ESTADISTIQUES •NOTES: •ANALISTA:tmdo10
  9. 9. <HTML>   <HEAD>  <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso- 8859-1"> <META NAME="keywords" CONTENT="MALVINE, Manuscripts and letters,  ONE, Metadata, EAD, Encoded Archival Description, library, museum, ANSI  Z39.50, Z3950, Distributed Search, Retrieval, query broadcasting"> <META NAME="description" CONTENT="MALVINE opens new and  enhanced access to disparate holdings  of modern manuscripts and letters,  kept and catalogued in European  libraries, archives, documentation centres  and museums."> <META NAME="LANGUAGE" CONTENT="de-an"> <META NAME="security" CONTENT="public"> <META NAME="AUTHOR" CONTENT="JOANNEUM RESEARCH, MALVINE  CONSORTIUM"> <TITLE>MALVINE - Manuscripts and Letters via Integrated Networks in  Europe</TITLE> <LINK HREF="styles.css" REL="STYLESHEET"> </HEAD> . . . . . . </HTML> OJO! Representación del documento dentro del documentometadatos
  10. 10. • El análisis documental representa la  información de un documento en un  registro estructurado, reduce todos los  datos descriptivos físicos y de  contenido en un esquema uniforme
  11. 11. Análisis Documental Descripción Física Análisis de Contenidos Indización Resumen Clasificación Otros datos Palabras Clave Descriptores
  12. 12. • Descripción externa del documentoIdentifica los datos físicos de un documento que lo distinguen de otro • Actúa sobre el soporte • Su finalidad principal es permitir localizar los documentos. Descripción Física
  13. 13. Datos a consignar: Depende del tipo de documento, de lo que se considere como unidad documental y del soporte. Artículo de revista Noticia de un informativo Título del artículo Título de la noticia Autor/es del artículo Programa Título de la publicación Parte Número de la publicación Director Fecha publicación Colaboradores Mes ( o periodo) Fecha de emisión Año de publicación Fecha de grabación Página inicial Formato Página final Número de cinta Time code inicio Time code final ... Descripción Física
  14. 14. Opera sobre el contenido temático del  documento Logra una representación de la información  tratada Se divide en varias operaciones:  Indización Resumen Clasificación Análisis de Contenidos
  15. 15. • Indización o descripción característica  Análisis de Contenidos INDIZACIÓN Palabras clave Descriptores Por asignaciónPor extracción
  16. 16. Análisis de Contenidos Indización Palabras clave - Descriptores • Hay dos modalidades diferentes pero complementarias de indización – Palabras clave y Descriptores • Se consignan en campos diferentes (Ver formularios) • Con frecuencia se usa el término palabra clave como sinónimo de descriptor pero esto es INCORRECTO • Las palabras clave pueden ser términos simples o compuestos y sus sinónimos, cuasisinónimos, antónimos, variaciones ortográficas... • No suele existir un control estricto del vocabulario empleado en el campo de palabras clave, sin embargo: – Las palabras clave con una frecuencia alta acaban siendo descriptores – Las palabras clave son una de las fuentes a considerar a la hora de actualizar (tarea de mantenimiento) los lenguajes documentales empleados en un centro de documentación
  17. 17. Las palabras clave se pueden obtener de dos maneras: Por extracción o derivación: los términos se toman del texto que se indiza. Consultando fuentes externas Indización orientada por documentos ya indizados (IOD) Por asignación: Indización orientada por peticiones (IOP) Los términos NO figuran en el texto Pensando Norma UNE 50-121 Análisis de Contenidos Indización Palabras clave
  18. 18. • Son términos normalizados, formalizados, homologados que pertenecen a un lenguaje documental o controlado • Representan sin ambigüedad los conceptos tratados ya que hacen referencia a un único semantema • Son los términos preferentes de un lenguaje controlado Análisis de Contenidos Indización Descriptores
  19. 19. • Resumen o descripción sustancial – Indicativo o descriptivo: indica el tipo de documento, los principales temas tratados y cómo se tratan – Informativo o analítico: facilita la máxima información posible cuantitativa o cualitativa, o ambas, contenida en un documento – Selectivo:refleja sólo aquellas partes del texto que parecen esenciales para una categoría de usuarios determinada » Leer ejemplos – Mixtos; de conclusiones; estructurados. Análisis de Contenidos RESUMEN (ABSTRACT)
  20. 20. • Clasificar: Ordenar o disponer por clases definidas según el contenido del propio documento • Los sistemas clasificatorios se caracterizan por sus estructuras jerárquicas – De los conceptos más amplios a los más específicos » Ejemplos: Análisis de Contenidos CLASIFICACIÓN
  21. 21. • TRABAJO – Empleo – Paro – Conflictividad laboral – Legislación laboral • Calendario laboral – Negociación colectiva • Concertación social • Convenios • Salarios – Organizaciones empresariales ----------------------------------------------------------------------------------------------------------------------- Producción científica Revistas científicas Factor de impacto Análisis bibliométrico Evaluación de revistas Gestión de la información Gestión del conocimiento Selección de documentos Inteligencia competitiva Intranets
  22. 22. • Idioma original del documento • Filiación del autor • Número de referencias que aporta el documento • Tipo de documento • Nivel • URL Otros datos
  23. 23. Reflejo del AD en los campos de un registro • Campos descriptivosse derivan de la descripción física • Campos analíticosse derivan del análisis de contenidos • Campos de control comentar lo del dossier
  24. 24. “Análisis de páginas web” “Reinvención” de la Documentación: Crecimiento de la información en Internet imposibilidad de recuperarla de modo preciso necesidad de estructurarla para recuperarlaanálisis documental a.- externo al documento b.- en el propio documento
  25. 25. Análisis documental de páginas web – Los metadatos • El término metadato aplicado a la información distribuída en Internet se define como “datos sobre de datos”. • cualquier dato usado para ayudar a identificar, describir y localizar los recursos electrónicos en un entorno de red • propiedades identificativas o descriptivas que se pueden asociar a un recurso de información electrónico • “Información legible por ordenador sobre recursos web” (Tim Berners-Lee ) Docs. Electrónicos – En el documento
  26. 26. • Necesidad de los lenguajes de marcas que permitan identificar las sintaxis en las que se definen las estructuras de metadatos • Existen diversas iniciativas de metadatos para normalizar la información incluída en un documento web e intentar facilitar una recuperación fiable por parte de los motores de búsqueda. – DC – TEI – GILS – EAD – ...
  27. 27. • Información que contienen los metadatos – Descriptiva – Contenidos – Valoración contenidos – Para el tratamiento de los datos Los metadatos a diferencia de los lenguajes de marcado se incluyen todos juntos al principio del documento web.
  28. 28. Dublin Core Metadata • <META NAME=”DC.Título” CONTENT=” · Título: Nombre o título asignado al documento o a la fuente. <META NAME=”DC.Autor” CONTENT=” · Autor o creador: Creador intelectual del contenido del documento o de la fuente. <META NAME=”DC.Materia” CONTENT=” · Materia: Palabras claves o frases que resumen el contenido de un documento o de la fuente, el empleo de vocabularios controlados y esquemas de clasificación formales es aconsejable. <META NAME=”DC.Resumen” CONTENT=” · Resumen: Se trata de un resumen o descripción textual del documento en caso de documentos como objetos y se hará descripción del contenido para fuentes visuales. <META NAME=”DC.Editor” CONTENT=” ·Editor: Editor o entidad responsable de la publicación del documento.
  29. 29. • <META NAME=”DC.Otras contribuciones” CONTENT=” · Otras contribuciones: Otros colaboradores u otras menciones de responsabilidad, que hayan contribuído al contenido intelectual del documento pero cuyas aportaciones sean secundarias respecto al elemento autor o creador <META NAME=”DC.Fecha” CONTENT=” · Fecha de publicación: Fecha de creación de la fuente. <META NAME=”DC.Tipo de recurso” CONTENT=” · Tipo de recurso: Categoría del recurso, tales como revista, diccionario, poema, informe técnico, directorio. Se espera que el elemento “Tipo de recurso” pueda escogerse de una relación de tipos predefinida. <META NAME=”DC.Formato” CONTENT=” · Formato: Sirve para identificar el programa informático y el equipo material, como texto/html; ASCII; fichero postscript; imagen JPEG, etc. El elemento Formato se asignará desde una lista predefinida, como la de Internet Media Types (MIME Media types). Actualmente la única opción disponible es texto/html.
  30. 30. • <META NAME=”DC.Identificador” CONTENT=” · Identificador del recurso: Código o número único, individualizado e internacional que identifica la fuente. Por ejemplo el URL (Uniform Resource Locator) <META NAME=”DC.Fuente” CONTENT=” · Fuente actual: Para versiones, adaptaciones, revisiones de documentos originales. Trabajo, impreso o electrónico, del que proviene el recurso, si esto ocurre. <META NAME=”DC.Lengua” CONTENT=” · Lengua: Lengua o lenguas en la que está el contenido intelectual de la obra, Ejemplos: en, de, es, fi, fr, ja, th, zh. <META NAME=”DC. Relación CONTENT=” · Relación : Relaciones con otros recursos.
  31. 31. • <META NAME=”DC.Cobertura” CONTENT=” · Cobertura: Cobertura espacio temporal. Se refiere a una región física, uso de coordenadas (longitud y latitud) o nombres de lugares. La temporal se refiere a la temporalidad del contenido del recurso, no a la fecha de creación. <META NAME=”DC.Derechos” CONTENT=” · Derechos: Copyright u otros. • Comentar división bibliografía

×