Indización.pdf diapositiva

2,486 views
2,290 views

Published on

Diapositivas para exposición del tema Indización

Published in: Education
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,486
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
56
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Indización.pdf diapositiva

  1. 1. Almacenamiento y Recuperación de la Información II INDIZACIÓN Lcdo. Guillermo Pérez pguillermoandres@gmail.com
  2. 2. INDIZACIÓNLa indización de los documentos es un proceso complejo, que forma parte del procesamiento de la información, por el cual se representan en algún portador material características esenciales de los documentos que permiten su posterior recuperación sin tener que revisar toda la colección. Giráldez Rodríguez, R. (2004)
  3. 3. INDIZACIÓNRepresentación del contenido de los documentos por medio de símbolos especiales, que extraídos del texto original, están recogidos en un lenguaje de información o de indización. Norma 5693 (Organización Internacional de Normalización)
  4. 4. INDIZACIÓNEl término INDIZACIÓN se refiere a la asignación de una o más etiquetas que sirvan para identificarlo y/o describirlo y para facilitar su posterior recuperación… Lancaster W.
  5. 5. Fases fundamentales de la indización de materia •Se revisa el documento para determinar el Análisis de contenido contenido. •Seleccionar las palabras clave del contenido. •Autor o del propio indizador.Traducción de los términos asignados en el análisis de contenido a los •Se consulta el vocabulario términos índices del vocabulario del controlado del sistema. lenguaje de la indización del sistema •Se organizan, de acuerdo con la forma que se haya establecido los términos utilizados para indizar los Organización del índice documentos de la colección y se obtiene el índice de materia
  6. 6. Variables asociadas con el proceso de indización Grado de exhaustividadProfundidad La política y las reglas El IndizadorEspecificidad de indización El lenguaje de indización La Colección de Documentos
  7. 7. Variables asociadas con el proceso de indización La política de indización. Reglas de indización Grado de La materia que abarca el contenidoexhaustividad de un documento es la totalidad de tópicos que tratan en el mismo. la exhaustividad en la indización de un documento se define como el número máximo de diferentes tópicos indizados Giráldez, R. (2004)
  8. 8. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónProfundidad Se define como el número de diferentes términos seleccionados para indizar el documento. Esta variable también se denomina densidad de la indización. Giráldez, R. (2004)
  9. 9. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónEspecificidad Es una propiedad semántica de los términos, es el nivel de detalle y exactitud con que se representa un concepto dado. Relación género/especie Giráldez, R. (2004)
  10. 10. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónEl lenguaje de indización El vocabulario del lenguaje debe ser en la medida que sea posible específico, si por lo contrario carece de especificidad se convertirá en un freno para la indización específica. Giráldez, R. (2004)
  11. 11. Consistencia en laindización(indizador 1) A B (indizador 2) Consistencia Giráldez, R. (2004)
  12. 12. Lenguajes de recuperación de la información (LRI)Los LRI son lenguajes artificiales, es decir, lenguajes creados por el hombre, que se utilizan para indizar los documentos y las solicitudes con la finalidad de recuperar la información almacenada y satisfacer las demandas de los usuarios.
  13. 13. Lenguajes de recuperación de la información (LRI)Los LRI tiene, al igual que las lenguas naturales, como mínimo tres componentes fundamentales: Vocabulario Sintaxis Reglas para su uso
  14. 14. Vocabulario El vocabulario o léxico de un LRI es el conjuntode términos que se utiliza para expresar el contenido informacional de un documento… y pueden estar representadas por: •Palabras aisladas o combinaciones de palabras. •Códigos numéricos, alfabéticos o alfa-numéricos. •Códigos en combinación con palabras del lenguaje natural
  15. 15. VocabularioPara garantizar que se cumpla elrasgo esencial de todo LRI, o sea queentre los términos y los conceptosexista una relación unívoca, esnecesario eliminar de su vocabulariola homonimia y la sinonimia
  16. 16. Homonimia La homonimia se elimina con aclaraciones sobre los significados del término, las cuales se colocan entre paréntesis y a continuación de los vocablos que sea homógrafos, es decir una misma palabra Con dos o más significados.PLANTA (INSTALACIÓN INDUSTRIAL)PLANTA (PARTE INFERIOR DEL PIE)PLANTA (EN BOTÁNICA)
  17. 17. Sinonimia La sinonimia se elimina estableciendo un conjunto de clases equivalentes entre los sinónimos, o casi-sinónimos, o sea entre dos o más palabras diferentes que tienen significados iguales o parecidos. USE o VÉASEHidratos de carbonoUSE CORBOHIDRATOS
  18. 18. SintaxisLa sintaxis de un LRI es el conjunto de reglas para combinar los términos del vocabulario en cadenas, frases o unidades sintácticas capaces de expresar conceptos o significados más complejos o más abarcadores, que no podrían ser expresados si se utilizaran los términos del vocabulario de forma aislada… Formación de profesores. Química. Cuba. Cumbre de los Países no Alineados. Bolivia
  19. 19. Cómo realizar la indizacióncon descriptores y epígrafes
  20. 20. Tipos de descriptores y epígrafesa) Descriptores y epígrafes simples:EDUCACIÓNDERECHOEXISTENCIALISMOb) Descriptores y epígrafes compuestos:MEDICIONES DEL APRENDIZAJEPOLÍTICA CIENTÍFICAARTE Y SOCIEDAD
  21. 21. Tipos de descriptores y epígrafesc) Descriptores y epígrafes biográficos:BARTÓK, BÉLA, 1881-1945.EINSTEIN, ALBERT, 1879-1955.d) Descriptores y epígrafes históricos o cronológicos:EDAD MEDIAEDAD DE PIEDRAHISTORIA ANTIGUA
  22. 22. Tipos de descriptores y epígrafese) Descriptores y epígrafes étnicos:AZTECASINDIOS DE NORTEAMÉRICAINDIOS DE SURAMÉRICA
  23. 23. Tipos de descriptores y epígrafesSubepígrafesa) Subepígrafes temáticos o de materiaCIENCIA-ENSEÑANZAEDUCACIÓN-HISTORIAa) Subepígrafes de formaQUÍMICA-BIBLIOGRAFÍAFÍSICA-MANUALESEDUCACIÓN-DICCIONARIO
  24. 24. Tipos de descriptores y epígrafesSubepígrafesc) Subepígrafes de ubicación geográficaEDUCACIÓN SUPERIOR-ESPAÑAARTE-POLONIAEDUCACIÓN-CUBA
  25. 25. Reglas sobre la presentación de los descriptores y epígrafe1. Forma del términoUtilizar, siempre que sea posible los sustantivos.Ejemplo: EVALUACIÓN en lugar de EVALUATIVONo utilizar verbos2. Número del términoUtilizar el singular para términos que expresan conceptos queno pueden contarse por unidades.Ejemplo: Nombres de disciplinas (QUÍMICA, FÍSICA, ETC.)Procesos (CAPACITACIÓN, POLITICA CIENTÍFICA)Materiales y propiedades específicas (UREA, FUERZA)
  26. 26. Reglas sobre la presentación de los descriptores y epígrafes3. Forma de entradaSe utilizará la entrada directa. Únicamente en casos muyexcepcionales se hará la inversión de la entrada4. Se debe evitar la utilización de:Signos de puntuaciónAbreviaturas
  27. 27. Lineamientos generales para la asignación de descriptores y epígrafes1. Se asignará el epígrafe o descriptor que defina de modo más preciso y específico el asunto que se desea indizar.2. Se añadirá a cada epígrafe los subepígrafes que sean necesarios para expresar del modo más preciso el asunto.3. Se utilizarán en la medida que sea posible, palabras en el idioma español.4. Asignar tantos descriptores o epígrafes que sean necesarios (máximo 8).
  28. 28. Lineamientos generales para la asignación de descriptores y epígrafes5. Seleccionar entre los sinónimos, un término como epígrafe o descriptor representativo y se hará referencia de los otros términos equivalentes.6. No se debe dar entrada por la temática y la forma de presentación a un mismo documento.7. Si el nombre del país se considera un elemento necesario para la recuperación se añadirá el conjunto de descriptores del documento para que aparezca como una entrada en el índice.8. Se consultará las listas y los repertorios antes de crear nuevos términos.
  29. 29. Precisar las diferencias entrepalabras clave y descriptores
  30. 30. Palabras clave"...colección no depurada (sino puesta en orden alfabético sin eliminación de sinonimia, ni polisemia) de las palabras significativas, denominadas también no vacías (es decir, todas las palabras que no sean artículos, conjunciones, pronombres, preposiciones, numerales y ciertos verbos y adverbios), extraídas, de forma automática, por el ordenador, a partir del titulo, del resumen y, cada vez mas a menudo, del texto completo de los documentos registrados dentro de un sistema documental dado.“ Van Slype, 1991
  31. 31. DescriptorTermino (palabra o expresión) que se ha escogido, a partir de un conjunto de sinónimos, de cuasisinónimos y de términos emparentados, para representar, de manera univoca, un concepto susceptible de intervenir en los documentos yen las consultas que se examinan dentro de un sistema documental dado. Van Slype, 1991Palabra o grupo de palabras incluidas en un tesauro y escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento o en una petición de búsqueda documental. AFNOR (Asociación Francesa de Normalización).
  32. 32. Los Tesauros
  33. 33. TesaurosLa norma ISO 2788-1986 define un tesauro como "un vocabulario controlado y dinámico, compuesto por términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento".Los lenguajes de indización, define un tesauro como "una lista estructurada de conceptos destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indización de los documentos y de las consultas". Van Slype,1991
  34. 34. TesaurosRelaciones SemánticasRelaciones de equivalencia USE (relación entre el término no preferente y el término preferente)USE, UP (usado por), UF (usado por)
  35. 35. TesaurosRelaciones SemánticasRelaciones jerárquicas: Son relaciones asimétricas, establecidas entre los descriptores, en la que un término es superior o genérico de otro… se van agrupando en disciplinas y sub-disciplinas.TE (término específico), BT (término más amplio), NT (término más específico)
  36. 36. TesaurosRelaciones SemánticasRelaciones asociativas: Son las relaciones asimétricas establecidas entre descriptores de distintas familias, distintas a las jerárquicas o de equivalencia, y que designan conceptos capaces de evocar mutuamente, por asociación de ideas, relaciones entre ellos.TR (término relacionado)
  37. 37. TesaurosNota de Alcancese usan para limitar el uso de los descriptores, para escribir un posible sentido del término cuando este tiene diferentes significados, pues es usado en diferentes disciplinas, no forma parte del descriptor, aunque aparezca en el tesauro.

×