Your SlideShare is downloading. ×
  • Like
 Indización.pdf  diapositiva
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Indización.pdf diapositiva

  • 1,292 views
Published

Diapositivas para exposición del tema Indización

Diapositivas para exposición del tema Indización

Published in Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,292
On SlideShare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
27
Comments
0
Likes
2

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Almacenamiento y Recuperación de la Información II INDIZACIÓN Lcdo. Guillermo Pérez pguillermoandres@gmail.com
  • 2. INDIZACIÓNLa indización de los documentos es un proceso complejo, que forma parte del procesamiento de la información, por el cual se representan en algún portador material características esenciales de los documentos que permiten su posterior recuperación sin tener que revisar toda la colección. Giráldez Rodríguez, R. (2004)
  • 3. INDIZACIÓNRepresentación del contenido de los documentos por medio de símbolos especiales, que extraídos del texto original, están recogidos en un lenguaje de información o de indización. Norma 5693 (Organización Internacional de Normalización)
  • 4. INDIZACIÓNEl término INDIZACIÓN se refiere a la asignación de una o más etiquetas que sirvan para identificarlo y/o describirlo y para facilitar su posterior recuperación… Lancaster W.
  • 5. Fases fundamentales de la indización de materia •Se revisa el documento para determinar el Análisis de contenido contenido. •Seleccionar las palabras clave del contenido. •Autor o del propio indizador.Traducción de los términos asignados en el análisis de contenido a los •Se consulta el vocabulario términos índices del vocabulario del controlado del sistema. lenguaje de la indización del sistema •Se organizan, de acuerdo con la forma que se haya establecido los términos utilizados para indizar los Organización del índice documentos de la colección y se obtiene el índice de materia
  • 6. Variables asociadas con el proceso de indización Grado de exhaustividadProfundidad La política y las reglas El IndizadorEspecificidad de indización El lenguaje de indización La Colección de Documentos
  • 7. Variables asociadas con el proceso de indización La política de indización. Reglas de indización Grado de La materia que abarca el contenidoexhaustividad de un documento es la totalidad de tópicos que tratan en el mismo. la exhaustividad en la indización de un documento se define como el número máximo de diferentes tópicos indizados Giráldez, R. (2004)
  • 8. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónProfundidad Se define como el número de diferentes términos seleccionados para indizar el documento. Esta variable también se denomina densidad de la indización. Giráldez, R. (2004)
  • 9. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónEspecificidad Es una propiedad semántica de los términos, es el nivel de detalle y exactitud con que se representa un concepto dado. Relación género/especie Giráldez, R. (2004)
  • 10. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónEl lenguaje de indización El vocabulario del lenguaje debe ser en la medida que sea posible específico, si por lo contrario carece de especificidad se convertirá en un freno para la indización específica. Giráldez, R. (2004)
  • 11. Consistencia en laindización(indizador 1) A B (indizador 2) Consistencia Giráldez, R. (2004)
  • 12. Lenguajes de recuperación de la información (LRI)Los LRI son lenguajes artificiales, es decir, lenguajes creados por el hombre, que se utilizan para indizar los documentos y las solicitudes con la finalidad de recuperar la información almacenada y satisfacer las demandas de los usuarios.
  • 13. Lenguajes de recuperación de la información (LRI)Los LRI tiene, al igual que las lenguas naturales, como mínimo tres componentes fundamentales: Vocabulario Sintaxis Reglas para su uso
  • 14. Vocabulario El vocabulario o léxico de un LRI es el conjuntode términos que se utiliza para expresar el contenido informacional de un documento… y pueden estar representadas por: •Palabras aisladas o combinaciones de palabras. •Códigos numéricos, alfabéticos o alfa-numéricos. •Códigos en combinación con palabras del lenguaje natural
  • 15. VocabularioPara garantizar que se cumpla elrasgo esencial de todo LRI, o sea queentre los términos y los conceptosexista una relación unívoca, esnecesario eliminar de su vocabulariola homonimia y la sinonimia
  • 16. Homonimia La homonimia se elimina con aclaraciones sobre los significados del término, las cuales se colocan entre paréntesis y a continuación de los vocablos que sea homógrafos, es decir una misma palabra Con dos o más significados.PLANTA (INSTALACIÓN INDUSTRIAL)PLANTA (PARTE INFERIOR DEL PIE)PLANTA (EN BOTÁNICA)
  • 17. Sinonimia La sinonimia se elimina estableciendo un conjunto de clases equivalentes entre los sinónimos, o casi-sinónimos, o sea entre dos o más palabras diferentes que tienen significados iguales o parecidos. USE o VÉASEHidratos de carbonoUSE CORBOHIDRATOS
  • 18. SintaxisLa sintaxis de un LRI es el conjunto de reglas para combinar los términos del vocabulario en cadenas, frases o unidades sintácticas capaces de expresar conceptos o significados más complejos o más abarcadores, que no podrían ser expresados si se utilizaran los términos del vocabulario de forma aislada… Formación de profesores. Química. Cuba. Cumbre de los Países no Alineados. Bolivia
  • 19. Cómo realizar la indizacióncon descriptores y epígrafes
  • 20. Tipos de descriptores y epígrafesa) Descriptores y epígrafes simples:EDUCACIÓNDERECHOEXISTENCIALISMOb) Descriptores y epígrafes compuestos:MEDICIONES DEL APRENDIZAJEPOLÍTICA CIENTÍFICAARTE Y SOCIEDAD
  • 21. Tipos de descriptores y epígrafesc) Descriptores y epígrafes biográficos:BARTÓK, BÉLA, 1881-1945.EINSTEIN, ALBERT, 1879-1955.d) Descriptores y epígrafes históricos o cronológicos:EDAD MEDIAEDAD DE PIEDRAHISTORIA ANTIGUA
  • 22. Tipos de descriptores y epígrafese) Descriptores y epígrafes étnicos:AZTECASINDIOS DE NORTEAMÉRICAINDIOS DE SURAMÉRICA
  • 23. Tipos de descriptores y epígrafesSubepígrafesa) Subepígrafes temáticos o de materiaCIENCIA-ENSEÑANZAEDUCACIÓN-HISTORIAa) Subepígrafes de formaQUÍMICA-BIBLIOGRAFÍAFÍSICA-MANUALESEDUCACIÓN-DICCIONARIO
  • 24. Tipos de descriptores y epígrafesSubepígrafesc) Subepígrafes de ubicación geográficaEDUCACIÓN SUPERIOR-ESPAÑAARTE-POLONIAEDUCACIÓN-CUBA
  • 25. Reglas sobre la presentación de los descriptores y epígrafe1. Forma del términoUtilizar, siempre que sea posible los sustantivos.Ejemplo: EVALUACIÓN en lugar de EVALUATIVONo utilizar verbos2. Número del términoUtilizar el singular para términos que expresan conceptos queno pueden contarse por unidades.Ejemplo: Nombres de disciplinas (QUÍMICA, FÍSICA, ETC.)Procesos (CAPACITACIÓN, POLITICA CIENTÍFICA)Materiales y propiedades específicas (UREA, FUERZA)
  • 26. Reglas sobre la presentación de los descriptores y epígrafes3. Forma de entradaSe utilizará la entrada directa. Únicamente en casos muyexcepcionales se hará la inversión de la entrada4. Se debe evitar la utilización de:Signos de puntuaciónAbreviaturas
  • 27. Lineamientos generales para la asignación de descriptores y epígrafes1. Se asignará el epígrafe o descriptor que defina de modo más preciso y específico el asunto que se desea indizar.2. Se añadirá a cada epígrafe los subepígrafes que sean necesarios para expresar del modo más preciso el asunto.3. Se utilizarán en la medida que sea posible, palabras en el idioma español.4. Asignar tantos descriptores o epígrafes que sean necesarios (máximo 8).
  • 28. Lineamientos generales para la asignación de descriptores y epígrafes5. Seleccionar entre los sinónimos, un término como epígrafe o descriptor representativo y se hará referencia de los otros términos equivalentes.6. No se debe dar entrada por la temática y la forma de presentación a un mismo documento.7. Si el nombre del país se considera un elemento necesario para la recuperación se añadirá el conjunto de descriptores del documento para que aparezca como una entrada en el índice.8. Se consultará las listas y los repertorios antes de crear nuevos términos.
  • 29. Precisar las diferencias entrepalabras clave y descriptores
  • 30. Palabras clave"...colección no depurada (sino puesta en orden alfabético sin eliminación de sinonimia, ni polisemia) de las palabras significativas, denominadas también no vacías (es decir, todas las palabras que no sean artículos, conjunciones, pronombres, preposiciones, numerales y ciertos verbos y adverbios), extraídas, de forma automática, por el ordenador, a partir del titulo, del resumen y, cada vez mas a menudo, del texto completo de los documentos registrados dentro de un sistema documental dado.“ Van Slype, 1991
  • 31. DescriptorTermino (palabra o expresión) que se ha escogido, a partir de un conjunto de sinónimos, de cuasisinónimos y de términos emparentados, para representar, de manera univoca, un concepto susceptible de intervenir en los documentos yen las consultas que se examinan dentro de un sistema documental dado. Van Slype, 1991Palabra o grupo de palabras incluidas en un tesauro y escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento o en una petición de búsqueda documental. AFNOR (Asociación Francesa de Normalización).
  • 32. Los Tesauros
  • 33. TesaurosLa norma ISO 2788-1986 define un tesauro como "un vocabulario controlado y dinámico, compuesto por términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento".Los lenguajes de indización, define un tesauro como "una lista estructurada de conceptos destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indización de los documentos y de las consultas". Van Slype,1991
  • 34. TesaurosRelaciones SemánticasRelaciones de equivalencia USE (relación entre el término no preferente y el término preferente)USE, UP (usado por), UF (usado por)
  • 35. TesaurosRelaciones SemánticasRelaciones jerárquicas: Son relaciones asimétricas, establecidas entre los descriptores, en la que un término es superior o genérico de otro… se van agrupando en disciplinas y sub-disciplinas.TE (término específico), BT (término más amplio), NT (término más específico)
  • 36. TesaurosRelaciones SemánticasRelaciones asociativas: Son las relaciones asimétricas establecidas entre descriptores de distintas familias, distintas a las jerárquicas o de equivalencia, y que designan conceptos capaces de evocar mutuamente, por asociación de ideas, relaciones entre ellos.TR (término relacionado)
  • 37. TesaurosNota de Alcancese usan para limitar el uso de los descriptores, para escribir un posible sentido del término cuando este tiene diferentes significados, pues es usado en diferentes disciplinas, no forma parte del descriptor, aunque aparezca en el tesauro.