Almacenamiento y Recuperación de la Información II        INDIZACIÓN                                    Lcdo. Guillermo Pé...
INDIZACIÓNLa indización de los documentos es un proceso  complejo, que forma parte del procesamiento de  la información, p...
INDIZACIÓNRepresentación del contenido de los documentos por medio de símbolos especiales, que extraídos del texto origina...
INDIZACIÓNEl término INDIZACIÓN se refiere a la  asignación de una o más etiquetas que  sirvan para identificarlo y/o desc...
Fases fundamentales de la indización        de materia                                         •Se revisa el documento    ...
Variables asociadas con el proceso       de indización   Grado de exhaustividadProfundidad       La política y            ...
Variables asociadas con el proceso       de indización  La política de indización. Reglas de indización  Grado de         ...
Variables asociadas con el proceso       de indización    La política de indización. Reglas de indizaciónProfundidad      ...
Variables asociadas con el proceso        de indización La política de indización. Reglas de indizaciónEspecificidad      ...
Variables asociadas con el proceso        de indización La política de indización. Reglas de indizaciónEl lenguaje de  ind...
Consistencia en laindización(indizador 1) A      B (indizador 2)  Consistencia                  Giráldez, R. (2004)
Lenguajes de recuperación de la información (LRI)Los LRI son lenguajes artificiales, es  decir, lenguajes creados por el  ...
Lenguajes de recuperación    de la información (LRI)Los LRI tiene, al igual que las lenguas  naturales, como mínimo tres c...
Vocabulario  El vocabulario o léxico de un LRI es el conjuntode términos que se utiliza para expresar el contenido informa...
VocabularioPara garantizar que se cumpla elrasgo esencial de todo LRI, o sea queentre los términos y los conceptosexista u...
Homonimia       La homonimia se elimina con aclaraciones           sobre los significados del término,       las cuales se...
Sinonimia    La sinonimia se elimina estableciendo un conjunto de clases equivalentes entre los sinónimos, o casi-sinónimo...
SintaxisLa sintaxis de un LRI es el conjunto de  reglas para combinar los términos del  vocabulario en cadenas, frases o  ...
Cómo realizar la indizacióncon descriptores y epígrafes
Tipos de descriptores y      epígrafesa) Descriptores y epígrafes simples:EDUCACIÓNDERECHOEXISTENCIALISMOb) Descriptores y...
Tipos de descriptores y      epígrafesc) Descriptores y epígrafes biográficos:BARTÓK, BÉLA, 1881-1945.EINSTEIN, ALBERT, 18...
Tipos de descriptores y      epígrafese) Descriptores y epígrafes étnicos:AZTECASINDIOS DE NORTEAMÉRICAINDIOS DE SURAMÉRICA
Tipos de descriptores y      epígrafesSubepígrafesa) Subepígrafes temáticos o de materiaCIENCIA-ENSEÑANZAEDUCACIÓN-HISTORI...
Tipos de descriptores y     epígrafesSubepígrafesc) Subepígrafes de ubicación geográficaEDUCACIÓN SUPERIOR-ESPAÑAARTE-POLO...
Reglas sobre la presentación         de los descriptores y epígrafe1. Forma del términoUtilizar, siempre que sea posible l...
Reglas sobre la presentación         de los descriptores y epígrafes3. Forma de entradaSe utilizará la entrada directa. Ún...
Lineamientos generales para la         asignación de descriptores y         epígrafes1.   Se asignará el epígrafe o descri...
Lineamientos generales para la        asignación de descriptores y        epígrafes5. Seleccionar entre los sinónimos, un ...
Precisar las diferencias entrepalabras clave y descriptores
Palabras clave"...colección no depurada (sino puesta en orden alfabético    sin eliminación de sinonimia, ni polisemia) de...
DescriptorTermino (palabra o expresión) que se ha escogido, a partir de un  conjunto de sinónimos, de cuasisinónimos y de ...
Los Tesauros
TesaurosLa norma ISO 2788-1986 define un tesauro como "un vocabulario   controlado y dinámico, compuesto por términos que ...
TesaurosRelaciones SemánticasRelaciones de equivalencia USE (relación entre el término no preferente y el término preferen...
TesaurosRelaciones SemánticasRelaciones jerárquicas: Son relaciones asimétricas,  establecidas entre los descriptores, en ...
TesaurosRelaciones SemánticasRelaciones asociativas: Son las relaciones  asimétricas establecidas entre descriptores de  d...
TesaurosNota de Alcancese usan para limitar el uso de los  descriptores, para escribir un posible  sentido del término cua...
Upcoming SlideShare
Loading in …5
×

Indización.pdf diapositiva

3,104 views

Published on

Diapositivas para exposición didactica

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,104
On SlideShare
0
From Embeds
0
Number of Embeds
169
Actions
Shares
0
Downloads
43
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Indización.pdf diapositiva

  1. 1. Almacenamiento y Recuperación de la Información II INDIZACIÓN Lcdo. Guillermo Pérez pguillermoandres@gmail.com
  2. 2. INDIZACIÓNLa indización de los documentos es un proceso complejo, que forma parte del procesamiento de la información, por el cual se representan en algún portador material características esenciales de los documentos que permiten su posterior recuperación sin tener que revisar toda la colección. Giráldez Rodríguez, R. (2004)
  3. 3. INDIZACIÓNRepresentación del contenido de los documentos por medio de símbolos especiales, que extraídos del texto original, están recogidos en un lenguaje de información o de indización. Norma 5693 (Organización Internacional de Normalización)
  4. 4. INDIZACIÓNEl término INDIZACIÓN se refiere a la asignación de una o más etiquetas que sirvan para identificarlo y/o describirlo y para facilitar su posterior recuperación… Lancaster W.
  5. 5. Fases fundamentales de la indización de materia •Se revisa el documento para determinar el Análisis de contenido contenido. •Seleccionar las palabras clave del contenido. •Autor o del propio indizador.Traducción de los términos asignados en el análisis de contenido a los •Se consulta el vocabulario términos índices del vocabulario del controlado del sistema. lenguaje de la indización del sistema •Se organizan, de acuerdo con la forma que se haya establecido los términos utilizados para indizar los Organización del índice documentos de la colección y se obtiene el índice de materia
  6. 6. Variables asociadas con el proceso de indización Grado de exhaustividadProfundidad La política y las reglas El IndizadorEspecificidad de indización El lenguaje de indización La Colección de Documentos
  7. 7. Variables asociadas con el proceso de indización La política de indización. Reglas de indización Grado de La materia que abarca el contenidoexhaustividad de un documento es la totalidad de tópicos que tratan en el mismo. la exhaustividad en la indización de un documento se define como el número máximo de diferentes tópicos indizados Giráldez, R. (2004)
  8. 8. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónProfundidad Se define como el número de diferentes términos seleccionados para indizar el documento. Esta variable también se denomina densidad de la indización. Giráldez, R. (2004)
  9. 9. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónEspecificidad Es una propiedad semántica de los términos, es el nivel de detalle y exactitud con que se representa un concepto dado. Relación género/especie Giráldez, R. (2004)
  10. 10. Variables asociadas con el proceso de indización La política de indización. Reglas de indizaciónEl lenguaje de indización El vocabulario del lenguaje debe ser en la medida que sea posible específico, si por lo contrario carece de especificidad se convertirá en un freno para la indización específica. Giráldez, R. (2004)
  11. 11. Consistencia en laindización(indizador 1) A B (indizador 2) Consistencia Giráldez, R. (2004)
  12. 12. Lenguajes de recuperación de la información (LRI)Los LRI son lenguajes artificiales, es decir, lenguajes creados por el hombre, que se utilizan para indizar los documentos y las solicitudes con la finalidad de recuperar la información almacenada y satisfacer las demandas de los usuarios.
  13. 13. Lenguajes de recuperación de la información (LRI)Los LRI tiene, al igual que las lenguas naturales, como mínimo tres componentes fundamentales: Vocabulario Sintaxis Reglas para su uso
  14. 14. Vocabulario El vocabulario o léxico de un LRI es el conjuntode términos que se utiliza para expresar el contenido informacional de un documento… y pueden estar representadas por: •Palabras aisladas o combinaciones de palabras. •Códigos numéricos, alfabéticos o alfa-numéricos. •Códigos en combinación con palabras del lenguaje natural
  15. 15. VocabularioPara garantizar que se cumpla elrasgo esencial de todo LRI, o sea queentre los términos y los conceptosexista una relación unívoca, esnecesario eliminar de su vocabulariola homonimia y la sinonimia
  16. 16. Homonimia La homonimia se elimina con aclaraciones sobre los significados del término, las cuales se colocan entre paréntesis y a continuación de los vocablos que sea homógrafos, es decir una misma palabra Con dos o más significados.PLANTA (INSTALACIÓN INDUSTRIAL)PLANTA (PARTE INFERIOR DEL PIE)PLANTA (EN BOTÁNICA)
  17. 17. Sinonimia La sinonimia se elimina estableciendo un conjunto de clases equivalentes entre los sinónimos, o casi-sinónimos, o sea entre dos o más palabras diferentes que tienen significados iguales o parecidos. USE o VÉASEHidratos de carbonoUSE CORBOHIDRATOS
  18. 18. SintaxisLa sintaxis de un LRI es el conjunto de reglas para combinar los términos del vocabulario en cadenas, frases o unidades sintácticas capaces de expresar conceptos o significados más complejos o más abarcadores, que no podrían ser expresados si se utilizaran los términos del vocabulario de forma aislada… Formación de profesores. Química. Cuba. Cumbre de los Países no Alineados. Bolivia
  19. 19. Cómo realizar la indizacióncon descriptores y epígrafes
  20. 20. Tipos de descriptores y epígrafesa) Descriptores y epígrafes simples:EDUCACIÓNDERECHOEXISTENCIALISMOb) Descriptores y epígrafes compuestos:MEDICIONES DEL APRENDIZAJEPOLÍTICA CIENTÍFICAARTE Y SOCIEDAD
  21. 21. Tipos de descriptores y epígrafesc) Descriptores y epígrafes biográficos:BARTÓK, BÉLA, 1881-1945.EINSTEIN, ALBERT, 1879-1955.d) Descriptores y epígrafes históricos o cronológicos:EDAD MEDIAEDAD DE PIEDRAHISTORIA ANTIGUA
  22. 22. Tipos de descriptores y epígrafese) Descriptores y epígrafes étnicos:AZTECASINDIOS DE NORTEAMÉRICAINDIOS DE SURAMÉRICA
  23. 23. Tipos de descriptores y epígrafesSubepígrafesa) Subepígrafes temáticos o de materiaCIENCIA-ENSEÑANZAEDUCACIÓN-HISTORIAa) Subepígrafes de formaQUÍMICA-BIBLIOGRAFÍAFÍSICA-MANUALESEDUCACIÓN-DICCIONARIO
  24. 24. Tipos de descriptores y epígrafesSubepígrafesc) Subepígrafes de ubicación geográficaEDUCACIÓN SUPERIOR-ESPAÑAARTE-POLONIAEDUCACIÓN-CUBA
  25. 25. Reglas sobre la presentación de los descriptores y epígrafe1. Forma del términoUtilizar, siempre que sea posible los sustantivos.Ejemplo: EVALUACIÓN en lugar de EVALUATIVONo utilizar verbos2. Número del términoUtilizar el singular para términos que expresan conceptos queno pueden contarse por unidades.Ejemplo: Nombres de disciplinas (QUÍMICA, FÍSICA, ETC.)Procesos (CAPACITACIÓN, POLITICA CIENTÍFICA)Materiales y propiedades específicas (UREA, FUERZA)
  26. 26. Reglas sobre la presentación de los descriptores y epígrafes3. Forma de entradaSe utilizará la entrada directa. Únicamente en casos muyexcepcionales se hará la inversión de la entrada4. Se debe evitar la utilización de:Signos de puntuaciónAbreviaturas
  27. 27. Lineamientos generales para la asignación de descriptores y epígrafes1. Se asignará el epígrafe o descriptor que defina de modo más preciso y específico el asunto que se desea indizar.2. Se añadirá a cada epígrafe los subepígrafes que sean necesarios para expresar del modo más preciso el asunto.3. Se utilizarán en la medida que sea posible, palabras en el idioma español.4. Asignar tantos descriptores o epígrafes que sean necesarios (máximo 8).
  28. 28. Lineamientos generales para la asignación de descriptores y epígrafes5. Seleccionar entre los sinónimos, un término como epígrafe o descriptor representativo y se hará referencia de los otros términos equivalentes.6. No se debe dar entrada por la temática y la forma de presentación a un mismo documento.7. Si el nombre del país se considera un elemento necesario para la recuperación se añadirá el conjunto de descriptores del documento para que aparezca como una entrada en el índice.8. Se consultará las listas y los repertorios antes de crear nuevos términos.
  29. 29. Precisar las diferencias entrepalabras clave y descriptores
  30. 30. Palabras clave"...colección no depurada (sino puesta en orden alfabético sin eliminación de sinonimia, ni polisemia) de las palabras significativas, denominadas también no vacías (es decir, todas las palabras que no sean artículos, conjunciones, pronombres, preposiciones, numerales y ciertos verbos y adverbios), extraídas, de forma automática, por el ordenador, a partir del titulo, del resumen y, cada vez mas a menudo, del texto completo de los documentos registrados dentro de un sistema documental dado.“ Van Slype, 1991
  31. 31. DescriptorTermino (palabra o expresión) que se ha escogido, a partir de un conjunto de sinónimos, de cuasisinónimos y de términos emparentados, para representar, de manera univoca, un concepto susceptible de intervenir en los documentos yen las consultas que se examinan dentro de un sistema documental dado. Van Slype, 1991Palabra o grupo de palabras incluidas en un tesauro y escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento o en una petición de búsqueda documental. AFNOR (Asociación Francesa de Normalización).
  32. 32. Los Tesauros
  33. 33. TesaurosLa norma ISO 2788-1986 define un tesauro como "un vocabulario controlado y dinámico, compuesto por términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento".Los lenguajes de indización, define un tesauro como "una lista estructurada de conceptos destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indización de los documentos y de las consultas". Van Slype,1991
  34. 34. TesaurosRelaciones SemánticasRelaciones de equivalencia USE (relación entre el término no preferente y el término preferente)USE, UP (usado por), UF (usado por)
  35. 35. TesaurosRelaciones SemánticasRelaciones jerárquicas: Son relaciones asimétricas, establecidas entre los descriptores, en la que un término es superior o genérico de otro… se van agrupando en disciplinas y sub-disciplinas.TE (término específico), BT (término más amplio), NT (término más específico)
  36. 36. TesaurosRelaciones SemánticasRelaciones asociativas: Son las relaciones asimétricas establecidas entre descriptores de distintas familias, distintas a las jerárquicas o de equivalencia, y que designan conceptos capaces de evocar mutuamente, por asociación de ideas, relaciones entre ellos.TR (término relacionado)
  37. 37. TesaurosNota de Alcancese usan para limitar el uso de los descriptores, para escribir un posible sentido del término cuando este tiene diferentes significados, pues es usado en diferentes disciplinas, no forma parte del descriptor, aunque aparezca en el tesauro.

×