2. INDIZACIÓN
La indización de los documentos es un proceso
complejo, que forma parte del procesamiento de
la información, por el cual se representan en
algún portador material características
esenciales de los documentos que permiten su
posterior recuperación sin tener que revisar
toda la colección.
Giráldez Rodríguez, R. (2004)
3. INDIZACIÓN
Representación del contenido de los
documentos por medio de símbolos
especiales, que extraídos del texto
original, están recogidos en un lenguaje
de información o de indización.
Norma 5693 (Organización Internacional de
Normalización)
4. INDIZACIÓN
El término INDIZACIÓN se refiere a la
asignación de una o más etiquetas que
sirvan para identificarlo y/o describirlo y
para facilitar su posterior
recuperación…
Lancaster W.
5. Fases fundamentales de la indización
de materia
•Se revisa el documento
para determinar el
Análisis de contenido contenido.
•Seleccionar las palabras
clave del contenido.
•Autor o del propio
indizador.
Traducción de los términos asignados
en el análisis de contenido a los •Se consulta el vocabulario
términos índices del vocabulario del controlado del sistema.
lenguaje de la indización del sistema
•Se organizan, de acuerdo
con la forma que se haya
establecido los términos
utilizados para indizar los
Organización del índice documentos de la colección
y se obtiene el índice de
materia
6. Variables asociadas con el proceso
de indización
Grado de
exhaustividad
Profundidad La política y
las reglas El Indizador
Especificidad de indización
El lenguaje de
indización
La Colección
de Documentos
7. Variables asociadas con el proceso
de indización
La política de indización. Reglas de indización
Grado de La materia que abarca el contenido
exhaustividad de un documento es la totalidad de tópicos
que tratan en el mismo.
la exhaustividad en la indización de
un documento se define como el número
máximo de diferentes
tópicos indizados
Giráldez, R. (2004)
8. Variables asociadas con el proceso
de indización
La política de indización. Reglas de indización
Profundidad
Se define como el número de diferentes
términos seleccionados para indizar el
documento. Esta variable también se
denomina densidad de la indización.
Giráldez, R. (2004)
9. Variables asociadas con el proceso
de indización
La política de indización. Reglas de indización
Especificidad
Es una propiedad semántica de los
términos, es el nivel de detalle y exactitud
con que se representa un concepto dado.
Relación género/especie
Giráldez, R. (2004)
10. Variables asociadas con el proceso
de indización
La política de indización. Reglas de indización
El lenguaje de
indización El vocabulario del lenguaje debe ser en la
medida que sea posible específico, si por
lo contrario carece de especificidad se
convertirá en un freno para la indización
específica.
Giráldez, R. (2004)
12. Lenguajes de recuperación
de la información (LRI)
Los LRI son lenguajes artificiales, es
decir, lenguajes creados por el
hombre, que se utilizan para indizar
los documentos y las solicitudes con
la finalidad de recuperar la
información almacenada y
satisfacer las demandas de los
usuarios.
13. Lenguajes de recuperación
de la información (LRI)
Los LRI tiene, al igual que las lenguas
naturales, como mínimo tres componentes
fundamentales:
Vocabulario
Sintaxis
Reglas para su uso
14. Vocabulario
El vocabulario o léxico de un LRI es el conjunto
de términos que se utiliza para expresar el contenido
informacional de un documento… y pueden estar
representadas por:
•Palabras aisladas o combinaciones de palabras.
•Códigos numéricos, alfabéticos o alfa-numéricos.
•Códigos en combinación con palabras del
lenguaje natural
15. Vocabulario
Para garantizar que se cumpla el
rasgo esencial de todo LRI, o sea que
entre los términos y los conceptos
exista una relación unívoca, es
necesario eliminar de su vocabulario
la homonimia y la sinonimia
16. Homonimia
La homonimia se elimina con aclaraciones
sobre los significados del término,
las cuales se colocan entre paréntesis y a
continuación de los vocablos que sea
homógrafos, es decir una misma palabra
Con dos o más significados.
PLANTA (INSTALACIÓN INDUSTRIAL)
PLANTA (PARTE INFERIOR DEL PIE)
PLANTA (EN BOTÁNICA)
17. Sinonimia
La sinonimia se elimina estableciendo un conjunto de
clases equivalentes entre los sinónimos, o casi-sinónimos,
o sea entre dos o más palabras diferentes
que tienen significados iguales o parecidos.
USE o VÉASE
Hidratos de carbono
USE CORBOHIDRATOS
18. Sintaxis
La sintaxis de un LRI es el conjunto de
reglas para combinar los términos del
vocabulario en cadenas, frases o
unidades sintácticas capaces de expresar
conceptos o significados más complejos o
más abarcadores, que no podrían ser
expresados si se utilizaran los términos
del vocabulario de forma aislada…
Formación de profesores. Química. Cuba.
Cumbre de los Países no Alineados. Bolivia
20. Tipos de descriptores y
epígrafes
a) Descriptores y epígrafes simples:
EDUCACIÓN
DERECHO
EXISTENCIALISMO
b) Descriptores y epígrafes compuestos:
MEDICIONES DEL APRENDIZAJE
POLÍTICA CIENTÍFICA
ARTE Y SOCIEDAD
21. Tipos de descriptores y
epígrafes
c) Descriptores y epígrafes biográficos:
BARTÓK, BÉLA, 1881-1945.
EINSTEIN, ALBERT, 1879-1955.
d) Descriptores y epígrafes históricos o
cronológicos:
EDAD MEDIA
EDAD DE PIEDRA
HISTORIA ANTIGUA
22. Tipos de descriptores y
epígrafes
e) Descriptores y epígrafes étnicos:
AZTECAS
INDIOS DE NORTEAMÉRICA
INDIOS DE SURAMÉRICA
23. Tipos de descriptores y
epígrafes
Subepígrafes
a) Subepígrafes temáticos o de materia
CIENCIA-ENSEÑANZA
EDUCACIÓN-HISTORIA
a) Subepígrafes de forma
QUÍMICA-BIBLIOGRAFÍA
FÍSICA-MANUALES
EDUCACIÓN-DICCIONARIO
24. Tipos de descriptores y
epígrafes
Subepígrafes
c) Subepígrafes de ubicación geográfica
EDUCACIÓN SUPERIOR-ESPAÑA
ARTE-POLONIA
EDUCACIÓN-CUBA
25. Reglas sobre la presentación
de los descriptores y epígrafe
1. Forma del término
Utilizar, siempre que sea posible los sustantivos.
Ejemplo: EVALUACIÓN en lugar de EVALUATIVO
No utilizar verbos
2. Número del término
Utilizar el singular para términos que expresan conceptos que
no pueden contarse por unidades.
Ejemplo: Nombres de disciplinas (QUÍMICA, FÍSICA, ETC.)
Procesos (CAPACITACIÓN, POLITICA CIENTÍFICA)
Materiales y propiedades específicas (UREA, FUERZA)
26. Reglas sobre la presentación
de los descriptores y epígrafes
3. Forma de entrada
Se utilizará la entrada directa. Únicamente en casos muy
excepcionales se hará la inversión de la entrada
4. Se debe evitar la utilización de:
Signos de puntuación
Abreviaturas
27. Lineamientos generales para la
asignación de descriptores y
epígrafes
1. Se asignará el epígrafe o descriptor que defina de
modo más preciso y específico el asunto que se
desea indizar.
2. Se añadirá a cada epígrafe los subepígrafes que
sean necesarios para expresar del modo más
preciso el asunto.
3. Se utilizarán en la medida que sea posible,
palabras en el idioma español.
4. Asignar tantos descriptores o epígrafes que sean
necesarios (máximo 8).
28. Lineamientos generales para la
asignación de descriptores y
epígrafes
5. Seleccionar entre los sinónimos, un término como
epígrafe o descriptor representativo y se hará
referencia de los otros términos equivalentes.
6. No se debe dar entrada por la temática y la forma
de presentación a un mismo documento.
7. Si el nombre del país se considera un elemento
necesario para la recuperación se añadirá el
conjunto de descriptores del documento para que
aparezca como una entrada en el índice.
8. Se consultará las listas y los repertorios antes de
crear nuevos términos.
30. Palabras clave
"...colección no depurada (sino puesta en orden alfabético
sin eliminación de sinonimia, ni polisemia) de las
palabras significativas, denominadas también no
vacías (es decir, todas las palabras que no sean
artículos, conjunciones, pronombres, preposiciones,
numerales y ciertos verbos y adverbios), extraídas, de
forma automática, por el ordenador, a partir del titulo, del
resumen y, cada vez mas a menudo, del texto completo
de los documentos registrados dentro de un sistema
documental dado.“
Van Slype, 1991
31. Descriptor
Termino (palabra o expresión) que se ha escogido, a partir de un
conjunto de sinónimos, de cuasisinónimos y de términos
emparentados, para representar, de manera univoca, un
concepto susceptible de intervenir en los documentos yen las
consultas que se examinan dentro de un sistema documental
dado.
Van Slype, 1991
Palabra o grupo de palabras incluidas en un tesauro y escogidas
de entre un conjunto de términos equivalentes para
representar sin ambigüedad una noción contenida en un
documento o en una petición de búsqueda documental.
AFNOR (Asociación Francesa de Normalización).
33. Tesauros
La norma ISO 2788-1986 define un tesauro como "un vocabulario
controlado y dinámico, compuesto por términos que tienen
entre ellos relaciones semánticas y genéricas y que se aplica
a un dominio particular del conocimiento".
Los lenguajes de indización, define un tesauro como "una lista
estructurada de conceptos destinados a representar de
manera unívoca el contenido de los documentos y de las
consultas dentro de un sistema documental determinado y a
ayudar al usuario en la indización de los documentos y de las
consultas".
Van Slype,1991
35. Tesauros
Relaciones Semánticas
Relaciones jerárquicas: Son relaciones asimétricas,
establecidas entre los descriptores, en la que un
término es superior o genérico de otro… se van
agrupando en disciplinas y sub-disciplinas.
TE (término específico), BT (término más amplio),
NT (término más específico)
36. Tesauros
Relaciones Semánticas
Relaciones asociativas: Son las relaciones
asimétricas establecidas entre descriptores de
distintas familias, distintas a las jerárquicas o de
equivalencia, y que designan conceptos capaces
de evocar mutuamente, por asociación de ideas,
relaciones entre ellos.
TR (término relacionado)
37. Tesauros
Nota de Alcance
se usan para limitar el uso de los
descriptores, para escribir un posible
sentido del término cuando este tiene
diferentes significados, pues es usado en
diferentes disciplinas, no forma parte del
descriptor, aunque aparezca en el tesauro.