Presentacion Proyecto Herramienta de Documentalista - Presentation Transcript
Herramientas de Documentalistas
Recolector de Documentos
Diversidad Documental
Blogs
Revistas electronicas
Prensa Historica
Tesis
Recolector de Documentos
Paginas Web
Correo electronico
RSS
Fotografias
Etc...
Diversidad de Formatos y Normas
PDF de Adobe
MS Office PPT, DOC, XLS
Imagenes JPG, GIF
Recolector de Documentos
RSS, ATOM, RSS2...
HTML, XML...
Dublin Core
HL7
Ascii, UTF-8, ANSI...
Recolector de Documentos
Recolector de Documentos
¿Que informacion se
extrae?
Metadatos
Texto Completo
Informacion introducida
manualmente
.....
Recolector de Documentos
Internet
Base de datos
Medios de Difusion
almacenamiento
como discos...
Entrada Salida
Procesos
Salida
Entrada Procesos
1 Recolectar enlaces URL
Extrae los enlaces URL de una pagina a
partir de una direccion URL
2 Lector de XML
Lee XML de medios, RSS, ATOM...
3 Importa ficheros de disco
De directorios, cds, dvd..
4 Introduccion manual de
registros
Permite el registro manual de
documentos.
1 Recolectar enlaces URL
Extrae enlaces URL a partir de una
direccion
2 Lector de XML
Lee XML de medios,rss, atom....
3 Importa ficheros de disco
De directorios, cds, dvd..
4 Introduccion manual de registros
Permite el registro manual de documentos.
El recolector hace su trabajo pero...
¿Como organizar la entrada de miles de
documentos diarios?
Desde las
16:59:10 hasta
las 16:59:12
recolecta 26
documentos.
Entrada Salida
Procesos
Entrada Salida
Procesos
Metodos tradicionales
Tesauro, Cuadro de Clasificacion,
Materias, Metadatos Dublin Core...
Tesauro
Metadatos Dublin Core
Estructura jerarquica
Cuadro de Clasificacion / Expediente / Volumen / Documento
Publicacion / Numero / Pagina
Calculo de la materia
Calcula la materia probable comparando los terminos con una base de terminos por
materia
Entrada Salida
Procesos
Entrada
Salida
Procesos
Envio automatico a nuestra base de datos en
internet
Informes y listados
Exportar a formato Wordpress y SQL
Para mas informacion sobre las funciones de HDD vease: http://funciones.wordpress.com/
CREDITOS
Este es un software para uso no comercial, para otros usos consulte las respectivas licencias
La base de datos esta realizada con Velneo para trabajar sobre
plataformas windows.
http://www.velneo.comv
Utiliza el siguiente software de apoyo, integrandolo en la gestor de base
de datos:
Exiftool para la extraccion de metadatos, ExifTool by Phil Harvey
http://www.sno.phy.queensu.ca/~phil/exiftool/
Gettext para la extraccion de texto plano de documentos, Kryloff Technologies,
Inc.
http://www.kryltech.com/
Vbscript y Cscript para facilitar y optimizar el uso de programas externos y
para extraer XML, URL y metadatos de paginas HTML
http://www.microsoft.com
0 comments
Post a comment