4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

  • 1,389 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,389
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
21
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 4 Recolectar enlaces, captura masiva de documentos en internet © Fotografia de Sebastian Babestrello, COPADA DE SARDINA Y ANCHOVETA PESCA DE CERCO http://www.flickr.com/photos/sebastianbavestrello/3838123182/in/set-72157621963370973/
  • 2. Titulo del Curso: Software “Herramienta de Documentalista” Su uso para profesionales de la informacion http://www.facebook.com/group.php?gid=186557580539
  • 3. TEMARIO 1 Instalacion y personalizacion del software 2 Alta, baja y modificacion de un documento (registro) 3 Recolectar RSS, lector de feed 4 Recolectar enlaces, captura masiva de documentos en internet 5 Definicion de la Tabla de materias y del Cuadro de clasificacion 6 Asignar materia, Etiquetado, Cuadro de clasificacion 7 Importar imagenes de un disco, extraer metadatos 8 Importar documentos de un disco, extraer metadatos 9 Metadatos y Recuperacion de la informacion 10 Difusion de la informacion, Generar informes 11 Gestion de necesidades de informacion, calcular relevancia y pertinencia.
  • 4. Para reflexionar... “En su momento tuve el atrevimiento de definir un neologismo que ha tenido cierto éxito: infoxicación. La palabra definía el exceso informacional, de intoxicación informacional, en la que tienes más información de la que humanamente puedes procesar y, como consecuencia, surge la ansiedad (técnicamente information fatigue syndrome). En inglés el término es information overload (sobrecarga informacional). Pues bien, la infoxicación es un problema de nuestra sociedad y, por tanto, también una gran fuente de oportunidades.” Alfons Cornella Entrevistando a un miliciano en las trincheras, España 1937
  • 5. DESCRIPCION Y OBJETIVOS DE ESTE TEMA Extraer y recolectar enlaces de una pagina web, Señalar documentos como Recolector de enlaces y fuente de recoleccion. Ver los documentos recolectados y valorar el interes general de una pagina web.
  • 6. Desde el menu principal elegimos la opcion Entrada de Documentos Entrevistando a un miliciano en las trincheras, España 1937
  • 7. Elegimos la opcion Recolector de Enlaces URL de paginas Web Entrevistando a un miliciano en las trincheras, España 1937
  • 8. Esta es la pantalla de control del recolector de urls, esta dividida en dos rejillas las fuentes de recoleccion a la izquierda y a la derecha las urls recolectadas Para leer un canal, pulsamos en el icono Entrada a un miliciano en las trincheras, Entrevistando España 1937
  • 9. Si observamos la lista izquierda, vemos que aparece una flecha a la izquierda del nombre El objeto de señalar los documentos como fuentes de recoleccion es que de todos los documentos que tenemos en la Base de Datos, solo aparezcan en la pantalla de recoleccion, los que hallamos señalado como recolector de enlaces. A continuacion veremos como se realiza esta sencilla operacion.
  • 10. Para dar de alta una fuente de recoleccion, damos de alta una ficha y nos vamos a la pestaña Relaciones, cumplimentamos NOMBRE y URL y en fuentes de recoleccion señalamos el documento como recolector de enlaces. Pulsamos en aceptar para guardar los cambios. Entrevistando a un miliciano en las trincheras, España 1937
  • 11. Vamos a extraer como ejemplo los enlaces de la pagina de la Muskiz Liburutegia Fragmento de Codigo HTML de la pagina HDD va a extraer <font color="#990066"><a URL:http://www.muskizibu href="http://www.muskiziburutegia. rutegia.org/biblioteca/g org/biblioteca/guias/berdintasuna/ uias/berdintasuna/FrameS FrameSet.htm" et.htm target="_blank">Cuentos en la Nombre:Cuentos en la Igualdad /Berditasunerak Igualdad / Berditasunerako ipuinak Entrevistando a un miliciano en las trincheras, (2005)</a></font></div></td> o ipuinak (2005) España 1937
  • 12. Señalamos la casilla de verificacion de la web de la que queremos extraer los enlaces. Pulsamos en el icono Entrada y a continuacion “Recolectar enlaces URL de una pagina Web Entrevistando a un miliciano en las trincheras, España 1937
  • 13. En la barra de iconos, pulsamos en Entrada Aparecera un menu, donde elegimos “Recolectar enlaces URL de una pagina Web”, entendemos como pagina Web cualquier pagina HTML Entrevistando a un miliciano en las trincheras, España 1937
  • 14. En la pantalla del recolector de enlaces, ya nos apareceran las urls recolectadas Entrevistando a un miliciano en las trincheras, España 1937
  • 15. Si hacemos doble click en cualquier linea de la lista de enlaces recolectados, la pestaña VER nos muestra la pagina correspondiente. Pulsando en el valor que consideremos tambien podemos valorar el interes general de la pagina Entrevistando a un miliciano en las trincheras, España 1937
  • 16. “El ser humano ha erigido una civilización tan compleja que le resulta absolutamente necesario mecanizar por completo sus archivos si desea llevar toda su experiencia a su conclusión lógica en lugar quedarse bloqueado por sobrecargar su limitada memoria. Sus excursiones conceptuales podrían resultar más placenteras si pudiese recuperar el privilegio de olvidar las múltiples cosas que no necesita tener a mano inmediatamente, aunque sin renunciar a la seguridad de poder encontrarlas en el momento en que le pudiesen resultar útiles” Cómo podríamos pensar Vannevar Bush Julio de 1945 http://www.facebook.com/group.php?gid=186557580539