Hashbot.com - Acquisizione e Validazione
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,925
On Slideshare
2,674
From Embeds
251
Number of Embeds
7

Actions

Shares
Downloads
13
Comments
0
Likes
1

Embeds 251

http://www.gianniamato.it 244
http://www.linkedin.com 2
http://www.blogger.com 1
http://feeds.feedburner.com 1
http://209.85.129.132 1
http://webcache.googleusercontent.com 1
http://www.slideshare.net 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Hashbot.com - Acquisizione e Validazione Scientifica dei Documenti Web Gianni Amato Working Capital Catania 29 Aprile 2009 Università di Catania    
  • 2. Hashbot.com – Flow Chart    
  • 3. Hashbot.com – Home Page    
  • 4. Acquire – Il processo di acquisizione Url  Indirizzo esatto del documento web, esempio:  http://www.webpage.com/image.jpg  http://www.webpage.com/page.html  User Agent  Presentarsi al server remoto come un qualsiasi browser.   Il contenuto del documento acquisito potrebbe cambiare in funzione dello user agent ricevuto dal server e   processato dal linguaggio di scripting che crea il documento.    
  • 5. Status – Fine del processo di acquisizione Header:  la risposta del server alla richiesta di hashbot  From IP: l'indirizzo IP dell'utente che ha richiesto il processo di acquisizione  URL: il collegamento al documento acquisito.  Date: data di acquisizione  Time: ora di acquisizione   Hash File:  i codici hash MD5 e SHA1 del file acquisito. Ovvero l'impronta   digitale univoca del file calcolata su due algoritmi. Hash Header: i codici hash MD5 e SHA1 delle informazioni di header   salvate in apposito file. File Type: il tipo di documento scaricato dal processo di acquisizione.  CODE: codice alfanumerico creato da hashbot che deve considerarsi come ID   univoco del processo di acquisizione. MD5: il calcolo dell'impronta digitale del file in base all'algoritmo MD5.  SHA1:  il calcolo dell'impronta digitale del file in base all'algoritmo SHA1.     
  • 6. Download – Contenuto dell'archivio ZIP <keycode>­code.txt  file di testo contenente le informazioni di validazione ed i dati relativi al processo di acquisizione. Quindi le   sottosezioni “Validate Info” e “File Info” della sezione Status. <keycode>­headers.txt  file di testo contenente la risposta di header del server remoto. Quindi la sottosezione “Headers Info” della   sezione Status. <keycode>.<ext>  il file scaricato dal processo di acquisizione. Questo verrà rinominato con il codice alfanumerico   identificativo del processo di acquisizione e manterrà la sua estenzione se riconosciuta dal hashbot. Nel caso  in cui il tipo di file non viene riconosciuto sarà usata l'estensione arbitraria unk. Al fine di mantenere valido nel tempo il processo di acquisizione è importante che nessun file  dell'archivio compresso – e quindi l'archivio stesso – subiscano modifiche di ogni genere.    
  • 7. Validate – Il processo di validazione Il file <keycode>­code.txt contiene le  informazioni necessarie per la  validazione Code  codice alfanumerico di cui al rigo tre del file   <keycode>­code.txt Hash File  HASH del file acquisito. MD5 o SHA1 indistintamente.   Righe 4 e 5 del file <keycode>­code.txt    
  • 8. Status – Le informazioni di validazione Le informazioni riportate sono la prova che hashtbot è stato usato precedentemente per  acquisire il documento di cui si sta richiedendo la validazione. Tutte le informazioni di validazione mostrate da hashbot devono corrispondere a quanto  riportato nella sezione “Download Info” del file <keycode>­code.txt.    
  • 9. Conclusioni – $AUTHORS Hashbot.Com is developed and loved by  Gianni Amato and Davide Baglieri. ...è un servizio gratuito, che non richiede  registrazione, rilasiato as is. Davide Baglieri Gianni Amato   http://www.davidonzo.com http://www.gianniamato.it       http://www.digitalside.it http://www.securityside.it  