OPEN DATA
Open Data, Linked Open Data, Osint
Noalettin Marco
Pellizzon Luca
Panoramica generale
Gli open data fanno di frequente
riferimento a «informazioni»
rappresentate in forma di database e
riferite alla tematiche più disparate
cartografia, genetica, composti chimici,
formule matematiche e scientifiche, dati
medici, delle bioscienze, dati anagrafici,
dati governativi, ecc
Definizione formale
• Il progetto Open Definition di Open Knowledge
Foundation utilizza la seguente frase per definire
dati (e contenuti) aperti: «un contenuto o un dato
si definisce aperto se chiunque è in grado di
utilizzarlo, riutilizzarlo e ridistribuirlo, soggetto, al
massimo, alla richiesta di attribuzione e
condivisione allo stesso modo»
• meglio esplicata attraverso il documento Conoscenza Aperta
Perché Open?
John Wilbanks ha dichiarato:
«Numerosi scienziati hanno sottolineato con
ironia che proprio nel momento storico in cui
disponiamo delle tecnologie per consentire
la disponibilità dei dati scientifici a livello
globale e dei sistemi di distribuzione che ci
consentirebbero di ampliare la
collaborazione e accelerare il ritmo e la
profondità della scoperte... siamo occupati a
bloccare i dati e a prevenire l'uso di
tecnologie avanzate che avrebbero un forte
impatto sulla diffusione della conoscenza»
Da Wikipedia.
Caratteristiche degli Open Data
• Sono disponibili per l’utilizzo da parte di chiunque
(secondo i termini di una data licenza), anche per finalità
commerciali e in formato disaggregato (dati grezzi);
• Sono accessibili attraverso le tecnologie dell’informazione
e sono adatti all’elaborazione automatica da parte di
programmi e sono provvisti dei relativi metadati;
• Sono resi disponibili gratuitamente attraverso le
tecnologie dell’informazione o a costi marginali relativi alla
loro riproduzione e divulgazione;
• I dati devono essere indicizzati dai motori di ricerca;
• I dati devono essere disponibili in un formato aperto,
standardizzato e leggibile da un applicazione informatica.
Open Government
L'Open government
prevede che tutte le
attività dei governi e
delle amministrazioni
dello stato debbano
essere aperte e
disponibili, al fine di
favorire azioni efficaci
e garantire un
controllo pubblico
sull’operato
Linked (Open) Data
In informatica i linked data
rappresentano un insieme
di dati pubblicati e collegati
tra loro.
La loro pubblicazione è
basata su tecnologie
standard del web (http, uri)
Caratteristiche fondamentali
• Usare URI per identificare oggetti;
• Usare Http URI per in modo che possano essere
referenziati e cercati da terzi;
• Fornire informazioni utili sull’oggetto con formati
standard come RDF;
• Includere link ad altri «oggetti» per migliorare la
ricerca di informazioni.
W3C Linking Open Data project
• L’obbiettivo di tale progetto è di
«estendere» il web pubblicando diversi
open dataset, impostando link tra i dati di
differenti risorse.
• http://www.w3.org/wiki/SweoIG/TaskForces/CommunityPr
ojects/LinkingOpenData
OSINT
Open Source INTelligence
Attività di raccolta di
informazioni mediante la
consultazione di fonti di
pubblico accesso
principalmente a scopi di
spionaggio
Sources
Metadata : – Foca , metagoofil , exiftool
Online sites : – Shodanhq, Serversniff, netcraft,
centralops,
FF extensions :– wappalyzer, Passive recon, Our
Own Mantra
Tools
Potential leak of data: Email Addresses List
Detected 37 occurrence(s) of ‘[s|,;']+[a-z0-9-._]+@[a-z0-9-.]+.[a-z]{2,4}[s|,;:']+’:
dawicio007@intertia.pl:asd123AE oskar_17_1992@wp.pl:polskajestwielka huliganek1991@wp.pl:jacek001 arturbrzozowski2@wp.pl:widawa11
laskarzewski1978:gracjan2009 dabrowski.marcin@yahoo.pl:nukunuku45 grzegorzbiniek@op.pl:1234GB sroka1205@wp.pl:1985sroka'
szczepan2111@interia.pl:luks2111
Detected 1 occurrence(s) of ‘(h[a4]ck[e3]d|[p0]wn[e3]d|d[e3]f[a4]c[e3]d) by’:
Chomikuj.pl -> DataBase -> LAST_REGISTER => 2014-05-03 11:44:18 DUMP => 2014-05-03 PUBLIC => 2014-05-04 HACKED BY
DEVILTEAM.PL Part 1 - 15000 Users Download in .doc File:
http://www.mediafire.com/view/c1z59ea44eoba1w/chomikuj.pl_Database_Part_1_1-15000_Users.doc ------------------------------------------------
Potential leak of data: Email/Password Dump
Detected 29 occurrence(s) of ‘^[a-z0-9-._]+@[a-z0-9-.]+.[a-z]{2,4}[ t;,:|]+S+’:
ntzel trishjarrett@yahoo.com:franklin knobpte028@yahoo.com:missy028 skoehler93@msn.com:mygirls
kris.pabico@gmail.com:krispy katherine22202@yahoo.com:katiegirl genlastudio@gmail.com:grayson1
yenrt@gawab.com:dolfke12r mirkocorli@gmail.com:scidecoma lavinester@gmail.com:160693
Detected 29 occurrence(s) of ‘[s|,;']+[a-z0-9-._]+@[a-z0-9-.]+.[a-z]{2,4}[s|,;:']+’:
dentzel trishjarrett@yahoo.com:franklin knobpte028@yahoo.com:missy028 skoehler93@msn.com:mygirls
kris.pabico@gmail.com:krispy katherine22202@yahoo.com:katiegirl genlastudio@gmail.com:grayson1
yenrt@gawab.com:dolfke12r mirkocorli@gmail.com:scidecoma lavinester@gmail.com:160693
Potential leak of data: Personal Information
Detected 1 occurrence(s) of ‘doxed’:
(OR) Kaasstraat 1000 *City: Amsterdam *Country: Netherlands *Phone Number: 31612457845 *Email: rick@dollars.com,
robbiegast@hotmail.com *Jabber: ddos4hire@default.rs *Skype: (Old skype) Robbiegast95 *IP Address: *Reason of Dox:
Asked to be doxed. *Age: 19 *DOB: 1995 *Mother's Name: *Father's Name: *ISP: NETWORK SOLUTIONS, LLC.
COSA SI PUO’ OTTENERE
Open data

Open data

  • 1.
    OPEN DATA Open Data,Linked Open Data, Osint Noalettin Marco Pellizzon Luca
  • 2.
    Panoramica generale Gli opendata fanno di frequente riferimento a «informazioni» rappresentate in forma di database e riferite alla tematiche più disparate cartografia, genetica, composti chimici, formule matematiche e scientifiche, dati medici, delle bioscienze, dati anagrafici, dati governativi, ecc
  • 3.
    Definizione formale • Ilprogetto Open Definition di Open Knowledge Foundation utilizza la seguente frase per definire dati (e contenuti) aperti: «un contenuto o un dato si definisce aperto se chiunque è in grado di utilizzarlo, riutilizzarlo e ridistribuirlo, soggetto, al massimo, alla richiesta di attribuzione e condivisione allo stesso modo» • meglio esplicata attraverso il documento Conoscenza Aperta
  • 4.
    Perché Open? John Wilbanksha dichiarato: «Numerosi scienziati hanno sottolineato con ironia che proprio nel momento storico in cui disponiamo delle tecnologie per consentire la disponibilità dei dati scientifici a livello globale e dei sistemi di distribuzione che ci consentirebbero di ampliare la collaborazione e accelerare il ritmo e la profondità della scoperte... siamo occupati a bloccare i dati e a prevenire l'uso di tecnologie avanzate che avrebbero un forte impatto sulla diffusione della conoscenza» Da Wikipedia.
  • 5.
    Caratteristiche degli OpenData • Sono disponibili per l’utilizzo da parte di chiunque (secondo i termini di una data licenza), anche per finalità commerciali e in formato disaggregato (dati grezzi); • Sono accessibili attraverso le tecnologie dell’informazione e sono adatti all’elaborazione automatica da parte di programmi e sono provvisti dei relativi metadati; • Sono resi disponibili gratuitamente attraverso le tecnologie dell’informazione o a costi marginali relativi alla loro riproduzione e divulgazione; • I dati devono essere indicizzati dai motori di ricerca; • I dati devono essere disponibili in un formato aperto, standardizzato e leggibile da un applicazione informatica.
  • 6.
    Open Government L'Open government prevedeche tutte le attività dei governi e delle amministrazioni dello stato debbano essere aperte e disponibili, al fine di favorire azioni efficaci e garantire un controllo pubblico sull’operato
  • 7.
    Linked (Open) Data Ininformatica i linked data rappresentano un insieme di dati pubblicati e collegati tra loro. La loro pubblicazione è basata su tecnologie standard del web (http, uri)
  • 8.
    Caratteristiche fondamentali • UsareURI per identificare oggetti; • Usare Http URI per in modo che possano essere referenziati e cercati da terzi; • Fornire informazioni utili sull’oggetto con formati standard come RDF; • Includere link ad altri «oggetti» per migliorare la ricerca di informazioni.
  • 9.
    W3C Linking OpenData project • L’obbiettivo di tale progetto è di «estendere» il web pubblicando diversi open dataset, impostando link tra i dati di differenti risorse. • http://www.w3.org/wiki/SweoIG/TaskForces/CommunityPr ojects/LinkingOpenData
  • 10.
    OSINT Open Source INTelligence Attivitàdi raccolta di informazioni mediante la consultazione di fonti di pubblico accesso principalmente a scopi di spionaggio
  • 12.
  • 13.
    Metadata : –Foca , metagoofil , exiftool Online sites : – Shodanhq, Serversniff, netcraft, centralops, FF extensions :– wappalyzer, Passive recon, Our Own Mantra Tools
  • 15.
    Potential leak ofdata: Email Addresses List Detected 37 occurrence(s) of ‘[s|,;']+[a-z0-9-._]+@[a-z0-9-.]+.[a-z]{2,4}[s|,;:']+’: dawicio007@intertia.pl:asd123AE oskar_17_1992@wp.pl:polskajestwielka huliganek1991@wp.pl:jacek001 arturbrzozowski2@wp.pl:widawa11 laskarzewski1978:gracjan2009 dabrowski.marcin@yahoo.pl:nukunuku45 grzegorzbiniek@op.pl:1234GB sroka1205@wp.pl:1985sroka' szczepan2111@interia.pl:luks2111 Detected 1 occurrence(s) of ‘(h[a4]ck[e3]d|[p0]wn[e3]d|d[e3]f[a4]c[e3]d) by’: Chomikuj.pl -> DataBase -> LAST_REGISTER => 2014-05-03 11:44:18 DUMP => 2014-05-03 PUBLIC => 2014-05-04 HACKED BY DEVILTEAM.PL Part 1 - 15000 Users Download in .doc File: http://www.mediafire.com/view/c1z59ea44eoba1w/chomikuj.pl_Database_Part_1_1-15000_Users.doc ------------------------------------------------ Potential leak of data: Email/Password Dump Detected 29 occurrence(s) of ‘^[a-z0-9-._]+@[a-z0-9-.]+.[a-z]{2,4}[ t;,:|]+S+’: ntzel trishjarrett@yahoo.com:franklin knobpte028@yahoo.com:missy028 skoehler93@msn.com:mygirls kris.pabico@gmail.com:krispy katherine22202@yahoo.com:katiegirl genlastudio@gmail.com:grayson1 yenrt@gawab.com:dolfke12r mirkocorli@gmail.com:scidecoma lavinester@gmail.com:160693 Detected 29 occurrence(s) of ‘[s|,;']+[a-z0-9-._]+@[a-z0-9-.]+.[a-z]{2,4}[s|,;:']+’: dentzel trishjarrett@yahoo.com:franklin knobpte028@yahoo.com:missy028 skoehler93@msn.com:mygirls kris.pabico@gmail.com:krispy katherine22202@yahoo.com:katiegirl genlastudio@gmail.com:grayson1 yenrt@gawab.com:dolfke12r mirkocorli@gmail.com:scidecoma lavinester@gmail.com:160693 Potential leak of data: Personal Information Detected 1 occurrence(s) of ‘doxed’: (OR) Kaasstraat 1000 *City: Amsterdam *Country: Netherlands *Phone Number: 31612457845 *Email: rick@dollars.com, robbiegast@hotmail.com *Jabber: ddos4hire@default.rs *Skype: (Old skype) Robbiegast95 *IP Address: *Reason of Dox: Asked to be doxed. *Age: 19 *DOB: 1995 *Mother's Name: *Father's Name: *ISP: NETWORK SOLUTIONS, LLC. COSA SI PUO’ OTTENERE