SlideShare a Scribd company logo
Migrazione di un sito
web mediante tecnica
di estrazione dati
automatizzata
Giulio Zorzoli
Università degli studi di Trieste
Ingegneria dell’Informazione
9 Ottobre 2019
Caso di studio
 Web site del Machine Learning Lab UniTS
 Realizzato in Google Sites Classic
 Migrazione da Classic a New
Migrazione. Perchè?
1. Google Sites Classic è deprecato
2. Google Sites New
1. Protocollo HTTPS
2. Sito Responsive
3. Look moderno
Vincoli di Progetto
1. Utilizzo di Google Sites
2. Nessuna perdita di informazioni
95 pagine web di Pubblicazioni
43 pagine web di News
3. Meccanismo per inserimento nuove pubblicazioni o
news
 Informazioni dinamiche vs statiche
Confronto
Pre-migrazione
 Google Sites Classic
 Nuove informazioni
Nuova pagina web
 Informazioni Statiche
Post-migrazione
 Google Sites New
 Nuove informazioni
Rendering su pagina
web unica
 Informazioni Dinamiche
Il problema (1)
 Migrazione da classic a new
 No perdita di informazioni
 Sì vincoli imposti
 Tool di migrazione automatico Google
 Non utilizzabile!
 Necessaria soluzione ad hoc
Il problema (2)
 Come prelevare e preservare le informazioni presenti
in ogni pagina del sito web?
 6 Pagine principali statiche
 Facile!
 95 Pagine di pubblicazioni + 43 di news
 Molto complicato!
Web Crawler
 Programma headless
1. Visita pagina web
2. Prelievo struttura HTML
3. Conversione a struttura ad albero
4. Ricerca di informazioni
 Navigazione tra i nodi
 Regole sintattiche
Dati strutturati. Quale
formato?
 No JSON
 No CSV
 No XML
 No Database
 Sì Spreadsheet Google
Frontend
 Pagine Statiche
 No HTML, CSS, Javascript
 Sì Elementi nativi Google Sites New
 Pagine dinamiche
 AwesomeTable
 Sì HTML, CSS, Javascript
Screenshot (1)
Screenshot (2)
Ricapitolando...
Prima
 Oltre 100 pagine web
 6 principali
 95 di pubblicazioni
statiche
 43 di news statiche
 Nuovo elemento
 Nuova pagina web!
Look obsoleto
Dopo
 20 pagine web
 5 principali
 3 statiche
 2 dinamiche
 Nuovo elemento
 Aggiunto nello
spreadsheet
Look moderno
Conclusione
 Al termine del periodo di tirocino il nuovo sito web
risulta pronto per la produzione e può essere visionato
a questo link:
https://sites.google.com/view/tesi-zorzoli
Grazie per l’attenzione

More Related Content

Similar to Migrazione di un sito web mediante tecnica di estrazione dati automatizzata - Slide Prelaurea

Esempi pratici
Esempi praticiEsempi pratici
Esempi pratici
DotNetMarche
 
Come eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOCome eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEO
Semrush Italia
 
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sitoRestyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
semrush_webinars
 
Restyling Sito: Cosa Monitorare su Google Analytics
Restyling Sito: Cosa Monitorare su Google AnalyticsRestyling Sito: Cosa Monitorare su Google Analytics
Restyling Sito: Cosa Monitorare su Google Analytics
ALE AGOSTINI
 
Analizzare un link con gli occhi di Google
Analizzare un link con gli occhi di GoogleAnalizzare un link con gli occhi di Google
Analizzare un link con gli occhi di Google
Bizup
 
Migrazione Sito (2011)
Migrazione Sito (2011)Migrazione Sito (2011)
Migrazione Sito (2011)
Dottor Seo
 
Ottimizzazione di un sito web per i motori di ricerca - Zenzero Lab
Ottimizzazione di un sito web per i motori di ricerca - Zenzero LabOttimizzazione di un sito web per i motori di ricerca - Zenzero Lab
Ottimizzazione di un sito web per i motori di ricerca - Zenzero Lab
TeamZenzeroLab
 
301 modi di fare Redirect
301 modi di fare Redirect301 modi di fare Redirect
301 modi di fare Redirect
Mosaiko Web srl
 
Le Penalizzazioni Di Google
Le Penalizzazioni Di GoogleLe Penalizzazioni Di Google
Le Penalizzazioni Di Google
Francesco Tinti
 
DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009psicomante
 
Seo Pareto: il 20% che porta l '80% della RESA
Seo Pareto: il 20% che porta l '80% della RESA Seo Pareto: il 20% che porta l '80% della RESA
Seo Pareto: il 20% che porta l '80% della RESA
ALE AGOSTINI
 
Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...
Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...
Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...
semrush_webinars
 
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Matteo Stefan
 
SMAU Milano 2015
SMAU Milano 2015SMAU Milano 2015
SMAU Milano 2015
Paolo Dadda
 
Expertise 2013 - Potenziare le prestazioni di apache con mod page speed
Expertise 2013 - Potenziare le prestazioni di apache con mod page speedExpertise 2013 - Potenziare le prestazioni di apache con mod page speed
Expertise 2013 - Potenziare le prestazioni di apache con mod page speedAndrea Mauro
 
Penalizzazioni SEO - ST 2012
Penalizzazioni SEO - ST 2012Penalizzazioni SEO - ST 2012
Penalizzazioni SEO - ST 2012ST2012
 
Velocità sito web
Velocità sito webVelocità sito web
Velocità sito web
Edp Answer s.r.l.
 
Session isolation e rendering delle pagine web
Session isolation e rendering delle pagine webSession isolation e rendering delle pagine web
Session isolation e rendering delle pagine web
Giacomo Zecchini
 
Migrazione sito web
Migrazione sito webMigrazione sito web
Migrazione sito web
Dottor Seo
 

Similar to Migrazione di un sito web mediante tecnica di estrazione dati automatizzata - Slide Prelaurea (20)

Esempi pratici
Esempi praticiEsempi pratici
Esempi pratici
 
Come eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOCome eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEO
 
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sitoRestyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
 
Restyling Sito: Cosa Monitorare su Google Analytics
Restyling Sito: Cosa Monitorare su Google AnalyticsRestyling Sito: Cosa Monitorare su Google Analytics
Restyling Sito: Cosa Monitorare su Google Analytics
 
Analizzare un link con gli occhi di Google
Analizzare un link con gli occhi di GoogleAnalizzare un link con gli occhi di Google
Analizzare un link con gli occhi di Google
 
Migrazione Sito (2011)
Migrazione Sito (2011)Migrazione Sito (2011)
Migrazione Sito (2011)
 
Wpo extended
Wpo extendedWpo extended
Wpo extended
 
Ottimizzazione di un sito web per i motori di ricerca - Zenzero Lab
Ottimizzazione di un sito web per i motori di ricerca - Zenzero LabOttimizzazione di un sito web per i motori di ricerca - Zenzero Lab
Ottimizzazione di un sito web per i motori di ricerca - Zenzero Lab
 
301 modi di fare Redirect
301 modi di fare Redirect301 modi di fare Redirect
301 modi di fare Redirect
 
Le Penalizzazioni Di Google
Le Penalizzazioni Di GoogleLe Penalizzazioni Di Google
Le Penalizzazioni Di Google
 
DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009
 
Seo Pareto: il 20% che porta l '80% della RESA
Seo Pareto: il 20% che porta l '80% della RESA Seo Pareto: il 20% che porta l '80% della RESA
Seo Pareto: il 20% che porta l '80% della RESA
 
Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...
Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...
Search Console + Analytics: praticità e scalabilità dell'analisi SEO con i to...
 
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
 
SMAU Milano 2015
SMAU Milano 2015SMAU Milano 2015
SMAU Milano 2015
 
Expertise 2013 - Potenziare le prestazioni di apache con mod page speed
Expertise 2013 - Potenziare le prestazioni di apache con mod page speedExpertise 2013 - Potenziare le prestazioni di apache con mod page speed
Expertise 2013 - Potenziare le prestazioni di apache con mod page speed
 
Penalizzazioni SEO - ST 2012
Penalizzazioni SEO - ST 2012Penalizzazioni SEO - ST 2012
Penalizzazioni SEO - ST 2012
 
Velocità sito web
Velocità sito webVelocità sito web
Velocità sito web
 
Session isolation e rendering delle pagine web
Session isolation e rendering delle pagine webSession isolation e rendering delle pagine web
Session isolation e rendering delle pagine web
 
Migrazione sito web
Migrazione sito webMigrazione sito web
Migrazione sito web
 

Migrazione di un sito web mediante tecnica di estrazione dati automatizzata - Slide Prelaurea

  • 1. Migrazione di un sito web mediante tecnica di estrazione dati automatizzata Giulio Zorzoli Università degli studi di Trieste Ingegneria dell’Informazione 9 Ottobre 2019
  • 2. Caso di studio  Web site del Machine Learning Lab UniTS  Realizzato in Google Sites Classic  Migrazione da Classic a New
  • 3. Migrazione. Perchè? 1. Google Sites Classic è deprecato 2. Google Sites New 1. Protocollo HTTPS 2. Sito Responsive 3. Look moderno
  • 4. Vincoli di Progetto 1. Utilizzo di Google Sites 2. Nessuna perdita di informazioni 95 pagine web di Pubblicazioni 43 pagine web di News 3. Meccanismo per inserimento nuove pubblicazioni o news  Informazioni dinamiche vs statiche
  • 5. Confronto Pre-migrazione  Google Sites Classic  Nuove informazioni Nuova pagina web  Informazioni Statiche Post-migrazione  Google Sites New  Nuove informazioni Rendering su pagina web unica  Informazioni Dinamiche
  • 6. Il problema (1)  Migrazione da classic a new  No perdita di informazioni  Sì vincoli imposti  Tool di migrazione automatico Google  Non utilizzabile!  Necessaria soluzione ad hoc
  • 7. Il problema (2)  Come prelevare e preservare le informazioni presenti in ogni pagina del sito web?  6 Pagine principali statiche  Facile!  95 Pagine di pubblicazioni + 43 di news  Molto complicato!
  • 8. Web Crawler  Programma headless 1. Visita pagina web 2. Prelievo struttura HTML 3. Conversione a struttura ad albero 4. Ricerca di informazioni  Navigazione tra i nodi  Regole sintattiche
  • 9. Dati strutturati. Quale formato?  No JSON  No CSV  No XML  No Database  Sì Spreadsheet Google
  • 10. Frontend  Pagine Statiche  No HTML, CSS, Javascript  Sì Elementi nativi Google Sites New  Pagine dinamiche  AwesomeTable  Sì HTML, CSS, Javascript
  • 13. Ricapitolando... Prima  Oltre 100 pagine web  6 principali  95 di pubblicazioni statiche  43 di news statiche  Nuovo elemento  Nuova pagina web! Look obsoleto Dopo  20 pagine web  5 principali  3 statiche  2 dinamiche  Nuovo elemento  Aggiunto nello spreadsheet Look moderno
  • 14. Conclusione  Al termine del periodo di tirocino il nuovo sito web risulta pronto per la produzione e può essere visionato a questo link: https://sites.google.com/view/tesi-zorzoli Grazie per l’attenzione