SlideShare a Scribd company logo
1 of 13
Download to read offline
+
Ecosistema 4.0
Case Study: Analytics su scontrini
Lo Scenario
 Catene di centri commerciali con
programma di fidelity
 Servizio di OCR degli scontrini per
effettuare la raccolta punti per i clienti di
centri commerciali
 Profilazione degli utenti iscritti al
programma di fidelity.
L'Analisi
 Giornalmente vengono emessi grossi volumi di scontrini in
un singolo centro commerciale.
 Le informazioni contenute in uno scontrino non sono
strutturate.
 Per ottenere dei dati rilevanti, è necessario effettuare
delle procedure di estrazione e pulizia dell'informazione.
Cosa voglio ottenere?
 Effettuare degli insight per
 stime su previsioni di acquisti futuri degli utenti
 capire se esistono delle correlazioni tra i dati di
profilazione dell'utente, e quello che comprano.
 Trovare delle correlazioni tra i prodotti acquistati.
Cosa devo risolvere?
 Gli scontrini fanno riferimento a diversi negozi e
contengono dati grezzi.
 I dati di profilazione di un utente sono memorizzati nel
programma di fidelity, e l'unica correlazione con lo
scontrino è la scansione dello scontrino stessa.
 Le informazioni che un OCR riesce a leggere da uno
scontrino, spesso possono avere problemi di scansione con la
lettura di caratteri sbagliati.
 Non esiste una anagrafica dei prodotti contenuti negli
scontrini.
Architettura - Overview
Flusso dell'informazione
con tutte le
trasformazioni a partire
dall'immagine, fino ad
arrivare al dato finale.
Architettura - Acquisizione
 Il Totem effettua la scansione e comunica al cliente i punti
che ha accumulato per il suo programma di fidelity.
 La scansione dell'immagine dello scontrino viene inviata sul
cloud, e viene associata ai dati di profilazione dell'utente,
privati della correlazione dei suoi dati anagrafici precisi.
 Uno script sul cloud rieffettuerà la scansione dell'immagine,
e andrà a creare un documento composto dai dati di
profilazione dell'utente, e la scansione testuale. Questo
documento verrà memorizzato su Elasticsearch
Architettura - Esempio dati
 "fileName": "1485879622.png"
 "dateScanned": 1485879622
 "dateInsert": 1507979335
 "lastAnalyzed": []
 "ageClass": "> 75"
 "province": "MB"
 "ocr": "CARREFOUR MARKET [......] SHOPPER MARKET COMPO 0,20 SALSA PRONTA
CLASSIC 1,60 CHICCHE DI PATATE CR 1,75 YOG.COCCO/CIOCC.PIUA 0,79
STRACCHIN.CRENOSO AO 1,99 [.....] TOTALE ARTICOLI 24,33",
Architettura - Estrazione
 I dati dell'ocr vengono indicizzati secondo una categoria di riferimento.
 La definizione della categoria avviene in base al tipo di prodotto di cui si vuole conoscere
la presenza o meno negli acquisti di questi scontrini.
 Esempi di categorie:
 Formaggi:
 Stracchino
 Pecorino
 Parmigiano
 ....
 Salumi:
 Mortadella
 Salame
 .....
Architettura - Caricamento
 La ricerca viene effettuata sui singoli termini, considerando dei
margini di errore sui caratteri.
 Elasticsearch consente questo tipo di ricerche senza che sia
necessario attendere tempi enormi nell'ottenimento dei risultati
 Una ricerca sulla categoria Formaggi, produce quindi una espansione
di termini, ottenendo i seguenti match su un campione di test:
"crescenza", "stracchino", "crescenzr", "stracchinc", "parmigiano",
"stracchin", "straochino", "parmigzano", "parmigiana",
"stracchzno", "crewcenza"
 Viene quindi creata una replica sul database documentale dove per
ogni scontrino viene salvata, l'informazione dei match eseguiti per
ciascuna categoria
Architettura - Analytics
 Utilizzando un DB documentale, è quindi possibile effettuare le
ricerche su un sistema semi-strutturato
 Le query effettuate su questo DB hanno già un valore informativo.
 Esempi di informazioni estraibili
 In che percentuale sono stati emessi scontrini, nella zona "Monza
Brianza", contenenti la categoria "Formaggi", il cui acquirente
appartiene alla fascia di età "30-45 anni"?
 In che percentuale gli scontrini che contengono la categoria
"Formaggi", contengono anche la categoria "Salumi"?
 Quali tra le categorie utilizzate per l'indicizzazione, è presente su
un maggior numero di scontrini?
Servizio SaaS
 Tali informazioni, potrebbero essere reperibili tramite un
servizio SaaS, in cui il commerciante può pagare un canone
per il semplice utilizzo della piattaforma:
 In maniera mirata, potrebbe ottenere informazioni sugli
acquisti che fanno riferimento alla propria provincia di
appartenenza.
 Potrebbe personalizzare le categorie di ricerca, andando a
definire i raggruppamenti che più identificano il proprio
obiettivo.
 Non si farebbe carico di costi infrastrutturali, e paga solo
per quanto utilizza.
Riferimenti
Salvatore Niglio, CTO
Inobeta SRLS
Via Carlo Zotti 20
47122 Forlì FC
@. salvatore.niglio@inobeta.net
w. www.inobeta.net
m. +39 388 1286641

More Related Content

What's hot

Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...
Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...
Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...Cultura Digitale
 
Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligenceMarco Pozzan
 
Misurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web AnalyticsMisurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web AnalyticsAlberto Rota
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiVincenzo Manzoni
 
Come gestire un progetto Big Data
Come gestire un progetto Big DataCome gestire un progetto Big Data
Come gestire un progetto Big DataMiriade Spa
 
Noovle: Big Data & BI
Noovle: Big Data & BINoovle: Big Data & BI
Noovle: Big Data & BILorenzo Ridi
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiBusiness Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiSMAU
 
data mining & collaborative intelligence @bettersoftware
data mining & collaborative intelligence @bettersoftwaredata mining & collaborative intelligence @bettersoftware
data mining & collaborative intelligence @bettersoftwarelorenzov
 
Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorniMaurizio Girometti
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Marketing & Big Data Analytics
Marketing & Big Data AnalyticsMarketing & Big Data Analytics
Marketing & Big Data AnalyticsElisa Iandiorio
 
Business Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il RetailBusiness Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il RetailRoberto Butinar
 
I dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneI dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneClaudio Lattanzi
 
Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Miningvaluccia84
 
Biz miz o1 m5_u5.2_r7_k (ppt-sdl)_it
Biz miz o1 m5_u5.2_r7_k (ppt-sdl)_itBiz miz o1 m5_u5.2_r7_k (ppt-sdl)_it
Biz miz o1 m5_u5.2_r7_k (ppt-sdl)_itEmanuelePristera
 
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...Cristian Randieri PhD
 

What's hot (20)

Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...
Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...
Fabrizio Vigo - Fare marketing efficace nell’era dei Big Data - Digital for B...
 
Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligence
 
Misurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web AnalyticsMisurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web Analytics
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Come gestire un progetto Big Data
Come gestire un progetto Big DataCome gestire un progetto Big Data
Come gestire un progetto Big Data
 
Noovle: Big Data & BI
Noovle: Big Data & BINoovle: Big Data & BI
Noovle: Big Data & BI
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiBusiness Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
 
data mining & collaborative intelligence @bettersoftware
data mining & collaborative intelligence @bettersoftwaredata mining & collaborative intelligence @bettersoftware
data mining & collaborative intelligence @bettersoftware
 
edSENSE.AI
edSENSE.AIedSENSE.AI
edSENSE.AI
 
Big data
Big dataBig data
Big data
 
Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorni
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Marketing & Big Data Analytics
Marketing & Big Data AnalyticsMarketing & Big Data Analytics
Marketing & Big Data Analytics
 
introduzione al data mining
introduzione al data mining introduzione al data mining
introduzione al data mining
 
Business Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il RetailBusiness Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il Retail
 
I dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneI dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazione
 
Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Mining
 
Introduzione al datamining
Introduzione al dataminingIntroduzione al datamining
Introduzione al datamining
 
Biz miz o1 m5_u5.2_r7_k (ppt-sdl)_it
Biz miz o1 m5_u5.2_r7_k (ppt-sdl)_itBiz miz o1 m5_u5.2_r7_k (ppt-sdl)_it
Biz miz o1 m5_u5.2_r7_k (ppt-sdl)_it
 
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
 

Similar to Inobeta SMAU 2017 - Parte 2

4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionaliMau-Messenger
 
Creactives - Spending Analysis
Creactives - Spending Analysis Creactives - Spending Analysis
Creactives - Spending Analysis Maurizio Girometti
 
Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...
Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...
Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...CONFINDUSTRIA TOSCANA NORD
 
[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...
[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...
[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...Ecommerce HUB
 
Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d...
 Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d... Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d...
Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d...Data Driven Innovation
 
Smau milano 2014 paolo pasini
Smau milano 2014 paolo pasiniSmau milano 2014 paolo pasini
Smau milano 2014 paolo pasiniSMAU
 
Le novita di MongoDB 3.6
Le novita di MongoDB 3.6Le novita di MongoDB 3.6
Le novita di MongoDB 3.6MongoDB
 
DCG - introduction to predictive data analysis for tourism market
DCG - introduction to predictive data analysis for tourism marketDCG - introduction to predictive data analysis for tourism market
DCG - introduction to predictive data analysis for tourism marketRaffaele Calegari
 
Per una IA efficace: armonizzare usabilità, SEO e web analytics
Per una IA efficace: armonizzare usabilità, SEO e web analyticsPer una IA efficace: armonizzare usabilità, SEO e web analytics
Per una IA efficace: armonizzare usabilità, SEO e web analyticsaboutuser
 
Micro Focus Data Express 4.0 - Conformità, produttività e protezione dati
Micro Focus Data Express 4.0 - Conformità,  produttività  e  protezione datiMicro Focus Data Express 4.0 - Conformità,  produttività  e  protezione dati
Micro Focus Data Express 4.0 - Conformità, produttività e protezione datiMicrofocusitalia
 
2018 11 08_explore_gellify_phygitalstore
2018 11 08_explore_gellify_phygitalstore2018 11 08_explore_gellify_phygitalstore
2018 11 08_explore_gellify_phygitalstoreMarco Belmondo
 
Design with Data: Data Analysis per la Progettazione della Customer Experience
Design with Data: Data Analysis per la Progettazione della Customer ExperienceDesign with Data: Data Analysis per la Progettazione della Customer Experience
Design with Data: Data Analysis per la Progettazione della Customer ExperienceSketchin
 
Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...
Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...
Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...Contactlab
 
Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018
Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018
Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018Data-labs
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi StatisticiVincenzo Patruno
 
Paolo dello Vicario - From keyword to benchmarking
Paolo dello Vicario - From keyword to benchmarkingPaolo dello Vicario - From keyword to benchmarking
Paolo dello Vicario - From keyword to benchmarkingsemrush_webinars
 

Similar to Inobeta SMAU 2017 - Parte 2 (20)

4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionali
 
Creactives - Spending Analysis
Creactives - Spending Analysis Creactives - Spending Analysis
Creactives - Spending Analysis
 
Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...
Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...
Industria 4.0. Lucca, 5 luglio 2017 - VAR Sirio Industria "IoT - BigData - An...
 
[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...
[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...
[EH2023] SEO, AI e Machine Learning per l'eCommerce: la nuova SEO - Massimo F...
 
Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d...
 Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d... Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d...
Saper leggere e catalogare i risultati di un’indagine NPS attraverso l’uso d...
 
Smau milano 2014 paolo pasini
Smau milano 2014 paolo pasiniSmau milano 2014 paolo pasini
Smau milano 2014 paolo pasini
 
La distribuzione automatica Tkn Mag-Line
La distribuzione automatica Tkn Mag-LineLa distribuzione automatica Tkn Mag-Line
La distribuzione automatica Tkn Mag-Line
 
Le novita di MongoDB 3.6
Le novita di MongoDB 3.6Le novita di MongoDB 3.6
Le novita di MongoDB 3.6
 
Google analytics
Google analyticsGoogle analytics
Google analytics
 
DCG - introduction to predictive data analysis for tourism market
DCG - introduction to predictive data analysis for tourism marketDCG - introduction to predictive data analysis for tourism market
DCG - introduction to predictive data analysis for tourism market
 
Per una IA efficace: armonizzare usabilità, SEO e web analytics
Per una IA efficace: armonizzare usabilità, SEO e web analyticsPer una IA efficace: armonizzare usabilità, SEO e web analytics
Per una IA efficace: armonizzare usabilità, SEO e web analytics
 
Micro Focus Data Express 4.0 - Conformità, produttività e protezione dati
Micro Focus Data Express 4.0 - Conformità,  produttività  e  protezione datiMicro Focus Data Express 4.0 - Conformità,  produttività  e  protezione dati
Micro Focus Data Express 4.0 - Conformità, produttività e protezione dati
 
2018 11 08_explore_gellify_phygitalstore
2018 11 08_explore_gellify_phygitalstore2018 11 08_explore_gellify_phygitalstore
2018 11 08_explore_gellify_phygitalstore
 
Design with Data: Data Analysis per la Progettazione della Customer Experience
Design with Data: Data Analysis per la Progettazione della Customer ExperienceDesign with Data: Data Analysis per la Progettazione della Customer Experience
Design with Data: Data Analysis per la Progettazione della Customer Experience
 
DS4Biz - Data Science for Business
DS4Biz - Data Science for BusinessDS4Biz - Data Science for Business
DS4Biz - Data Science for Business
 
Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...
Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...
Artificial Intelligence or Artificial Dummies? Come istruire la macchina a no...
 
Loyalty Disruption? Lo scenario del Loyalty Marketing
Loyalty Disruption? Lo scenario del Loyalty MarketingLoyalty Disruption? Lo scenario del Loyalty Marketing
Loyalty Disruption? Lo scenario del Loyalty Marketing
 
Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018
Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018
Datalabs - Digital360 Awards - analisi predittiva-big data analytics - 2018
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi Statistici
 
Paolo dello Vicario - From keyword to benchmarking
Paolo dello Vicario - From keyword to benchmarkingPaolo dello Vicario - From keyword to benchmarking
Paolo dello Vicario - From keyword to benchmarking
 

Inobeta SMAU 2017 - Parte 2

  • 1. + Ecosistema 4.0 Case Study: Analytics su scontrini
  • 2. Lo Scenario  Catene di centri commerciali con programma di fidelity  Servizio di OCR degli scontrini per effettuare la raccolta punti per i clienti di centri commerciali  Profilazione degli utenti iscritti al programma di fidelity.
  • 3. L'Analisi  Giornalmente vengono emessi grossi volumi di scontrini in un singolo centro commerciale.  Le informazioni contenute in uno scontrino non sono strutturate.  Per ottenere dei dati rilevanti, è necessario effettuare delle procedure di estrazione e pulizia dell'informazione.
  • 4. Cosa voglio ottenere?  Effettuare degli insight per  stime su previsioni di acquisti futuri degli utenti  capire se esistono delle correlazioni tra i dati di profilazione dell'utente, e quello che comprano.  Trovare delle correlazioni tra i prodotti acquistati.
  • 5. Cosa devo risolvere?  Gli scontrini fanno riferimento a diversi negozi e contengono dati grezzi.  I dati di profilazione di un utente sono memorizzati nel programma di fidelity, e l'unica correlazione con lo scontrino è la scansione dello scontrino stessa.  Le informazioni che un OCR riesce a leggere da uno scontrino, spesso possono avere problemi di scansione con la lettura di caratteri sbagliati.  Non esiste una anagrafica dei prodotti contenuti negli scontrini.
  • 6. Architettura - Overview Flusso dell'informazione con tutte le trasformazioni a partire dall'immagine, fino ad arrivare al dato finale.
  • 7. Architettura - Acquisizione  Il Totem effettua la scansione e comunica al cliente i punti che ha accumulato per il suo programma di fidelity.  La scansione dell'immagine dello scontrino viene inviata sul cloud, e viene associata ai dati di profilazione dell'utente, privati della correlazione dei suoi dati anagrafici precisi.  Uno script sul cloud rieffettuerà la scansione dell'immagine, e andrà a creare un documento composto dai dati di profilazione dell'utente, e la scansione testuale. Questo documento verrà memorizzato su Elasticsearch
  • 8. Architettura - Esempio dati  "fileName": "1485879622.png"  "dateScanned": 1485879622  "dateInsert": 1507979335  "lastAnalyzed": []  "ageClass": "> 75"  "province": "MB"  "ocr": "CARREFOUR MARKET [......] SHOPPER MARKET COMPO 0,20 SALSA PRONTA CLASSIC 1,60 CHICCHE DI PATATE CR 1,75 YOG.COCCO/CIOCC.PIUA 0,79 STRACCHIN.CRENOSO AO 1,99 [.....] TOTALE ARTICOLI 24,33",
  • 9. Architettura - Estrazione  I dati dell'ocr vengono indicizzati secondo una categoria di riferimento.  La definizione della categoria avviene in base al tipo di prodotto di cui si vuole conoscere la presenza o meno negli acquisti di questi scontrini.  Esempi di categorie:  Formaggi:  Stracchino  Pecorino  Parmigiano  ....  Salumi:  Mortadella  Salame  .....
  • 10. Architettura - Caricamento  La ricerca viene effettuata sui singoli termini, considerando dei margini di errore sui caratteri.  Elasticsearch consente questo tipo di ricerche senza che sia necessario attendere tempi enormi nell'ottenimento dei risultati  Una ricerca sulla categoria Formaggi, produce quindi una espansione di termini, ottenendo i seguenti match su un campione di test: "crescenza", "stracchino", "crescenzr", "stracchinc", "parmigiano", "stracchin", "straochino", "parmigzano", "parmigiana", "stracchzno", "crewcenza"  Viene quindi creata una replica sul database documentale dove per ogni scontrino viene salvata, l'informazione dei match eseguiti per ciascuna categoria
  • 11. Architettura - Analytics  Utilizzando un DB documentale, è quindi possibile effettuare le ricerche su un sistema semi-strutturato  Le query effettuate su questo DB hanno già un valore informativo.  Esempi di informazioni estraibili  In che percentuale sono stati emessi scontrini, nella zona "Monza Brianza", contenenti la categoria "Formaggi", il cui acquirente appartiene alla fascia di età "30-45 anni"?  In che percentuale gli scontrini che contengono la categoria "Formaggi", contengono anche la categoria "Salumi"?  Quali tra le categorie utilizzate per l'indicizzazione, è presente su un maggior numero di scontrini?
  • 12. Servizio SaaS  Tali informazioni, potrebbero essere reperibili tramite un servizio SaaS, in cui il commerciante può pagare un canone per il semplice utilizzo della piattaforma:  In maniera mirata, potrebbe ottenere informazioni sugli acquisti che fanno riferimento alla propria provincia di appartenenza.  Potrebbe personalizzare le categorie di ricerca, andando a definire i raggruppamenti che più identificano il proprio obiettivo.  Non si farebbe carico di costi infrastrutturali, e paga solo per quanto utilizza.
  • 13. Riferimenti Salvatore Niglio, CTO Inobeta SRLS Via Carlo Zotti 20 47122 Forlì FC @. salvatore.niglio@inobeta.net w. www.inobeta.net m. +39 388 1286641