SlideShare a Scribd company logo
1 of 21
Download to read offline
SISTEM DE IDENTIFICARE
BAZAT PE
RECUNOAȘTEREA
SEMNĂTURII
Alexandru Cristian
Profesor coordonator: Ş.l. Dr. Ing. Cosmin Cernăzanu-Glăvan
Iunie 2014
Universitatea Politehnica Timișoara
Facultatea de Automatică și Calculatoare
Calculatoare și Tehnologia Informației
1/21
Identificarea persoanelor.
2/21
Metode de identificare:
3/21
Semnătura.
• Text sau un însemn scris de mână cu scopul de a marca
și de a autentifica permanent un document.
• În funcție de complexitate se poate împărții in 3 categorii:
4/21
Semnătura falsificată.
• Semnăturile contrafăcute prezintă următoarele
caracteristici: caractere mai mari, retușări, variații in
grosime si intensitate, apariții ale unor forme inexistente.
• În funcție de dificultatea cu care pot fi detectate semnăturile
contrafăcute se împart în mai multe categorii: falsuri
aleatorii, falsuri ocazionale, falsuri calificate.
5/21
Sistemul propus:
• Sistem bazat pe modele standard de tip pipeline, cu 3
etape:
• Pre-procesare
• Extragere de trăsături
• Clasificare
6/21
Pre-procesarea:
Etapă necesară pentru a obține o imagine care să respecte cerințele
pentru ca etapa următoare să se execute cu succes.
Este compusă din patru pași:
Transformarea imaginii în alb negru.
Eliminarea zgomotelor.
Normalizarea imaginii.
Redimensionarea.
7/21
Rezultatul fiecărei etape de pre-procesare:
Intrare Pasul 1
Pasul 2 Pasul 3 & 4
8/21
Extragerea de trăsături:
Trăsăturile se pot impărții în două categorii:
Trăsături globale:
o Histograma punctelor
Trăsături locale:
o Densitate de pixeli
o Centrul de greutate
o Unghiul de înclinație față de orizontală
o Unghiul de înclinație față de verticală
9/21
Trăsături globale:
o Histograma reprezintă distribuția punctelor din imagine pe
coloane, aceasta se calculează pe benzi cu lățimea de 15
coloane.
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75
Histograma de puncte
Banda
10/21
Trăsături locale:
o Inclinatia fata de orizontala
o Centrul de greutateo Densitatea de pixeli
o Inclinatia fata de verticala
Trăsături locale se extrag din zone de dimensiuni mai mici
numite celule, obținute prin segmentarea imaginii.
Din fiecare celulă se extrag urmatoarele trăsături:
11/21
Clasificarea:
Clasificatorul folosit este o rețea neuronală artificială (RNA), cu următoarele
caracteristici:
• RNA cu propagare înainte (feed – forward)
• un start intrare
• două staturi ascunse
• un strat de ieșire, cu un singur neuron
• algoritm de învățare supervizat, cu propagarea erorii înapoi
12/21
Implementarea sistemului:
Se disting
următoarele pachete:
•clasifier
•core
•extraction
•preprocess
•services
•util
•test
Aplicația software a fost implementată în limbajul de
programare Java folosind Eclipse Kepler IDE.
S-au folosit bibliotecile:
• Open-CV Java
• Encog
13/21
Rezultate experimentale.
• Pentru testarea sistemului s-au folosite 5 seturi de date,
constând din date de test și validare:
• Setul 1 de date este compus din 197 imagini
• Setul 2 de date este compus din 130 imagini
• Setul 3 de date este compus din 269 imagini
• Setul 4 de date este compus din 119 imagini
• Setul 5 de date este compus din 118 imagini
• S-a variat procentul de imagini folosite la antrenarea
clasificatorului cu un increment de 5% pentru fiecare test.
14/21
Acurateteasistemului
50
55
60
65
70
75
80
85
90
95
100
5.00% 9.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00%
Ratadesucces
Procent din imagini folosite la antrenare
Procentul de semnături catalogate corect din totalul de semnături folosite la
evaluare
15/21
Falsnegative
43
56
29
24
27
16
6
5
2
6
3
4
2
1
2 2 2
1
23
26
20
4
3
5
1
2
3
2 2
1
2 2 2
4
2 2
53
51
46
35
26
29
23
24
18
16
12
9 9
6
4 4
3
2
0
7
2
1 1
2
1
2 2
3
4 4
2
1 1 1
0
1
35
28
22
17
11
6
7 7
10
6 6
4
5
4
3 3
1
2
5.00% 9.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00%
Set de date: 1 Set de date: 2 Set de date: 3 Set de date: 4 Set de date: 5
Semnături originale catalogate drept semnături false.
16/21
Falspozitive
29
20
10
6
3
4
12
10
13
6
8
6
2
5
2
1
2
0
29
3
1
5
4
3
5
4
3
4 4
3
1 1 1
0 0 0
1
0 0
1
4
3
4 4 4
2 2 2 2 2
1
0 0
1
48
21
22
5
8
3 3 3
1 1 1 1 1
2 2
1 1 1
8
4
1
2 2
4 4
3
2 2
1
2
1 1 1 1
0 0
5.00% 9.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00%
Set de date: 1 Set de date: 2 Set de date: 3 Set de date: 4 Set de date: 5
Semnături false catalogate drept semnături originale.
17/21
Variațiapreciziei
Procentul de documente relevante din mulțimea obținută
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 20 40 60 80 100 120 140 160 180 200
Precizie
Numarul de semnaturi folosite la antrenare
18/21
Concluzii:
• Sistemul este independent.
• Soluția dezvoltată prezintă o rata mare de success,
peste 85% pentru un set de antrenare de 25 de
semnături.
• Sistemul evoluează, îmbunătățindu-și acuratețea pană la
95% prin creșterea numărului de semnături.
• Numărul de catalogări fals pozitive este redus, în medie
de 3.8 semnături fals pozitive pe set.
• Aplicatia dezvoltata este adaptiva, obtinand rezultate
constante pentru toate seturile de date folosite.
19/21
Dezvoltări ulterioare:
• Testarea sistemului cu alte seturi de date.
• Adaugarea unor noi trăsături care să ducă la creșterea
performanței.
• Testarea unor noi clasificatori care să scadă rata de
eroare.
• Optimizarea procesului de pre-procesare.
• Îmbunătățirea siguranței și validarea integrității datelor ce
sunt salvate pe disc prin criptare.
20/21
Vă mulțumesc!
21/21
Întrebări ?

More Related Content

Featured

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationErica Santiago
 

Featured (20)

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 

Prezentare

  • 1. SISTEM DE IDENTIFICARE BAZAT PE RECUNOAȘTEREA SEMNĂTURII Alexandru Cristian Profesor coordonator: Ş.l. Dr. Ing. Cosmin Cernăzanu-Glăvan Iunie 2014 Universitatea Politehnica Timișoara Facultatea de Automatică și Calculatoare Calculatoare și Tehnologia Informației 1/21
  • 4. Semnătura. • Text sau un însemn scris de mână cu scopul de a marca și de a autentifica permanent un document. • În funcție de complexitate se poate împărții in 3 categorii: 4/21
  • 5. Semnătura falsificată. • Semnăturile contrafăcute prezintă următoarele caracteristici: caractere mai mari, retușări, variații in grosime si intensitate, apariții ale unor forme inexistente. • În funcție de dificultatea cu care pot fi detectate semnăturile contrafăcute se împart în mai multe categorii: falsuri aleatorii, falsuri ocazionale, falsuri calificate. 5/21
  • 6. Sistemul propus: • Sistem bazat pe modele standard de tip pipeline, cu 3 etape: • Pre-procesare • Extragere de trăsături • Clasificare 6/21
  • 7. Pre-procesarea: Etapă necesară pentru a obține o imagine care să respecte cerințele pentru ca etapa următoare să se execute cu succes. Este compusă din patru pași: Transformarea imaginii în alb negru. Eliminarea zgomotelor. Normalizarea imaginii. Redimensionarea. 7/21
  • 8. Rezultatul fiecărei etape de pre-procesare: Intrare Pasul 1 Pasul 2 Pasul 3 & 4 8/21
  • 9. Extragerea de trăsături: Trăsăturile se pot impărții în două categorii: Trăsături globale: o Histograma punctelor Trăsături locale: o Densitate de pixeli o Centrul de greutate o Unghiul de înclinație față de orizontală o Unghiul de înclinație față de verticală 9/21
  • 10. Trăsături globale: o Histograma reprezintă distribuția punctelor din imagine pe coloane, aceasta se calculează pe benzi cu lățimea de 15 coloane. 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 Histograma de puncte Banda 10/21
  • 11. Trăsături locale: o Inclinatia fata de orizontala o Centrul de greutateo Densitatea de pixeli o Inclinatia fata de verticala Trăsături locale se extrag din zone de dimensiuni mai mici numite celule, obținute prin segmentarea imaginii. Din fiecare celulă se extrag urmatoarele trăsături: 11/21
  • 12. Clasificarea: Clasificatorul folosit este o rețea neuronală artificială (RNA), cu următoarele caracteristici: • RNA cu propagare înainte (feed – forward) • un start intrare • două staturi ascunse • un strat de ieșire, cu un singur neuron • algoritm de învățare supervizat, cu propagarea erorii înapoi 12/21
  • 13. Implementarea sistemului: Se disting următoarele pachete: •clasifier •core •extraction •preprocess •services •util •test Aplicația software a fost implementată în limbajul de programare Java folosind Eclipse Kepler IDE. S-au folosit bibliotecile: • Open-CV Java • Encog 13/21
  • 14. Rezultate experimentale. • Pentru testarea sistemului s-au folosite 5 seturi de date, constând din date de test și validare: • Setul 1 de date este compus din 197 imagini • Setul 2 de date este compus din 130 imagini • Setul 3 de date este compus din 269 imagini • Setul 4 de date este compus din 119 imagini • Setul 5 de date este compus din 118 imagini • S-a variat procentul de imagini folosite la antrenarea clasificatorului cu un increment de 5% pentru fiecare test. 14/21
  • 15. Acurateteasistemului 50 55 60 65 70 75 80 85 90 95 100 5.00% 9.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% Ratadesucces Procent din imagini folosite la antrenare Procentul de semnături catalogate corect din totalul de semnături folosite la evaluare 15/21
  • 16. Falsnegative 43 56 29 24 27 16 6 5 2 6 3 4 2 1 2 2 2 1 23 26 20 4 3 5 1 2 3 2 2 1 2 2 2 4 2 2 53 51 46 35 26 29 23 24 18 16 12 9 9 6 4 4 3 2 0 7 2 1 1 2 1 2 2 3 4 4 2 1 1 1 0 1 35 28 22 17 11 6 7 7 10 6 6 4 5 4 3 3 1 2 5.00% 9.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% Set de date: 1 Set de date: 2 Set de date: 3 Set de date: 4 Set de date: 5 Semnături originale catalogate drept semnături false. 16/21
  • 17. Falspozitive 29 20 10 6 3 4 12 10 13 6 8 6 2 5 2 1 2 0 29 3 1 5 4 3 5 4 3 4 4 3 1 1 1 0 0 0 1 0 0 1 4 3 4 4 4 2 2 2 2 2 1 0 0 1 48 21 22 5 8 3 3 3 1 1 1 1 1 2 2 1 1 1 8 4 1 2 2 4 4 3 2 2 1 2 1 1 1 1 0 0 5.00% 9.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% Set de date: 1 Set de date: 2 Set de date: 3 Set de date: 4 Set de date: 5 Semnături false catalogate drept semnături originale. 17/21
  • 18. Variațiapreciziei Procentul de documente relevante din mulțimea obținută 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 20 40 60 80 100 120 140 160 180 200 Precizie Numarul de semnaturi folosite la antrenare 18/21
  • 19. Concluzii: • Sistemul este independent. • Soluția dezvoltată prezintă o rata mare de success, peste 85% pentru un set de antrenare de 25 de semnături. • Sistemul evoluează, îmbunătățindu-și acuratețea pană la 95% prin creșterea numărului de semnături. • Numărul de catalogări fals pozitive este redus, în medie de 3.8 semnături fals pozitive pe set. • Aplicatia dezvoltata este adaptiva, obtinand rezultate constante pentru toate seturile de date folosite. 19/21
  • 20. Dezvoltări ulterioare: • Testarea sistemului cu alte seturi de date. • Adaugarea unor noi trăsături care să ducă la creșterea performanței. • Testarea unor noi clasificatori care să scadă rata de eroare. • Optimizarea procesului de pre-procesare. • Îmbunătățirea siguranței și validarea integrității datelor ce sunt salvate pe disc prin criptare. 20/21