Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Acceleration at heart
Strategy in mind
CREATING
TOMORROW
TODAY
Embedded Software
and FPGA
FILM
2
3
ET AV NORDENS
LEDENDE
KONSULENTSELSKAP
INNEN IT OG
MANAGEMENT
350MNOK
Omsetning 2016
2007
Acando Norge grunnlagt 1997
5F...
MASKINLÆRING
OG
BILDEANALYSE
HØSTSEMINARET 2017
4
5
6
ANALYTICS EXAMPLE: AMAZON RECOMMENDATIONS
7
…the customer is provided
with recommendations for
similar products or accesso...
MEDIA ANALYTICS ECOSYSTEM
8
EKSEMPEL NRK
BILDEGJENKJENNING
TALE TIL TEKST
9
WHAT IS IMAGE ANALYTICS?
• Extracting/extrapolating high-quality information and content from large quantities of text
• U...
WHAT IS ANALYTICS OF SOUND/SPEECH?
• Extracting/extrapolating high-quality information and meaning from large quantities o...
FACE DETECTION
• 1960s: Early unsuccessful attempts to
find faces in a digital image.
• 1989: Kohonen demonstrates a neura...
FACE DETECTION
• 1960s: Early unsuccessful attempts to
find faces in a digital image.
• 1989: Kohonen demonstrates a neura...
MICROSOFT COGNITIVE SERVICES: FACE API
Donald Trump (70 years):
[{'faceAttributes': {'age': 62.7,
'emotion': {'anger': 0.8...
15
TALE TIL TEKST
16
Effektiviseringsgevist overførbart til
annet ustrukturert materiale inkl. Tekst,
Inkl. hente data ut av ...
17
TRANSKRIBERING AV TALE TIL TEKST
en 38 år gammel mann som er siktet for drapet
på sin kone på Nesbyen vil ikke motsette...
18
RECENT CONTROVERSY IN ADVERTISING MEDIA
• Camera analyzing a face looking at the advertisement
• Analytics applied to dete...
20
ACTUAL USE-CASE: NRK
• Recognize the identity of every guest in a given TV show
• Monitor the presence of each guest throu...
22
GJENKJENNING AV PERSONER I BILDER OG FILM
• Deteksjon av alle ansikter
• Trening av modell med kjente ansikter
• Gjenfinni...
24
• Trening av en generell bildegjenkjenner
• Benytter eksempler på objekter og finner dem i et bilde
• Deep learning med co...
DETEKSJON AV TEKST I BILDER OG FILM
26
• Uthenting av tekstuelt innhold kan gjøres med stor
nøyaktighet.
• Formattering ka...
DETEKSJON AV TEKST I DOKUMENTER, BILDER OG FILM
27
• Uthenting av tekstuelt innhold kan gjøres med stor nøyaktighet.
• For...
STUDIO PRESENCE IN THE TV-SHOW
28
Each guests presence in the program is mapped along a timeline.
29
I hjelper vi våre kunder med å
bli digitale vinnere!
Sammen med kunden utvikler vi innovative digitale løsninger,
som sørg...
31
Upcoming SlideShare
Loading in …5
×

Acando - Maskinlæring og anskiktsgjennkjenning - Høstseminaret 2017

182 views

Published on

Snorre Meland (Direktør Digital Consulting & Solutions).

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Acando - Maskinlæring og anskiktsgjennkjenning - Høstseminaret 2017

  1. 1. Acceleration at heart Strategy in mind CREATING TOMORROW TODAY Embedded Software and FPGA
  2. 2. FILM 2
  3. 3. 3 ET AV NORDENS LEDENDE KONSULENTSELSKAP INNEN IT OG MANAGEMENT 350MNOK Omsetning 2016 2007 Acando Norge grunnlagt 1997 5FORRETNINGSOMRÅDER • Digital • Application Development • IT Management Consulting • Management Consulting • IIOT Ansatte i Norge:1600 5LAND Norge Sverige Tyskland Finland Latvia 250
  4. 4. MASKINLÆRING OG BILDEANALYSE HØSTSEMINARET 2017 4
  5. 5. 5
  6. 6. 6
  7. 7. ANALYTICS EXAMPLE: AMAZON RECOMMENDATIONS 7 …the customer is provided with recommendations for similar products or accessories A potential buyer is shopping on Amazon for a smartphone through insights generated from other users’ purchasing behaviors… …the buyer is provided with product recommendations for similar phones A registered customer logs onto his/her Amazon account Based on his/her previous purchase history… Customer analytics 1 2
  8. 8. MEDIA ANALYTICS ECOSYSTEM 8
  9. 9. EKSEMPEL NRK BILDEGJENKJENNING TALE TIL TEKST 9
  10. 10. WHAT IS IMAGE ANALYTICS? • Extracting/extrapolating high-quality information and content from large quantities of text • Usually accomplished by statistical pattern learning, frequency distributions • Added value: automatic filtering by relevance, novelty, and/or interestingness • Example tasks: − Document classification, document summarization − Text clustering − Keyword extraction − Concept/entity extraction − Sentiment analysis − Entity relation modeling, e.g. StoltenbergENT secretary-generalREL NATOENT • Related concepts: − text mining, text data analytics, Natural Language Processing 10
  11. 11. WHAT IS ANALYTICS OF SOUND/SPEECH? • Extracting/extrapolating high-quality information and meaning from large quantities of text • Usually accomplished by statistical pattern learning, frequency distributions • Added value: automatic filtering by relevance, novelty, and/or interestingness • Example tasks: − Document classification, document summarization − Text clustering − Keyword extraction − Concept/entity extraction − Sentiment analysis − Entity relation modeling, e.g. StoltenbergENT secretary-generalREL NATOENT • Related concepts: − text mining, text data analytics, Natural Language Processing 11
  12. 12. FACE DETECTION • 1960s: Early unsuccessful attempts to find faces in a digital image. • 1989: Kohonen demonstrates a neural network able to find faces which are scaled and normalized. • 2001: Viola and Jones object detection framework. Fast and reliable face detection. • 2017: Face detection is mainstream, and robust systems exists that can do face recognition in a variety of applications. 12
  13. 13. FACE DETECTION • 1960s: Early unsuccessful attempts to find faces in a digital image. • 1989: Kohonen demonstrates a neural network able to find faces which are scaled and normalized. • 2001: Viola and Jones object detection framework. Fast and reliable face detection. • 2017: Face detection is mainstream, and robust systems exists that can do face recognition in a variety of applications. 13
  14. 14. MICROSOFT COGNITIVE SERVICES: FACE API Donald Trump (70 years): [{'faceAttributes': {'age': 62.7, 'emotion': {'anger': 0.865, 'contempt': 0.0, 'disgust': 0.113, 'fear': 0.0, 'happiness': 0.0, 'neutral': 0.0, 'sadness': 0.0, 'surprise': 0.021}, 'facialHair': {'beard': 0.1, 'moustache': 0.1, 'sideburns': 0.1}, 'gender': 'male', 'glasses': 'NoGlasses', 'smile': 0.0} 14
  15. 15. 15
  16. 16. TALE TIL TEKST 16 Effektiviseringsgevist overførbart til annet ustrukturert materiale inkl. Tekst, Inkl. hente data ut av semistrukturert underlag
  17. 17. 17 TRANSKRIBERING AV TALE TIL TEKST en 38 år gammel mann som er siktet for drapet på sin kone på Nesbyen vil ikke motsette seg varetektsfengsling tre barn som ble funnet drept i formiddag og det var ektemannens selv som var slutt politiet igjen etterpå gammel mann som er siktet for drapet på sin kone på nye spillere billig beklager men han som er siktet for drapet på sin kone på nye spillere hvile ikke motsette seg varetektsfengsling trebarnsmor ble funnet drept i formiddag og ektemann selv som varslet politiet gammel mann som er siktet for drapet på sin kone på ikke motsette seg varetektsfengsling som ble funnet drept i formiddag og det selv som politiet Google Speech Bing Speech Kombinert • Kommersielle API’er for norsk tale • Kombinerer flere for bedring av resultat
  18. 18. 18
  19. 19. RECENT CONTROVERSY IN ADVERTISING MEDIA • Camera analyzing a face looking at the advertisement • Analytics applied to detect age, sex, attention time, etc. • Different products shown to different people. 19
  20. 20. 20
  21. 21. ACTUAL USE-CASE: NRK • Recognize the identity of every guest in a given TV show • Monitor the presence of each guest through the program 1. Detection of faces: Detect all visible faces throughout the TV program 2. Optical character recognition (OCR): Read information boxes from on-screen TV graphics and extract relevant text (name, affiliation) 3. Tagging of faces: Connect recognized text and identified face(s) in the actual scene. 4. Recognize faces: Predict identity of all faces not previously recognized through the whole TV program. 21
  22. 22. 22
  23. 23. GJENKJENNING AV PERSONER I BILDER OG FILM • Deteksjon av alle ansikter • Trening av modell med kjente ansikter • Gjenfinning av kjente ansikter i nye bilder og film • Følge flere personer gjennom en hel TV-sending 23
  24. 24. 24
  25. 25. • Trening av en generell bildegjenkjenner • Benytter eksempler på objekter og finner dem i et bilde • Deep learning med convolutional neural network DETEKSJON AV ELEMENTER I ET BILDE
  26. 26. DETEKSJON AV TEKST I BILDER OG FILM 26 • Uthenting av tekstuelt innhold kan gjøres med stor nøyaktighet. • Formattering kan også ivaretas med tilhørende logikk. • Tekst kan analyseres, generere data/metadata m.m. • I eksempelet til høyre kan man se hvilken tittel Anne Lise Kristensen hadde på tidspunktet opptaket ble gjort. Dette lagres som data om henne.
  27. 27. DETEKSJON AV TEKST I DOKUMENTER, BILDER OG FILM 27 • Uthenting av tekstuelt innhold kan gjøres med stor nøyaktighet. • Formattering kan også ivaretas med tilhørende logikk. • Skannete dokumenter, fotografier og bilder tatt med mobilkamera. THE UNIVERSITY OF BRITISH COLUMBIA TRANSCRIPT OF ACADEMIC RECORD OFFICE OF THE REGISTRAR 2016 - 1874 East Mall VancouverB.C., Canada v6T 121 Page: Student Number 5978 1989 Date of Birth: November XX , 19XX Date Printed: May 26 , 1999 Issued to: XXX, XXX 2780-2 Fairview Crescent Vancouver, BC Canada v6T 2B9 Registrar NOTE: TRANSCRIPT VALID ONLY IF BEARING THE REGISTRAR's SIGNATURE THIS TRANSCRIPT IS PRINTED ON SECURE PAPER ON A BLUE BACKGROUND Credit Credit Clas End of Record Course val Course Title Gr LGr stg Rec'd T Siz Avg BIOL 412 (3.0) PHYTOGEOGRAPHY 93A+ 3. 0 1 61 71 CONS 500 (4.0) SEM IN BIOL CONS 75B 4.0 1 16 84 FRST 495 (3.0) BIO DIV&FRST MGT. 74B 3.0 1 58 76 Verifisering og uttrekk av data fra dokumenter inkl. formelle dokumenter (f.eks. ifm. Søknad)
  28. 28. STUDIO PRESENCE IN THE TV-SHOW 28 Each guests presence in the program is mapped along a timeline.
  29. 29. 29
  30. 30. I hjelper vi våre kunder med å bli digitale vinnere! Sammen med kunden utvikler vi innovative digitale løsninger, som sørger for at kunden styrker sin posisjon i markedet. 30
  31. 31. 31

×