28. CORE IDEAS
Training / Validation
With all machine learning techniques it
is critical to divide data into training
and validation sets.
The algorithm can then be tested
(validated) on data it has never seen
before to ensure it generalizes
4Quant | BIG IMAGE
ANALYTICS
29. OUTPUT / LOSS FUNCTION
4Quant | BIG IMAGE
ANALYTICS
The in order for machine learning to work there has to be a
single output for the system which quantifies how well it is
working
- the number of correctly identified structures (true-
positives)
- the number of correct letters in a sentences
- the score of a game
31. PROBLEMS
Features can be very difficult
to ‘engineer’.
What makes a person a
person?
More data doesn’t always
lead to better results.
4Quant | BIG IMAGE
ANALYTICS
33. One of these can recognize without any
programming by just experiencing and
getting feedback.
THE IDEA
4Quant | BIG IMAGE
ANALYTICS
https://flic.kr/p/2eryEj
34. The human brain is a large, layered,
connected network of neurons.
THE IDEA
4Quant | BIG IMAGE
ANALYTICS
https://flic.kr/p/5J4uci
35. We understand how some of these
layers work and can make
computationally fast models for
simulating their behavior
THE IDEA
4Quant | BIG IMAGE
ANALYTICS
36. DEEP LEARNING
Deep learning is a set of algorithms in machine learning that
attempt to learn in multiple levels, corresponding to different
levels of abstraction.
4Quant | BIG IMAGE
ANALYTICS
37. THE IDEA
4Quant | BIG IMAGE
ANALYTICS
A machine learning system with millions of inputs
And 1 output
38. THE IDEA
4Quant | BIG IMAGE
ANALYTICS
The networks can get very large (hence the deep)
Here is the Inception Network from Google
39. TYPES OF ARTIFICIAL NEURONS
4Quant | BIG IMAGE
ANALYTICS
Fully-connected → everything connected to everything
Convolutional (CNN) → mix things together
Recurring (RNN) → remember parts of sequences
41. Recurring Networks
4Quant | BIG IMAGE
ANALYTICS
http://karpathy.github.io/2015/05/21/rnn-effectiveness/
Given the starting letter h
Predict the rest of the letters
42. SCHWIIZERDÜTSCH
4Quant | BIG IMAGE
ANALYTICS
Goes through hundreds of
pages of text character by
character and trains
neurons to predict the
correct output
43. The text shows the algorithm learning to complete the
sentence.
The curve shows how confident it is in each guess
SCHWIIZERDÜTSCH
4Quant | BIG IMAGE
ANALYTICS
44. 100 gu sisxt n eigeiua a esSWctaicobemhat,E out?s v t t uew
10K Uhe uf Hountigm don d’Bomura fürsyn al jerisim Sbeour Rucch
65K Übschamt wiänä wo und ebs haGscham, üblart uls zä flusch, zänsert.
De Unner sindämzalagsel
100K Totatwärt. Dischtä Tittä vo dä ues und erwiä Gsacht agä
schtüswongeilä. Beterischtiongehärne vordä em Verbichunt. Diä
Mieräng ader h d Zientlichnig vu CHF
4Quant | BIG IMAGE
ANALYTICS
SCHWIIZERDÜTSCH
45.
46. Spell/Grammar Check (for a language with ‘no rules’)
Dialect Detector
Autocomplete
APPLICATIONS
4Quant | BIG IMAGE
ANALYTICS
61. MEDICAL IMAGES
4Quant | BIG IMAGE
ANALYTICS
Convolutional neurons act on the image and learn to
extract the relevant information
62. MEDICAL IMAGES
4Quant | BIG IMAGE
ANALYTICS
These representations can then be used to automatically
find organs like the heart and measure blood flow
→ →
63. MEDICAL IMAGES
4Quant | BIG IMAGE
ANALYTICS
These representations can then be used to automatically
find organs like the heart and measure blood flow
→ →
64. Open Challenges
4Quant | BIG IMAGE
ANALYTICS
You need a lot of data to identify (1K-100M)
Some networks learn well, others do not
Parameters can make a huge difference
Intermediate layers can be difficult to interpret
65. RESOURCES
Google Cloud Vision API
IBM Watson Vision Service
Microsoft Project Oxford
TensorFlow
Caffe
Moodstocks
4Quant
66. PRACTICAL INTRODUCTION TO
ARTIFICIAL INTELLIGENCE
DEEP LEARNING
LARGE-SCALE IMAGE ANALYTICS
THANK YOU
KEVIN MADER / FLAVIO TROLESE
4Quant Ltd.
PANTALK
THURSDAY MARCH 19 2016 / IMPACTHUB GARAGE ZURICH
4Quant| BIG IMAGE ANALYTICS
Editor's Notes
Programmieren -> Einer Maschine beibringen was sie machen soll.
Etwas beibringen was man nicht selber kann?
Arthur Samuel 1956 -> ihn im Spiel Dame schlagen
Computer tausende Male gegen sich selbst spielen, sodass er Dame spielen lernte.
Das funktionierte wirklich, und schon 1962 besiegte dieser Computer den Landesmeister von Connecticut.
Arthur Samuel -> Urvater des Maschinellen Lernens
1997 gewann Deep Blue gegen Kasparow einen ganzen Wettkampf aus sechs Partien unter Turnierbedingungen.
Amazon, Netflix -> Kaufempfehlungen oder Filmvorschläge.
LinkedIn oder Facebook
IBM Watson -> zwei Weltmeister der "Jeopardy" schlagen,
"2003 verschwand u. a. der antike 'Löwe von Nimrud' aus dem Museum dieser Stadt."
selbstfahrende Autos. Unterschied etwa zwischen Baum und Fußgänger erkennen
Dieses Auto ist schon über 1 Mio. km ohne den kleinsten Unfall auf normalen Straßen gefahren.
Computer können lernen -> auch Dinge, von denen wir nicht wissen, wie sie funktionieren, und manchmal sogar besser als wir.
kein Vorwissen zu Chemie oder Biowissenschaften hatte und nur zwei Wochen brauchte.
-> Deep Learning.
Deep Learning basiert auf der Funktion des menschlichen Gehirns und deswegen ist es ein Algorithmus, dessen Funktion theoretisch keine Grenzen gesetzt sind. Je mehr Daten und Rechenzeit man hat, desto besser wird er.
zuhören und ‘verstehen’
Chinese, English, French, German, Italian, Portuguese, Spanish
-> programmierer kann kein chinesisch
Deep Learning -> ein einziger Algorithmus
Wettbewerb der Universität Bochum zum Erkennen von Verkehrszeichen hat Deep Learning gelernt,
Menschen übertraf und zwar um das Doppelte.
2011 gab es also das erste Beispiel für Computer, die besser sehen können als Menschen.
2012 gab Google bekannt, dass sie einen Deep-Learning-Algorithmus Youtube -> 16 000 Computern einen Monat
allein Konzepte Menschen oder Katzen erkannt hat.