7. Initiële onderzoeksvragen
● Invloed op uitvoer wanneer bepaald
attribuut/relatie verandert in invoer
● Visualisatie van geleerde features, i.f.v.
aantal lagen
Hoe leert een neuraal netwerk
over de wereld waarin het zich
bevindt?
● Visual Genome: bevat
uitgebreide spatiale relaties
in de tekst
Kunnen we de beeld
representatie verbeteren?
9. Onderzoeksvragen (bijgesteld)
● Invloed op uitvoer wanneer bepaald
attribuut/relatie verandert in invoer
● Visualisatie van geleerde features, i.f.v.
beperkingen (aantal lagen, dimensies)
Hoe goed leert een
bestaand tekst-naar-beeld model
met beperkte middelen?
● Visual Genome: bevat
uitgebreide spatiale relaties
in de tekst
Kunnen we de beeld
representatie verbeteren?
11. Deep Learning: neural networks
Rosenblatt, F. (1958). The perceptron: A probabilistic model for information storage and
organization in the brain. Psychological review, 65(6), 386.
33. Evaluatie resultaten
DATASET: CUB Ons model StackGAN++
Inception Score 4,16 4,04±0,05*
FID 263,20 Niet gepubliceerd
SWD 0,05 Niet gepubliceerd
* gebruikten niet-standaard model
METRISCH ERROR EVALUATIE
(In toekomstige
experimenten)
34. Verder werk
● Loss functie
● Meer training
Betere tekst-beeld overeenkomst
● Andere datasets
● Spatiale relaties
Originele onderzoeksvragen
FOCUS: voldoende diepgang
Kies enkele slides waar we echt diep gaan
JOPPE
JOPPE
WAT?
automatisch genereren van beeld dat de inhoud van natuurlijke taal voorstelt,
automatisch vertalen van tekst naar pixels van een beeld
→ niet google image search
Zeer recent onderzoeksveld
Nu pas mogelijk door sterke GPU’s
JOPPE
WAT?
automatisch genereren van beeld dat de inhoud van natuurlijke taal voorstelt,
automatisch vertalen van tekst naar pixels van een beeld
→ niet google image search
Zeer recent onderzoeksveld
Nu pas mogelijk door sterke GPU’s
JOPPE
WAAROM?
Interpreteren van kennis opgedaan door neurale netwerken
Commando’s geven in natuurlijke taal
Zelfrijdende auto kan zich situeren in de visuele ruimte en tekst commando's (‘stop aan het blauwe huis’) begrijpen
Begrip van hoe “gezond verstand” tot stand komt
Automatisch boek → film
JOPPE
HOE?
Generatief model, geïmplementeerd met neuraal netwerk: GAN
JOPPE
JOPPE
Obstakels
Rekenkracht
Paralleliseren
Datasets
Variabelen en hyperparameters
JOPPE
Onderzoeksdoel deels herzien (visualisatie behouden)
Reproduceer bestaand tekst-naar-beeld model
Beperkte middelen, wat is het resultaat?
Wat leert het netwerk onder bepaalde constraints?
JOPPE
ARTHUR
Bestaan uit Perceptrons georganiseerd in lagen
Bootsen allerlei functies na
Relatief oud idee
Gpu innovatie -> sterke toename aan mogelijkheden
Arthur
Bestaan uit Perceptrons georganiseerd in lagen
Bootsen allerlei functies na
Relatief oud idee
Gpu innovatie -> sterke toename aan mogelijkheden
Arthur
Gradient descent (in meerdere dimensies!)
Backpropagation
Arthur
Filter over meerdere pixels
Perceptrons houden meer rekening met (ruimtelijke) context
Arthur
Filter over meerdere pixels
Perceptrons houden meer rekening met (ruimtelijke) context
Arthur
Usampling
Genereren van features
Arthur
Makkelijker creëren van structuur
ARTHUR
Model moet input kunnen begrijpen
Is pretrained op taal, specifiek voor onze dataset
Char-CNN-RNN structuurRNN capteert sequentiële structuur van Engelse taal goed
ARTHUR
2 neurale netwerken
Leren tegen elkaar op
Discriminator fungeert als loss function
Terwijl de generator leert genereren leert de discriminator hem beoordelen
Arthur
Arthur
Optimalisatieprobleem → definieer te optimaliseren waarde (L_G, L_D)
Loss Discriminator -> Loss functie Generator
Generator : Wordt dit geaccepteerd door discriminator?L_BCE: Classificatieperformantie van disc op gegenereerde data:G wilt dat dit altijd ‘1’ is → L_BCE minimaliseren
Discriminator : Werd juiste inschatting gemaakt?Indicatie van classificatie-performantie op echte, gegenereerde en mismatch tekst-beeldMinimaliseren ongelijkheid tussen a) echte data, uniforme verd 1, b) gegenereerde data, unifome 0, c) mismatch, uniforme 0
JOPPE
IS: meest gebruikt, leg uit
FID & SWD: inschatting van afstand tussen 2 verdelingen
arthur
Enkelvoudige GAN
Arthur
Multi-Gan Model
Geïtereerde generatie
Iteratief verhogen van de resolutie
Verschenen 19 okt 2017
ARTHUR
JOPPE
JOPPE
Toekomstige experimenten
(low resource setting)
0
JOPPE
13300
JOPPE
53000
JOPPE
83600
JOPPE
95000
JOPPE
297100
JOPPE
Als we vergelijken met de SOTA (op andere datasets) zijn deze scores beduidend slechter.
Maar: wij zitten met beperkte resources
JOPPE