Projekt Navigátor -
datová část
aneb prosba o zpětnou vazbu, vlastně.
15. 6. 2018, Josef Šlerka, NFNZ
Co vlastně teď dělám
nastoupil jsem jako ředitel Nadačního fondu nezávislé
žurnalistiky
zůstal jsem vedoucím Studia nových médií na FF UK
a začala mne zajímat tak trochu jiná data a vlastně se
trochu vracím k datové žurnalistice
Inspirace
How Machines Learn to Be Racist
https://www.propublica.org/article/breaking-the-black-
box-how-machines-learn-to-be-racist?word=Trump
Navigátor
jak složité je podobný projekt replikovat?
jaké jsou ještě další možnosti využít Rko pro
mapování médií?
co vlastně může říct datařina k mediální praxi?
a co kurva čeština?
a podobně….
UDPIPE
kupodivu to už není až takové peklo a poděkování
patří zejména UFALu za knihovnu UDPIPE
https://github.com/bnosac/udpipe
https://bnosac.github.io/udpipe/docs/doc5.html
https://gist.github.com/josefslerka/
9dce4cfc1c152883145f846ce81d5f21
word2vec
https://en.wikipedia.org/wiki/Word2vec
http://www.mlguru.com/cs/word2vec-jednoducha-
aritmetika-se-slovy/
https://github.com/bmschmidt/wordVectors
http://bookworm.benschmidt.org/posts/2015-10-25-
Word-Embeddings.html
Výsledky
Live demo.
Co dál?
Co by se ještě tak dalo…
Text minig in R
https://www.tidytextmining.com/
LDA a tématické celky
Kam to směřuje…
Nadační fond nezávislé žurnalistiky, Studia nových
médií a Mediální studia FSS MÚ společně pracují na
projektu mediálního navigátoru.
Ten bude obsahovat jak Word2Vec, tak LDA ale i další
jako třeba hlídání vývoje článku v čase… (ukázka a
díky pro Michala Bláhu!)
Děkuju za pozornost!
@josefslerka

Projekt Navigátor - datová část