Túlélőkészlet adatáradat
esetére
Makkie Klauwe
Plan the city

Amszterdam
„Könnyű lopás”
Rend a lelke mindennek
Adatok
Linked data
Open data

Structured data
Unstructured data
Stb
Linked data
Strukturált

Triplet = SVO (subject-verbobject)
SPARQL endpoint

szemantikus
Linked data
Kalóztámadások (UvA)

RPG használat
Nem hajózzunk az Ádeniöbölbe
GDELT
GDELT

Global Database of
Events, Language, and
Tone
Strukturált adatbázis
GDELT
Geo-kódolás

CAMEO kódok
GDELT
CAMEO
Conflict and Mediation
Event Observations
Codebook

Verbs (Assult, Fight,
Demand, Coerce stb.)
Actors
Korpuszok
Google Ngram
Culturomics

Szöveges információ
Szógyakoriság
R-index
• The Economist Intelligence
Unit R-word Index
• Itt Google Ngram 1-gram
korpuszon vizsgáltuk
• Recesszió és kapcs...
R-index
• A nyomtatott könyvek
jelentős részét vizsgálja (110% között)
• Nem elfogult (ponyvától
a szépirodalomig)
Webkettő

 Felhasználói tartalmak
 Blogok, hozzászólások
 Közösségi média
 Mind szöveges, strukturálatlan adatot gener...
Közösségi média
• Szentimentelemzés

• Polaritás mérés
• Három, vagy öt elemű
skála

• Pozitív, negatív, semleges
• Monito...
Közösségi média
• Emócióelemzés

• Ekman skála
• Viselkedési vizsgálatokra is
alkalmas
Közösségi média
• Tartalomelemzés
Közösségi média
•Tartalomelemzé

•„Retorikai
összefüggések”
A méret a lényeg?
Small data vs. Big data
Small Data

• Hagyományos
csv és excel fájlok
• Nyilvános adatok
• Kutatási
beszámolók
Small Data

“Small data is the
amount of data you
can conveniently
store and process on
a single machine, and
in particula...
Big Data
Big data is the term for a
collection of data sets so
large and complex that it
becomes difficult to
process usin...
Big Data vs Small Data

• Nincs határ,
ami ma nagy,
holnapra kicsi
lehet
A nyitottság számít

opendata.hu
@zoltanvarju
zoltan.varju@precog
nox.com

Kereső Világ
http://kereses.blog.hu/
Upcoming SlideShare
Loading in...5
×

Varjú Zoltán - Túlélőkészlet adatáradat esetére

135

Published on

MIBE Konferencia, 2013. október 3.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
135
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Varjú Zoltán - Túlélőkészlet adatáradat esetére

  1. 1. Túlélőkészlet adatáradat esetére
  2. 2. Makkie Klauwe Plan the city Amszterdam „Könnyű lopás”
  3. 3. Rend a lelke mindennek
  4. 4. Adatok Linked data Open data Structured data Unstructured data Stb
  5. 5. Linked data Strukturált Triplet = SVO (subject-verbobject) SPARQL endpoint szemantikus
  6. 6. Linked data Kalóztámadások (UvA) RPG használat Nem hajózzunk az Ádeniöbölbe
  7. 7. GDELT GDELT Global Database of Events, Language, and Tone Strukturált adatbázis
  8. 8. GDELT Geo-kódolás CAMEO kódok
  9. 9. GDELT CAMEO Conflict and Mediation Event Observations Codebook Verbs (Assult, Fight, Demand, Coerce stb.) Actors
  10. 10. Korpuszok Google Ngram Culturomics Szöveges információ Szógyakoriság
  11. 11. R-index • The Economist Intelligence Unit R-word Index • Itt Google Ngram 1-gram korpuszon vizsgáltuk • Recesszió és kapcsolódó szavak gyakorisága
  12. 12. R-index • A nyomtatott könyvek jelentős részét vizsgálja (110% között) • Nem elfogult (ponyvától a szépirodalomig)
  13. 13. Webkettő  Felhasználói tartalmak  Blogok, hozzászólások  Közösségi média  Mind szöveges, strukturálatlan adatot generál
  14. 14. Közösségi média • Szentimentelemzés • Polaritás mérés • Három, vagy öt elemű skála • Pozitív, negatív, semleges • Monitorozásra
  15. 15. Közösségi média • Emócióelemzés • Ekman skála • Viselkedési vizsgálatokra is alkalmas
  16. 16. Közösségi média • Tartalomelemzés
  17. 17. Közösségi média •Tartalomelemzé •„Retorikai összefüggések”
  18. 18. A méret a lényeg? Small data vs. Big data
  19. 19. Small Data • Hagyományos csv és excel fájlok • Nyilvános adatok • Kutatási beszámolók
  20. 20. Small Data “Small data is the amount of data you can conveniently store and process on a single machine, and in particular, a highend laptop or server” - Forrás: http://blog.okfn.org/2013/04/26/whatdo-we-mean-by-smalldata/#sthash.Njg5ElNd.dpuf
  21. 21. Big Data Big data is the term for a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications. – Forrás: http://en.wikipedia.org/wiki/Big_data
  22. 22. Big Data vs Small Data • Nincs határ, ami ma nagy, holnapra kicsi lehet
  23. 23. A nyitottság számít opendata.hu
  24. 24. @zoltanvarju zoltan.varju@precog nox.com Kereső Világ http://kereses.blog.hu/
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×