Sissejuhatus andmekaevesse haridusesMart Laanpere
Mis on andmekaeve? Prognooside ja mustrite automatiseeritud   väljasõelumine suurtest andmekogudest Populaarsuse põhjuse...
Näiteid http://www.educationaldatamining.org/JEDM Koostöömustrite kaevandamine tuutori   nõustamisvestlustest Algaja in...
Mille poolest AK erineb statistikast?    Statistikud koguvad üldjuhul sihipäraselt oma      andmestiku, andmekaevajad kas...
Andmekaeve protsess            Allikas: Wikipeedia
Peamised andmekaeve tehnikad Klassikalised tehnikad:   Statistika:     keskmised, hajuvus, histogramm, regressi     oon ...
Harjutus: histogramm Koosta histogramm AKU õpiku ptk. 3.6 põhjal Box.com/AKU12
Harjutus: Google Analytics Demo: Dippleri analüütika Loo endale GA konto ja lisa see oma blogile
Demo: lineaarne regressioon Weka: http://www.cs.waikato.ac.nz/~ml/weka/ Lineaarne regressioon Weka abil
Harjutus: Twitteri analüüs http://www.technologyreview.com/view/421201/h   ow-to-use-twitter-for-personal-data-mining/ V...
Demo: otsustuspuu http://www.stylusandslate.com/decision_trees/
Kirjandus Innar Liiv (2002) Andmekaevandamine. AA Kurt Thearling (2010) Data Mining Techniques Educational Data Mining ...
Upcoming SlideShare
Loading in...5
×

Sissejuhatus andmekaevesse hariduses

418

Published on

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
418
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
1
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "Sissejuhatus andmekaevesse hariduses"

  1. 1. Sissejuhatus andmekaevesse haridusesMart Laanpere
  2. 2. Mis on andmekaeve? Prognooside ja mustrite automatiseeritud väljasõelumine suurtest andmekogudest Populaarsuse põhjused: suuremad andmehulgad, digitaalsed jalajäljed, kiiremad arvutid, analüütika, open linked data, soovitus- süsteemid Kust tulevad andmed: logifailid, andmebaasi- tarkvara, sotsiaalmeedia, nuhkvara… Andmed > Informatsioon > Teadmus > Tarkus
  3. 3. Näiteid http://www.educationaldatamining.org/JEDM Koostöömustrite kaevandamine tuutori nõustamisvestlustest Algaja internetikasutaja toevajaduse analüüs Tõenäosuslik mudel relevantsete ja mitterelevantsete lausete eristamiseks matemaatikaülesannetes
  4. 4. Mille poolest AK erineb statistikast?  Statistikud koguvad üldjuhul sihipäraselt oma andmestiku, andmekaevajad kasutavad arvutisüsteemides tekkivat andmesegadust  Osa andmekaeve tehnikatest põhineb statistikal  Andmekaeve võimaldab proaktiivset tegutsemist  Andmekaeve on pigem tulevikku-, statistika tagasivaatav
  5. 5. Andmekaeve protsess Allikas: Wikipeedia
  6. 6. Peamised andmekaeve tehnikad Klassikalised tehnikad:  Statistika: keskmised, hajuvus, histogramm, regressi oon  Lähimad naabrid  Klasteranalüüs: hierarhiline, k-means Uue põlvkonna tehnikad:  Otsustuspuud  Tehisnärvivõrgud  Reeglite tuletamine
  7. 7. Harjutus: histogramm Koosta histogramm AKU õpiku ptk. 3.6 põhjal Box.com/AKU12
  8. 8. Harjutus: Google Analytics Demo: Dippleri analüütika Loo endale GA konto ja lisa see oma blogile
  9. 9. Demo: lineaarne regressioon Weka: http://www.cs.waikato.ac.nz/~ml/weka/ Lineaarne regressioon Weka abil
  10. 10. Harjutus: Twitteri analüüs http://www.technologyreview.com/view/421201/h ow-to-use-twitter-for-personal-data-mining/ Viige selle näite eeskujul läbi Wordle analüüs oma Twitteri (vms) andmevoo baasil
  11. 11. Demo: otsustuspuu http://www.stylusandslate.com/decision_trees/
  12. 12. Kirjandus Innar Liiv (2002) Andmekaevandamine. AA Kurt Thearling (2010) Data Mining Techniques Educational Data Mining Society: http://www.educationaldatamining.org Knowledge Discovery Nuggets: http://www.kdnuggets.com
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×