Razumevanje Naravnega Jezika, Tekst, Kontekst

Loading...

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

0 comments

Post a comment

    Post a comment
    Embed Video
    Edit your comment Cancel

    Favorites, Groups & Events

    Razumevanje Naravnega Jezika, Tekst, Kontekst - Presentation Transcript

    1. Razumevanje naravnega jezika, tekst, kontekst [email_address] AI urice IV
    2. Kaj pomeni pomen ?
    3. “ Pomen je uporaba sama.” – Wittgenstein
    4. Od filozofije k nevroznanosti
      • Epizodičen spomin >>
      • Konkreten dogodek
      • kontekst
      • Hebbovo pravilo
      • semantičen spomin
      • Abstrakten koncept
    5. Ozemljitev ali zakaj je mačka mačka
    6. Ozemljitev
      • Zunanji sklic
        • Čim komuniciramo prevajamo v prenosljivo obliko
      • Pomen gradimo sloj za slojem iz primitivnih izkustev
    7. Pomen je uporaba
      • Sopojavitve
        krma kobilica krava živina x   x jadrnica x x   travnik   x x
    8. Od pomena k prostoru Pomensko podobne besede blizu skupaj
    9. Razdalja
      • Kosinusna
      • d = (/ (dot a b) (l2-norm a) (l2-norm b))
      • Evklidska
      • d = (sqrt (sum #’square (vector- a b)))
    10. Problem: sopomenke
      • Rešitev: Latenten pomen
              Izjemno x     fantastično   x x odlično   x   izvrstno x    
    11. Latenten pomen
      • Zmanjšanje dimenzionalnosti (kompresija)
        • Kategorije (ozemljitev)
      • Sorodne besede se sesedejo v eno
      • Pomeni višjega reda (koncepti)
    12. Z vsakim branjem vnašamo pomen
    13. Praktični pomisleki
    14. Obteževanje
      • Besede nosijo različno pomena:
      • vsaj v. dideskalije
      • Stopwords
      • Tf-idf
      • Kurtoza
    15. Stopwords
      • Prepogoste besede
      • Preredke besede
    16. Tf-idf
      • (defun tf-idf (word document documents)
      • (* (/ (count word document)
      • (length document))
      • (/ (length documents)
      • (count (lambda (document)
      • (find word document)) documents)))
    17. Kurtoza
      • (defun mean (xs)
      • (/ (sum xs) (length xs)))
      • (defun central-moment (k xs)
      • (/ (sum (lambda (x)
      • (expt (- x (mean xs)) k))
      • xs)
      • (length xs))
      • (defun kurtosis (xs)
      • (/ (central-moment 4 xs))
      • (expt (central-moment 2 xs) 2)))
    18. Kurtoza = 7.6 Kurtoza = 1.4 Kurtoza = 5.1
    19. Korenske oblike
      • Sklon/spregatev, število, spol, velike/male črke
      • Problem: včasih oblike niso enakomerno porazdeljene po vseh pomenih
    20. Random Indexing
    21. Ideja
      • Beseda je vsota svojih kontekstov
      • Kontekst je vsota svojih besed
    22. Random indexing
      • Za vsak kontekst:
      • Nov indeks konteksta [epizodični spomin]
      • Prištej indeks konteksta [Hebbovo
      • vsem besedam konteksta pravilo]
    23. Indeks konteksta
      • Visoko-dimenzionalen (> 1000)
      • Naključen
      • Redek
      • Trojiški
      • Skoraj pravokotni (ohranjanje razdalj)
      • Peščica naključno posejanih 1 in -1
    24. Uporaba
      • Primerjanje besed med sabo
        • Dopolnjevanje poizvedb
      • Primerjanje teksta s tekstom
        • Grozdenje
        • Iskanje
        • Priporočila
      • Primerjanje teksta in besede
        • Iskanje ključnih besed
        • Priporočanje tagov
    SlideShare Zeitgeist 2009

    + Simon BelakSimon Belak Nominate

    custom

    43 views, 0 favs, 0 embeds more stats

    More info about this document

    CC Attribution-ShareAlike LicenseCC Attribution-ShareAlike License

    Go to text version

    • Total Views 43
      • 43 on SlideShare
      • 0 from embeds
    • Comments 0
    • Favorites 0
    • Downloads 0
    Most viewed embeds

    more

    All embeds

    less

    Flagged as inappropriate Flag as inappropriate
    Flag as inappropriate

    Select your reason for flagging this presentation as inappropriate. If needed, use the feedback form to let us know more details.

    Cancel
    File a copyright complaint
    Having problems? Go to our helpdesk?

    Categories