OKMU 2.1 Osnovne grupe algoritama mašinskog učenja i njihove osobine

Osnovne grupe algoritama
mašinskog učenja i njihove osobine
1

Cilj nedelje
• Za svaki prikazani algoritam:
– Osnovni principi funkcionisanja
– Okolnosti u kojima daje najbolje rezultate
– Parametri podešavanja –njihov uticaj, najbolji
opsezi vrednosti u različitim okolnostima
2

Osnovne grupe algoritama mašinskog
učenja i njihove osobine
• Načini grupisanja
– Na osnovu načina na koji algoritam uči
– Na osnovu načina na koji algoritam radi
3

Grupisanje algoritama na osnovu
načina na koji uče
• Nadgledano i nenadgledano učenje
• Online i batch učenje
• Učenje zasnovano na instancama i učenje
zasnovano na modelu
4

Nadgledano i nenadgledano učenje
• Nadgledano učenje
– Podaci sadrže i rešenje
• Klasifikacija
• Regresija
• Nenadgledano učenje
– Podaci nisu označeni
• Polunadgledano učenje
– Podaci za trening su delimično označeni
• Učenje sa podrškom (reinforcement)
– Kod softverskih agenata
5

Nadgledano učenje
• Za predviđanje budućnosti se koriste podaci
• Uspotavljanje funkcije koja povezuje ulaznu (x)
i izlaznu promenljivu (y)
– y = f(x)
• Cilj – aproksimiranje f-je, tako da za novo x
može da se predvidi y
• Klasifikacija i regresija
6

Regresija
• Vrednost izlazne promenljive y je kontinualna i
numerička
• Količine ili veličine
• Predviđanje cene kuće
• Tačnost modela se obično izražava srednjom
kvadratnom greškom (suma razlike kvadrata tačne i
predviđene vrednosti)
• Algoritmi
– Linearna regresija
– Polinomijalna regresija
– Regresiona stabla
7

Klasifikacija
• Aproksimacija f-je koja povezuje ulazne promenljive sa
diskretnim izlaznim vrednostima
• y - kategorija koju funkcija predviđa
• Cena kuće veća ili manja od preporučene
• Tačnost se izračunava kao procenat tačno klasifikovanih
primeraka, u odnosu na sve klasifikovane promerke
• Algoritmi
– Logistička regresija
– Naivni bayes
– Stabla odlučivanja
– KNN
8

Nenadgledano učenje
• Ulazni podaci nisu označeni
• Traži se pravilnost u podacima
• Zadaci
– Grupisanje (klasterovanje)
• Podaci se svrstavaju u grupe u cilju maksimacije sličnosti ili minimizacije različitosti
– Smanjenje dimenzionalnosti
• Traži se manji skup promenljivih koji zadržava glavne obrasce iz početnog skupa
promenljivih
– Asocijativna pravila
• Analiza velikih količina podataka i pronalaženje veza između atributa
• Analiza onih koji čitaju neki blog
• Algoritmi
– K-means
– PCA (principal component analysis)
– Učenje na bazi asocijativnih pravila (apriori)
9

Polunadgledano učenje
• Kombinacija nadgledanog i nenadgledanog
učenja
• Obeležen (manji deo), neobeležen (veći deo)
• Razlozi
– Označavanje velikih količina podataka je skupo
– Moguće su greške, ako to radi čovek
• Google photos
10

Učenje sa podrškom (reinforcement
learning)
• Obuka softverskih agenata
• Akcije i nagrada (pozitivna i negativna)
– Signal podrške
• Agent koristi signal za korekciju svojeg
ponašanja
• AlphaGo – pobedio u igri Go
11

Paketno i kontinualno učenje
(Batch and online)
• Inkrementalno učenje
• Batch algoritmi
– Nisu sposobni za inkrementalno učenje
– Offline
– Novi podaci se dodaju celom skupu i ponovo se
trenira
– Automatizacija procesa
• Treniranje u redovnim intervalima
– Stabla odlučivanja, SVM, K-NN, Logistička regresija
12

Paketno i kontinualno učenje
(Batch and online)
• Online algoritmi
– Pojedinačne instance ili mali paketi
– Kod sistema koji koji imaju kontinualni priliv
podataka
– U slučaju ograničenih resursa
– Za treniranje sistema sa ogromnim količinama
podataka
– Brzina učenja (learning rate)
– Randomized weighted majority, Winnow
algorithm, Stochastic gradient descent, Perceptron
13

Učenje na bazi instanci i na bazi
modela
• Kako se vrši generalizacija
• Učenje na osnovu instanci
– Sličnost novih i postojećih instanci
– Rote (učenje napamet)
– K-NN
– Nearest nested hyper-rectangles
– Learning Vector Quantization
• Učenje na osnovu modela
– Prvo se napravi model, pa se on koristi za predviđanje
– Stabla odlučivanja, logistička regresija, SVM ...
14

Podela algoritama na osnovu načina
na koji rade
• Na osnovu načina na koji algoritam radi
– Regresioni,
– algoritmi zasnovani na instancama,
– algoritmi zasnovani na stablima odlučivanja,
– algoritmi sa grupisanjem (klasterovanjem),
algoritmi sa asocijativnim pravilima,
– algoritmi sa višestrukim modelima,
– Algoritmi zasnovani na kernelima
15

Bias i varijansa
• Dva međusobno suprotstavljena pojma
• Komplikovaniji modeli
– Preterano prilagođavanje podacima (overfitting)
– sistematske greška (bias) i varijansa (variance).
• Loši modeli
– Nije dovoljno tačan i ne odgovara podacima
– Nije dovoljno precizan i postoji mnogo varijacija u rezultatu
• Složeni klasifikatori
– Poboljšavaju sistematsku grešku (smanjuju je), ali se povećava
varijansa
– Smanjivanje varijanse vodi ka povećanju sistematske greške
• Ne može se imati sve
16

Bias i varijansa
• Sistematska greška (bias) - razlika između
prosečnog predviđanja modela i tačne vrednosti
koju pokušavamo da predvidimo.
• Varijansa - promenljivost u predviđanju od strane
modela.
• Y=f(X) + e
Err(x) = bias2 + varijansa + greška
17

Veza sistematske greške i varijanse
18

Odnos sistematske greške i varijanse
19

Parametarski i neparametarski metodi
• Parametarski algoritmi - broj parametara je
unapred fiksiran.
– Prilikom učenja se postavljaju neke pretpostavke
• oblik funkcije koja se traži.
• dva koraka
1. Bira se oblik funkcije
2. Traže se koeficijenti te funkcije
• Neparametarski algoritmi - ne postavljaju
pretpostavke o osnovnoj funkciji mapiranja
20

Parametarski algoritmi
• linearna funkcija mapiranja, koja se koristi kod linearne
regresije.
• a0 + a1x1 + a2x2 = 0
– a0, a1 i a2 koeficijenti linije
– x1 i x2 - dve ulazne promenljive
• Učenje znatno jednostavnije
– Pronaći koeficijente ove linije
• Pogrešna pretpostavka
– Šta ako nepoznata funkcija nije linearna?
• logistička regresija, perceptron, naivni bajes, linearna
diskrminantna analiza itd.
21

Neparametarski algoritmi
• Ipak ima parametara
– Složeniji modeli sa povećanjem količine ulaznih
podataka
– parametarski model - unapred definisan broj
parametara
– neparametarski model - broj parametara može da
potencijalno postane beskonačan.
• u stanju da se prilagode većem broju funkcija.
• k-najbližih suseda (k-nearest neighbours)
• Stabla odlučivanja (CART, C4.5), SVM (kada se
koristi rbf kernel funkcija) itd.
22

Parametarski algoritmi
• Prednosti
– Jednostavniji
– vrlo brzo se dobijaju modeli
– za njihovu obuku nisu potrebne velike količine
podataka.
• Nedostaci
– izborom funkcije unapred se ograničavaju mogućnosti
učenja,
– teško primeniti ove metode na složene probleme,
– u praksi modeli retko odgovaraju pretpostavljenoj
osnovnoj funkciji.
23

Neparametarski algoritmi
• Prednosti
– Fleksibilnost (mogu da pronađu veliki broj funkcija),
– Snaga (nema pretpostavki o osnovnoj funkciji)
– Performanse (mogu da dovedu do boljih performansi
modela, prilikom predviđanja).
• Nedostaci
– Potrebna velika količina podataka da bi se dobila funkcija,
– Sporije se treniraju
– Postoji veći rizik od preteranog prilagođavanja (overfitting)
– Teže objasniti kako se došlo do nekog rezultata.
24

Grupe algoritama
• Algoritmi zasnovani na stablima odlučivanja (decision tree)
– CART
• Algoritmi zasnovani na sličnosti instanci (instance-based)
– k-NN
• Kernel metodi
– SVM
• Bajezijan metodi
• Veštačke neuronske mreže
• Algoritmi zasnovani na asocijativnim pravilima
• Kombinovani (ensemble) metodi
– Random Forest
25

OKMU 2.1 Osnovne grupe algoritama mašinskog učenja i njihove osobine

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to OKMU 2.1 Osnovne grupe algoritama mašinskog učenja i njihove osobine

Similar to OKMU 2.1 Osnovne grupe algoritama mašinskog učenja i njihove osobine (6)

More from Milan Zdravković

More from Milan Zdravković (20)

OKMU 2.1 Osnovne grupe algoritama mašinskog učenja i njihove osobine

Editor's Notes