3. dataHacker.rs
Šta je klasifikacija?
Nakon pronalaženja funkcije za klasifikaciju, možemo za
novu tačku (podatak) odrediti kojoj klasi pripada, tj. sa
koje strane linije se nalazi.
Nova test tačka
4. dataHacker.rs
Šta je klasifikacija?
Najjednostavniji oblik klasifikacione funkcije je prava linija.
Ukoliko pravom možemo razdvojiti dve klase, kažemo da su
klase linearno separabilne.
Na slici je dat primer dve klase koje su linarno neseparabilne.
6. dataHacker.rs
Indeksiranje elementa u NumPy
X [0, 0] X [0, 1]
X [1, 0] X [1, 1]
X [2, 0] X [2, 1]
X [3, 0] X [3, 1]
X [4, 0] X [4, 1]
X [5, 0] X [5, 1]
prva kolona
X[:,0]
druga kolona
X[:,1]
treći red X[2,:]
Indeksiranje u Python-u počinje od 0.
X[“red”,”kolona”]
X[0,0] predstavlja podatak koji se nalazi u prvom redu I
prvoj koloni.
9. dataHacker.rs
Linearni klasifikator
Pokušajmo da kreiramo “ručno” funkciju koja deli
skupove u dve klase. Neka je 𝑓(𝑥1, 𝑥2) = 𝑥1+𝑥2-1
Za 𝑓(𝑥1, 𝑥2) =0
dobijamo tačke koje
definišu pravu (crvena
linija).
10. dataHacker.rs
Linearni klasifikator
𝑓(𝑥1, 𝑥2) = 𝑥1+𝑥2-1. Kod linearnog klasifikatora cilj je
odrediti koeficijente: uz 𝑥1(1), uz 𝑥2(1) i -1.
Tačka (1,1) će biti iznad
prave i pripadaće klasi 2.
jer je 𝑓 𝑥1, 𝑥2 = 1 +
1 − 1 = 1 > 0
Tačka (-1,-1) će biti ispod
prave i pripadaće klasi 1.
jer je 𝑓 𝑥1, 𝑥2 = −1 −
1 − 1 = −3 < 0
11. dataHacker.rs
LDA u Pythonu
Linearnu klasifikaciju nam olakšava biblioteka sklearn.
Njoj samo prosledimo podatke kao matricu X. Prosledimo i vektor y
koji nam kaže kojoj klasi neki element pripada.
Koristeći naredbu .fit() obučavamo parametre linearnog
klasifikatora.
12. dataHacker.rs
LDA u upotrebi
Definišemo test tačku koja ima dimenzije (1,2)-
dvostruke uglaste zagrade zato koristimo.
Primenom naredbe .predict() dobijamo da ova tačka
pripada klasi 1.