1. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Isključite mikrofon
tokom predavanja
Vaš mikrofon može
prenositi šum i zvuke
koji smanjuju kvalitet
zvuka predavanja
Isključite kameru
tokom predavanja
Prenos signala može
otežati prijem zvuka
zbog opterećenja
mreže
Instrukcije za
učešće na
online
predavanju
Predavanje će početi u
zakazano vreme, prema
rasporedu časova
Ukoliko imate pitanje, postavite ga kada god
želite (tokom predavanja ili nakon njega) u
chat prozoru. Na pitanja će biti odgovoreno
nakon završenog predavanja.
2. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta sve možete da
uradite sa podacima
o poslovanju svog
preduzeća?
Analiza podataka
Milan Zdravković
3. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Teme
predavanja
• Podatak, informacija i znanje
• Skladištenje podataka: baze podataka
• Analiza podataka
• Mašinsko učenje
• Poslovno predviđanje
• Računarska vizija
4. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je podatak?
• Podatak je simbol ili znak, koji
reprezentuje nekakav stimulus (koji
uočavamo čulima) ili signal. Podaci su
nekorisni, jer nemaju značenje, po sebi.
• 00110, 45, 185cm, 22A, 53km/h, true,
false, operation, d^&5D*&%asd99
5. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je
informacija?
• Informacija je prosti ili složeni iskaz koji nastaje dodeljivanjem značenja
jednom podatku (npr. postavljanjem pitanja ko, šta, gde, koliko, kada..).
• Informacija su podaci kojima je pridodato značenje i svrha - kontekst.
• Dragan je visok 185cm (Hdcm=185); Moje sedište je 22A
(s=’22A’); Brzina kretanja automobila je 53 km/h (Vakmh=53)
• Informacija može biti tačna ili netačna.
6. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je znanje?
• Postoji veliki broj različitih
tipova znanja i različitih
definicija
• Usvojena definicija
• Dva niza iskaza od kojih se
jedan može rasuditi na osnovu
drugog
• Drugi niz iskaza se rasuđuje od
prvog, na osnovu iskustva ili
zakonitosti
slika= =>
objekat_na_slici=‘Jabuka’
boja_objekta_na_slici=‘Crna’
brzina_auta=80km/h
tip_podloge=‘asfalt’
model_auta=‘Citroen C3’
=> duzina_zaustavnog_puta=17m
Niz iskaza A Niz iskaza B
broj_reci>500
domen_posilj=‘gmail.com’
broj_reci_today>20
=> verovatnoca_spam=88%
verovatnoca_nijespam=12%
spam=True
7. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je baza podataka?
• Baza podataka je organizovani skup
podataka, čije sredstvo za organizaciju
podataka je tabela.
• Jednu bazu podataka čini jedna ili više
tabela u kojima se nalaze podaci, ali i
sredstva za manipulaciju i kreiranje ovih
podataka, odnosno upiti, izveštaji,
pogledi, trigeri, transakcije i drugi
objekti.
• Jedna tabela opisuje pojam (tako što
definiše njegove atribute) i skladišti
podatke o pojavljivanjima ovog pojma
8. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je relaciona
baza podataka?
• Relaciona baza podataka je baza
podataka, čije su tabele povezane
relacijama.
• Tako, zapis o jednom pojmu iz jedne
tabele se može povezati sa jednim ili više
zapisa o drugom pojmu iz druge tabele.
• Manipulacija podacima u jednoj tabeli
može biti ograničena, ukoliko je ona
povezana relacijom sa drugom tabelom.
Na primer:
• Može biti nemoguće da se u tabelu
sa tweetovima unese tweet
korisnika koji ne postoji u tabeli sa
korisnicima.
• Može biti nemoguće brisanje
podataka o korisniku, pre nego što
se obrišu svi njegovi tweetovi.
9. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je sistem za upravljanje relacionim
bazama podataka?
• Relational Database
Management System
(RDBMS)
• Softver koji omogućava
komunikaciju korisnika (ljudi i
drugog softvera) sa bazom
podataka (prema principima
klijent/server komunikacije)
10. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Kako se upravlja
podacima u RDBMS?
• Instrukcije za rad sa podacima
• Izvlačenje podataka
• Umetanje podataka
• Ažuriranje podataka
• Brisanje podataka
• Program ili softver koji radi sa
podacima šalje instrukcije
RDBMS-u u obliku SQL
komandi
• Structured Query Language
(SQL) je jezik za upravljanje
podacima u relacionim bazama
podataka
Primer sintakse instrukcije za izvlačenje podataka
Primer sintakse instrukcije za ažuriranje podataka
12. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je analiza
podataka?
• Proces modeliranja, istraživanja,
tumačenja, vizuelizacije, čišćenja
i transformacije podataka sa
ciljem otkrivanja korisnih
informacija, radi podrške
donošenju važnih zaključaka i
odluka
• Čovek ne može da tumači veliki
broj podataka
Tabela sa podacima o Covid-19 infekcijama u RS
Vizuelizacija podataka
13. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Primeri analize podataka
• U jednoj koloni se
nalaze podaci koji
imaju isto značenje
– pripadaju nekoj
veličini
• Primena neke
agregatne funkcije
nad svim podacima
jedne veličine
• Uvođenje i
računanje vrednosti
izvedene veličine
koja se kreira na
osnovu vrednosti
drugih veličina
14. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Često korišćene funkcije za analizu
podataka (Excel)
• SUM(). Suma svih vrednosti u
izabranom skupu ćelija
• AVERAGE(). Prosečna vrednost
svih vrednosti u izabranom skupu
ćelija
• COUNT(). Broj ćelija u izabranom
skupu ćelija koje sadrže numeričku
vrednost
• MAX(), MIN(). Maksimalna i
minimalna vrednost svih vrednosti
u izabranom skupu ćelija
15. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Model za analizu
podataka
• Model čini izbor
relevantnih
veličina
(izmerenih ili
proračunatih)
• Osnovnih i
izvedenih
veličina na
osnovu čijih
vrednosti je
moguće donositi
relevantne
zaključke
16. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Vrste analize podataka
• Grupisanje podataka
• Sažimanje podataka – grupisanje po vrednostima
podataka određene veličine. Na primer, grupisanje
po polu: prosečne plate svih muškaraca i žena;
grupisanje po godinama starosti: prosečne plate
starosnih kategorija 20-29, 30-39, 40-49, 50-59,
>=60
• Analiza osnovnih statističkih veličina svih ili
grupa podataka
• Prosečna vrednost, maksimalna vrednost,
minimalna vrednost, standardna devijacija, itd.
• Analiza raspodele podataka
• Analiza broja podataka koji pripadaju određenim,
unapred definisanim intervalima
• Analiza korelacije podataka
• Utvrđivanje zavisnosti jedne veličine od drugih
Prodaja kategorija lekova grupisana po
satu u toku dana
Normalna raspodela podataka
17. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Šta je mašinsko
učenje?
• Skup metoda i pristupa zahvaljujući kojima
sistemi stiču sposobnost da uče automatski
da na osnovu podataka vrše neki zadatak, a
da nisu eksplicitno programirani za to
• Podsećanje na definiciju znanja
• Dva niza iskaza od kojih se jedan može
rasuditi na osnovu drugog
• Drugi niz iskaza se rasuđuje od prvog, na
osnovu iskustva ili zakonitosti
18. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Ulazni podaci Izlazni
Primer: Cilj je da naučimo softver da na osnovu karakteristika stana
predvidi njegovu cenu na tržištu
Postojeći istorijski podaci o prodaji stanova
IF(B==3 and P==2000 and N=‘n’) SP=250000
ELSE IF(B==2 and P==800 and N=‘h’) SP=300000
ELSE IF(B==2 and P==850 and N=‘n’) SP=150000
ELSE IF(B==1 and P==550 and N=‘n’) SP=78000
ELSE IF(B==4 and P==2000 and N=‘s’) SP=150000
Eksplicitno programiramo softver da predviđa
Kod će omogućiti
potpuno
preslikavanje, ali
diskretno - neće
raditi sa
novopristiglim
podacima koji se
razlikuju od
podataka iz
poznatog skupa.
cena=k1*povrsina+k2*broj_soba+k3*komsiluk+k4
Mašinsko učenje je zapravo određivanje vrednosti
koeficijenata k1, k2, k3 i k4 sa kojima se ostvaruje
minimalna prosečna greška za svaki postojeći istorijski
podatak. Metod mašinskog učenja kojim se to ostvaruje
se naziva linearna regresija.
Zakonitost možemo da definišemo i u
višedimenzionalnom prostoru:
cena=k1*povrsina+k2 cena=k3*broj_soba+k4
Možemo da pretpostavimo da je zavisnost linearna
19. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
U praksi, što je aproksimacija jednostavnija, to je greška
predviđanja veća
Ali ne uvek!!
Ovo predviđa
funkcija
Da li je ovo bolje
predviđanje?
20. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Poslovno
predviđanje
• Veoma je pouzdano u analizama kod kojih postoje pravilni
trendovi promena vrednosti veličina koje se koriste, npr.
• Sezonalnost, rast/pad, korelacija sa drugom veličinom
• Primena mašinskog učenja za predviđanje vrednosti nekih
veličina vezanih za poslovanje u nekom periodu u budućnosti,
npr.
• Predviđanje tražnje za nekim proizvodom u narednih
mesec dana
• Predviđanje cene određene akcije na berzi
• Predviđanje potrošnje toplotne energije
• Izrada šta-ako analiza – analiza uticaja nekih poslovnih odluka,
odnosno vrednosti nekih veličina koje te odluke podrazumevaju
na vrednosti nekih veličina vezanih za poslovanje u nekom
periodu u budućnosti
• Kolika bi bila vrednost naše akcije na berzi da nam je u
prethodnom mesecu prodaja bila veća 20%
21. Kurs: Informacione Tehnologije 1 | Nastavnik: dr Milan Zdravković, doc.
Računarska
vizija
• Klasifikacija slika. Prepoznavanje objekta na slici
• Detekcija objekata na slici. Lokalizacija svakog objekta na
slici i njegovo prepoznavanje
• Segmentacija objekata na slici. Uočavanje konture oko
objekta
https://cloud.google.com/vision/docs/drag-and-drop