Your SlideShare is downloading. ×
121 teorija informacije_07-08
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

121 teorija informacije_07-08

381
views

Published on


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
381
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. INFORMACIJSKA TEHNIKA Teorija informacije Predavač: prof.dr.sc. Franjo Jović Kontakt: franjo.jovic@etfos.hr tel: 031-224-615, utorak/srijeda11-12h
  • 2. Satnica i izvođenje nastave Predavanja: 30-45 h Auditorne vježbe: 8-12 h Laboratorijske vježbe: 8-12h -
  • 3. Sadržaj predavanja Pojam informacije. Filozofske osnove. Matematičko izražavanje. Entropija. Entropija kontinuiranog izvora informacije. Pojavni i obilježni oblici informacije. Bayesovi i Gittovi stavci. Kapacitet informacijskog kanala. Shannonov teorem. Železnikarove teze. Informacija na izvoru, njeno otkrivanje i kodiranje. Obrazac i opažaj. Markovljev izvor. Kvaliteta izvora. Govorna informacija. Mrežni agent kao informacijski izvor. Šum i kodiranje na kanalu. Međuinformacija. Podaci i informacija. Signal i umnožak BT. Analiza glavnih komponenti informacije. Carnapova entropija. Klasifikacijski postupci. Statistička i entropijska klasifikacija. Klastering. Postklasifikacijska analiza. Vrednovanje semantičkog sadržaja. Mrežni informacijski multiagenti posrednici, osnovica .
  • 4. Sadržaj vježbi Kodiranje na informacijskom kanalu. Vlastiti sadržaj informacije. Proračun entropije. Proračun semantičkog sadržaja. Proračun uvjetne entropije. Kodiranje Markovljevih izvora. Filtriranje podataka. Klasifikacijska analiza. Klasteriranje složenih događaja. Projekt mrežnog agenta. Proračun rizičnosti složenih događaja
  • 5. Znanje, informacija i osnovna pitanja filozofije Uvodno izlaganje Franjo Jović Osijek 05.10.2006.
  • 6. Što je filozofija Filozofija razmatra cjelinu bitka u odnosu na čovjeka i istinu koju obuhvaća dublje od svake znanstvene spoznaje Nastupa kod osvještavanja ljudi Smisao čiste filozofije bez znanosti se pojavljuje tamo gdje se: a) stvarnost sagledava u svom podrijetlu b) stvarnost obrađuje poput unutrašnjeg razgovora
  • 7. Što je filozofija/2 c) otvara širina spoznatljivog d) odvija ljudska komunikacija u traženju istine e) razum strpljivo održava budnim pred onim najstranijim i pred osobnim ograničenjima Filozofija nas koncentrira time što nas održava ljudima u našem sudjelovanju u stvarnosti.
  • 8. Podrijetlo filozofije Pobuda filozofiranja leži u čuđenju, sumnji, svijesti o izgubljenosti, primicanju graničnih stanja: smrti, slučaja, krivice, neoslonjivosti na svijet Platon i Aristotel su izučavali u začuđenosti samu bit bitka, Descartes je u beskonačnosti nepoznatog tražio ono nužno poznato; stoici su u patnji sadašnjosti tražili smirenje duše.
  • 9. Podrijetlo filozofije/2 Pritisak polazi od sigurnog tla do dubine bitka do počovjekovljenja; ide do komunikacije čovjek - čovjek. Priopćenja koja pritom nastaju su neodvojiva od sagledavanja istine: u unutrašnjem postojanju, osvjetljavanju ljubavi, približavanju savršenstvu
  • 10. Spoznatljivo Osnovno pitanje filozofije je: Što jest? Što je bitak, osnovica svega što postoji, živog i neživog, vidljivog i nevidljivog? Ono iz čega sve proizlazi? Tales: Sve je voda! ..vatra, materija, duh, duhovno živuća materija (hilozoizam) No jesmo li voda koja misli? … To dovodi do suprotnosti subjekt - objekt. Nema objekta bez subjekta i obrnuto. Stvarnost je dakle spoznatljivo koje se u toj suprotnosti pojavljuje. Spoznatljivo ne postaje predmetom ali dolazi u pojavnost u dualnosti ja-predmet. U tom promišljanju postoji i drugi rascijep: predmet u odnosu na druge predmete.
  • 11. Spoznatljivo/2 Kao razlika prema drugome proizilazi da je bitak suprotstavljen ništavilu. Predmet ne može biti sve, dakle ni cjelina bitka. Ni sam bitak. Svako osmišljavanje nečega je izvlačenje toga iz spoznatljivog. Dakle to stoji suprotstavljeno ne samo meni već i drugim predmetima. Spoznatljivo je stoga ono što se u promišljanju uvijek navještava. Zamisao je u odnos na predmet neprirodna pojava u uobičajenom razumijevanju odnosa. Mi želimo s njezinom pomoći utjecati na vlastitu svjesnost bitka. Zamisao sama po sebi je prazna, bespredmetna. No svojim oblikom otvara beskonačne mogućnosti pojave postojanja i postaje s obzirom na njega transparentna.
  • 12. Spoznatljivo/3 Mi promišljamo predmetno, slikovno. Moramo odatle misleći predmetno postići usmjerenje na bespredmetno spoznatljivog. Egzistencijalno smo vezani na Boga / transcendentalno a to sve putem znakova, simbola. Božje postojanje je za nas stvarnost putem našeg postojanja, dok inače postoji u drugim dimenzijama potpuno različitim od našeg predmetnog svijeta. Tako se spoznatljivo sastoji od naše svjesnosti po kojoj smo svi jednaki, od životne stvarnosti po kojoj smo međusobno odvojeni pojedinci i od egzistencije u kojoj smo po svojoj snalažljivosti.
  • 13. Spoznatljivo Mistici transcendiraju dualnost objekt - subjekt, poništavaju subjekt i odlaze u transcendentalno, no ne mogu ga iskazati jer nije predmetljivo, nije izrecivo Spoznatljivo je dakle: – – – bitak po sebi transcendentalost (Bog) svijet
  • 14. Transcendentalno Prorok Jeremija promišlja živog Boga. Grčki filozofi domišljaju Boga kao pravilo. Oba razmišljanja svode se na to da Bog jest i da postoji kao obdržavač i stvoritelj svijeta. Današnji filozofi zaobilaze to pitanje, kao ono: što ne možemo znati radije prešućujemo. Bog nije pristupačan promišljanjem već vjerovanjem. Njegovo se postojanje ne može dokazati matematikom ili empirijskim znanostima. No ni dokazani Bog ne bi bio Bog već predmet. Odakle vjera? Iz ljudske slobode. U svojoj slobodi nisam po sebi samom već sam sebi u njemu darovan; ne mogu svoju slobodu iznuditi. U svojoj najvećoj slobodi sam slobodan i od sebe i svoje vezanosti za svijet. Dakle najdublje sam vezan za transcendentalno. Bog je po meni odlučnost u kojoj postojim. On je sadašnjost postojanja a ne sadržaj znanja. U njemu je izvjesnost životne prakse /1,Karl Jaspers/.
  • 15. Bezuvjetni zahtjev BZ postoji u ljubavi, borbi, u visoko postavljenim ciljevima. Obilježje BZ jest da mu je život u cjelini osnova no ne posljednja. Za ostvarenje BZ je svejedno odnosi li se na ideju, ljubav ili vjernost. Nije podložan volatilnosti života. U krajnjoj granici prekoračuje život i dovodi do gubitka bitka, do neizbježne smrti. Uvjetni zahtjev se po svaku cijenu obraća životu. Sokrat, Thomas Morus, Bruno, umrli su za svoju istinu BZ ima svoj korijen u nama samima, s time da me provlači kroz nešto što nisam samo ja po sebi. To nije ono što se želi nego ono zbog čega se želi. To je stav vjere, težina jedne duše.
  • 16. Bezuvjetni zahtjev/2 Razabiremo li mi svoje osnove i ciljeve svojih postupaka ostajemo u uvjetovanom. Tek život iz nepredmetnog osnova je života u BZ. BZ je duboko ukorijenjen u ono čime smo ispunjeni. Opredmećeni BZ je fanatizam i tiranija Komunikacija zaljubljenih u ljubavnoj bitci - možda i ona može biti lažna BZ je vanvremensko. Ono je konstruktivna dobrota. Zlo nastupa u tri oblika – kao moralni čin odluke tipa želja / zadaća – kao etični čin kada odluke BZ stoji u ovisnosti uvjetovanog (čistoća motiva) – kao metafizički čin biti motiva: ljubav (od koje se živi) / mržnja (izvlačenje iz transcendentalnog)
  • 17. Ostala pitanja filozofije Što je čovjek – sloboda, djelovanje, transcendentalnost Što je svijet – svijet i prolaznost – svijet i ono vječno u njemu Povijest čovječanstva, filozofije, religije – je li ipak nečastivi pomagač Bogu Filozofska neovisnost – Filozof je neovisan od materijalne zapetljanosti, plemena, asket, nije prestrašen, neovisan o religiji, politici, uređenju države, smrti – filozofiranje je škola neovisnosti a ne posjedovanje neovisnosti.
  • 18. 1.Pojam i matematičko izražavanje informacije “Mislim da smo trenutno u predkopernikanskom razdoblju spoznaje i primjene informacije” Marijan Miković, 2004., osobno priopćenje
  • 19. Informacija i propast EPR pokusa Na temelju članka Einsteina, Rosena i Podolskog (1935) “Can quantum-mechanical description of physical reality be considered complete?” izradio je John Bell prijedlog provjere istodobne pojave informacije na udaljenim mjestima npr u pokusu s polariziranim zrakama svjetlosti. Ovo su spomenuta tri autora naveli kao nešto nemoguće. Pokus su 1982. godine izveli Aspect, Roger i Dalibard i pokazali da se informacija pojavljuje istodobno na udaljenim mjestima, dakle neovisno o brzini svjetlosti. Ovime je informacija pokazala da posjeduje svojstvo (barem) četvrte prostorne dimenzije jer se može iskazati istodobno na bilokojem mjestu treće dimenzije prostora. Naprosto dolazeći iz njegovog “ne prostora”. Istodobno i materija(energija) je pokazala da je nedjeljivo “vezana” uz informaciju! Obje činjenice bile su “previše” za dotadašnje poimanje stvarnosti.
  • 20. Informacija i propast EPR pokusa/2 Neovisnost o prostornoj dimenziji 3D prostora čini i striktno čuvanje informacije te dostup do informacije vrlo osjetljivim ako ne i nemogućim zahvatom u užem smislu te riječi. Naravno ukoliko je informacija upakirana u materijalnom aspektu prostora. Mi smo propašću EPR pokusa dovedeni na “golu ledinu” gdje je samo pitanje vremena i sredstava kada će apsolutno nedostupna materijalno pakirana informacija biti stvar prošlosti. Ograničenje će biti naša spoznajna sposobnost, dakako. Drugo je pitanje ne posjedujemo li već takva saznanja u podsvijesti? No informacija u podsvjesti je isto tako i “nedostupna informacija”. Osim ako nismo vješti u npr tumačenju snova...
  • 21. Opažaj - obrazac - informacija Poučavanje o informaciji je stoga poučavanje o mišljenju. Poučavanje o mišljenju ne smije biti poučavanje o klasičnoj logici, jer je logika nešto konkretno i opipljivo, nešto čisto i formalno gotovo poput matematike. Logika je osim toga samo sukladna mitu u paru logos – mithos /2, de Saussure Ferdinand/. U svojoj osnovnoj prirodi logika je alat opažanja, ona ukazuje na ono implicitno, na proturječno. Porota se na sudu bavi istraživanjem iskustva zločina. Činjenice povećavaju opažaj. Logika čini implicitno eksplicitnim. Eksplicitne činjenice povezuju se u obrazac. U poučavanju obično se informacija izvlači iz gotovih obrazaca i “suho” predstavlja. Tada naša pažnja ide brzo prema informaciji. U stvarnom životu doći do informacije je mučan postupak. Skup. O tome ćemo ovdje raspravljati. O gruboj tehnici dobivanja obrazaca. Iz podataka, signala, znakova, zvukova - podsvješću se ne kanimo baviti. Niti snovima.
  • 22. Obrazac - oblik - ideja Obrazac bi mogao biti nešto što se ponavlja, nekakav red, odnos, nešto što mi opažamo i uspoređujemo s nečim nama ranije poznatim Definicija, deBono /3/: Kada se dogodi pokret iz sadašnjeg stanja u neko sljedeće stanje s vjerojatnošću iznad očekivanog tada se stvara obrazac: – ova definicija uključuje aktora obrasca – moguću ideju o akciji koju on izvodi, te – moguću posljedicu te akcije Obrasci mogu biti simultani, sinkronijski ili slijedni, dijakronijski. Njihovo pojavljivanje u jeziku poput nečega što je “postavljeno van volje pohranitelja” nešto što više izražava svojstvo duha nego prirodu stvari /2/. No izgleda da je materijal koji generira obrazac u prednosti pred Gestaltom, oblikom, da je pojava u prednosti pred formom.
  • 23. Obrazac - oblik - ideja /2 De Saussure je izveo dihotomiju jezika (langue) i govora (parole) iz prvobitnog zajedništva u jezičkoj djelatnosti (language). Dakle postoji pojedinčev i skupni (povijesni) vid jezika /2/. Jezik i kodovi u komunikaciji nisu mogući bez sustava stvaranja obrazaca. Riječi su kodovi. One pokreću akcije u memoriji slušatelja. One djeluju kao okidači obrazaca. Riječima se naš razum vodi od stanja do stanja (preko nespoznatljivih međustanja). Po nekim obrascima. Do ideja. Ali i obrnuto: od ideja (iz nadprostora??). Prikazuju se dva modela obrasca informacije: model stolnjaka i model želatine. Zašto su to informacijski modeli?
  • 24. Model stolnjaka Mjesto A pokazuje otisak neke pravilne mrlje Mjesto B pokazuje otisak nepravilnog oblika A C Mjesto C pokazuje još veći nepravilni otisak Jesu li podaci o prošlim događajima zapisani? Jesu li ti podaci lako izmjenjivi? B Jesu li podaci međusobno povezani? Prostorom, vremenom?
  • 25. Model želatine a b Dotok tople tekućine otapa sve više i više želatinu. Otopljena tekućina u području a i b se širi. Kada se područja a i b spoje sve što padne bit će samo zajednički doprinos. Sve što padne izvana neće biti doprinos. Koji najvažniji informatički proces je tu u igri? Selekcija!
  • 26. Ideje i informacija Obrada informacije (gdje je ta informacija koja se izgubila u podacima) - ili zašto je Napoleon izgubio bitku kod Trafalgara ( pa zbog sporijeg punjenja topova!) Informacijsko prokletstvo na kineski način- Dabogda živjeli u zanimljivim vremenima! Ili, ako se bavite tuđom informacijom/idejom tada se ne bavite vlastitom. Slika - sve je započelo izgleda jednostavnim crtežima - iako, prije slika bile su piramide (i samo suglasnici) jedne davne civilizacije.
  • 27. Ideje i informacija /2 Riječ ( u početku su riječi bile svete: izgovaranjem riječi nastajala je pojava) - zato su i Egipćani vjerojatno zazirali od skraćenicama prikazanih riječi npr. koloid = ko(tač)+lo(tos) +id(em), no Midianiti se nisu bojali i … nastali su suglasnici, a u Grčkoj i samoglasnici. Pismo današnje dobi nastalo je u Feniciji i Grčkoj, no za brojeve su se pobrinuli Babilonci i - Arapi; pred 5000 godina su Kinezi davali doktorate iz matematike ...= B ;A = Slijede pravila, strojevi, tehnologija, inteligencija, ideje, ljudski element - tu leži informacija!
  • 28. Osnovna svojstva informacije Spontanost, nepredvidljivost, slojevitost, kružnost, povratnost Informira i biva informirana, protuinformacija - pitanje, prostor ukotvljenosti, opkoljenosti, proširenje informacije, prag Nastaje i nestaje, briše se, prekriva, ponavlja, Serijska, paralelna, paralelna pa serijska Apsolut, osobnost, bolno spoznajna, svjesna, podsvjesna Informacija je komunikacija i njen nedostatak, Vanjska - unutrašnja, povjerljiva, javna, nedostupna, nespoznatljiva, jednostavna, tajanstvena, simbolična, prosvjetljenje, razum, moć Informacija je riječ koja bijaše na početku, izraz više sile, unutrašnji glas...
  • 29. Osnovna svojstva informacije/2 Informacija je činjenica, detalj, laž, promidžba, instinkt, intuicija Informacija je u pozivu, djelovanju, volji Informacija je univerzalna, ćudljiva, (ne)dohvatljiva Provjerava se informacijom, pitamo se što je to, bojimo se moći informacije, krijemo je Pojavljuje se na začudnim mjestima i skrivenim putovima, u postupku koji je entitet i proces istodobno, događanje i prestanak događanja, Informacija je nadzor, vođenje i povratna veza; šum i smetnja su informacija, Nevidljiva je i sveprisutna, ona je sve to rečeno i puno više Nastaje voljom i razumom. To je fundamentalna veličina, ni energija niti materija
  • 30. Nastanak i spremanje informacije Pojam informacije osnova je za mnoge znanosti i tehničke discipline: kibernetiku, automatiku, biologiju, povijest, teologiju, ekonomiju, proizvodne tehnologije, filozofiju Osnovni Shannonov teorem koji pojam informacije uspješno veže uz vjerojatnost pojave pojedinih znakova, riječi komentira Karl Steinbach: “To je kao kada biste smatrali kilogram zlata i kilogram pijeska jednako vrijednim” Norbert Wiener piše: “Informacija je informacija ni materija niti energija” Gittov 1. stav: Fundamentalnu veličinu informaciju ne možemo pripisati materiji. Ovime se “čisti” materijalni procesi isključuju kao izvori informacije.
  • 31. Nastanak i spremanje informacije/2 Stav 2: Informacija nastaje samo putem volje (nakane) I  vd2 Inf. Volja No informacija iz nekog izvora je to bolja što je veća inteligencija i znanje tog izvora, dakle informacija = inteligencija (d) * znanje (d) * volja (v) = v*d2
  • 32. Nastanak i spremanje informacije/3 Povezivanje volje informacije i inteligencije / znanja odražava pojavu na izvoru informacije. Osnova priopćenja informacije je volja pojedinca. Veća volja daje veći učin. Konstanta proporcionalnosti ovisi o umnošku inteligencije i znanja autora informacije. Ovo je intuitivni model, dakako. Informacija služi svrsi vođenja sustava u kojem je stvorena, radom ne slučajem. Dakle informacija je nešto blisko politici, ali i tehnici, medicini, pravu. Stav 3. Pri svim tehničkim i uopće umjetnim sustavima informacija tvori njenu nematerijalnu osnovicu. Informacije se može pohranjivati na materijalnu osnovicu, štoviše, idealno je upravo ono pohranjivanje gdje se modificira određena (prostorna) dimenzija materijalnog medija drugom dimenzijom informacijskog svijeta (vremenom)
  • 33. Razine, oblici i vrste informacije Pet je različitih vidova informacije: statistika, sintaksa, semantika, pragmatika i apobetika. Primjer govorne informacije: abeceda rječnik jezik informacija a, b, c Ivo kôd Ivo gleda gramatika :Ivo gleda smisao akcija?
  • 34. Razine, oblici i vrste informacije/2 Statistički vid određuje kvantitetu, količinu informacijskih znakova, predanu ili primljenu, brzinu protoka znakova, znakovnih grupa, riječi. Gramatička točnost i jasnoća informacije pri tome nije bitna, jer se svaka pogreška u prijenosu jednako tretira. Informacija se obrađuje posredno preko vjerojatnosti pojavljivanja informacijskih znakova. Statistički vid osnovica je mjerenja informacije. Kako se to može obaviti? Pa preko statističke mjere: relativne frekvencije pojavljivanja informacijskih znakova.
  • 35. Razine, oblici i vrste informacije/3 Iza oblikovanja znakova, slova, grafema, fonema u riječi, simbola, stoji sintaksa (syntaxis - poredak, order, Anordnung). Pravila se odnose na znakove pisanih jezika, kodne signale, slikovne znakove, notno pismo, računalne kodove, genetičke kodove, plesne znakove pčela, mirisne znakove kukaca, znakovlje gluhonijemih. Pravila se uče ili nasljeđuju. U sintaksu spadaju pravila pisanja, izbor simbola i njihovih kombinacija, pravila biranja riječi, tvorbe rečenice, načini na koje se rečenica mijenja. Gramatika. Na razini koda se odražava i odlučuje o tome ima li predloženi sustav kreativnu ili samo reproduktivnu značajku. Kreativni kodovi imaju u pravilu sintetička, integrativna, asocijativna a reproduktivni analitička, disocijativna svojstva.
  • 36. Razine oblici i vrste informacije/4 Semantika (semantikos - obilježavajući, sema = znak) je smisao, sadržaj, poruka, iskaz, značenje niza znakova, riječi neke poruke. Stav 4: samo je ono informacija što sadrži (barem) semantiku, značenje. Ovo znači da odašiljatelj (i primatelj) informacije posjeduju određeni duhovni koncept, kojim je moguće prihvatiti značenje informacije. Tek se postojanjem jezika informacija može pohranjivati na materijalnim nositeljima. Informacija je nepromjenjiva bez obzira na vrstu prijenosnog medija ili sustava zapisa. Ova invarijantnost uzrokovana je njezinom nematerijalnom prirodom.
  • 37. Razine, oblici i vrste informacije /5 Razlikujemo: prirodne jezike (preko 5000 jezika) umjetne jezike (esperanto, gluhonijemi, zastavice, prometna pravila), umjetne formalne jezike (programski, matematički, logički, kemijski, notni), posebne jezike tehnike, znakovni jezik nacrta, posebne jezike žive prirode (dupini, glavonošci, pauci, ..)
  • 38. Razine, oblici i vrste informacije/6 Kodiranje značenja u prirodnim i umjetnim jezicima postiže se pojedinim ili složenim djelovanjem sljedećih sredstava: – – – – – – oblikovanjem stilistikom fonetikom intonacijom gestikom semantičkim sredstvima: homonimima, homofonima, metaforama, metonimijama, ironijom, anomalijom,… Pri tome su predajnik i prijemnik ili inteligentno biće ili inteligencijom stvoreni umjetni sustavi.
  • 39. Razine, oblici i vrste informacije/7 Pragmatika (pragmatike - vještina ispravnog rukovanja) Svaki prijenos informacije ima za cilj ili nakanu izazvati na prijemnoj strani odgovarajući učin, događaj. Da bi to postigla predajna strana se služi: molbom, pitanjem, kukanjem, poučavanjem, opominjanjem, pritiskom, naredbom, a sve u cilju rukovanja predajnom stranom. Informacija se stoga može nazvati i strukturom koja na predajnoj strani izaziva određeni učin. Ona je manipulativna. Možemo razlikovati – kruto postupanje, kao kod programiranja strojeva, izgradnje stanice, funkcija disanja, instinktivno rukovanje dresura životinja
  • 40. Razine, oblici i vrste informacije/8 Pragmatika - fleksibilno i kreativno rukovanje informacijom – – – – uvježbano rukovanje ljudima, oblici učtivosti, kretnje obrtnika jednostavno djelovanje ljudi intuitivno nastupanje ljudi inteligentno ponašanje ljudi slobodne volje Sva navedena ponašanja rezultat su upravo primljene informacije, dakle komuniciranja, ali i onog naučenog, iskustvenog.
  • 41. Razine, oblici i vrste informacije/9 Apobetika (apobeinon - događaj, uspjeh, rezultat) razmatra svrhovitost, cilj odašiljanja informacije. Primjeri su kod životinja osiguranje životnog prostora, kod ljudi su potreba komunikacije i dogovora o zajedničkom cilju, životu. Uvijek se u slučaju naglašavanja ili potiskivanja cilja treba biti oprezan, jer se radi o najvišem vidu prijenosa informacije, pa i šteta za primatelja može biti najveća.
  • 42. Razine, oblici i vrste informacije/10 Dakle izvoru informacije treba posvetiti dužnu pozornost! Kod informacije nekog izvora specifičan je! Izbjegavanje dohvata informacije je opasno, jer smo bez informacije neupućeni. Dohvaćanje informacije je opasno, jer nas dobivanje informacije kada je nismo spremni primiti može “satrti” - stoga u pravilu vrijedi: Kada je čovjek spreman da je primi - informacija dolazi. Skrivanje od informacije je također opasno! No suprotstavljeni koncepti se utjelovljuju i sukobljavaju opet u živom dijalogu! U dijalogu autora (duha) i junaka (duše). Život je konflikt. Konflikt je prirodan.
  • 43. Kvalitete izvora informacije Kvaliteta izvora Kval. semantike i Kvaliteta pragmatike događaja Zamisao rješenja, Cilj Inteligencija Genijalnost funkcije Optimalnost, strategija Vrijeme provedbe Stanje znanja Tehnologija Funkcija Domišljatost Programiranje Scenarij Bogatstvo ideja Minijaturizacija Nakana Smisao
  • 44. Razine, oblici i vrste informacije/11 Vrste informacije: Proizvodna, pogonska, komunikacijska Podrijetlo informacije: – kopirana informacija (CD, DNK, fotokopija, reprodukcija slike), u pravilu se svakim kopiranjem nešto gubi; zašto? – reproduktivna informacija (interpretacija teksta, glazbe, dijela softvera), u pravilu se svakom reprodukcijom nešto dobiva; zašto? – kreativna informacija: voljom, sposobnošću i talentom pojedinca nastaje nova vrijednost poput jezika, teksta, koda, sustava, glazbe, slike, patenta, postupka, saznanja.
  • 45. Razine, oblici i vrste informacije/12 Poseban oblik informacije je hologram. Izgleda da je DNK jedan vid holograma. Osnovno svojstvo holograma je zapisivanje informacije u nižoj dimenziji prostora. Tako se 1D hologram može rabiti za zapis 2D podatka, 2D za zapis 3D itd. Drugo je svojstvo integrativnost: iako se dio holograma može izgubiti sadržaj ostaje. Treće svojstvo je linearnost: hologram čuva spremljeno vjerno reproducirajući osnovni oblik. Može se očekivati veća uporaba ovog vida pohrane i aktiviranja informacije. Aktiviranjem holograma događa se i mogućnost promjene sadržaja (relaksacije) u smislu smanjenja hologramskog “šuma”. Na taj način se, uz ostalo brane i naše stanice od smetnji izazvanih izgaranjem ATP-a, toksikacijom ili napadom virusa.
  • 46. Razine, oblici i vrste informacije/13 Primjer relaksacije holograma: nerelaksirani hologram s greškom relaksacija relaksirani oporavljeni hologram
  • 47. Kvaliteta i korisnost informacije Informacija može biti upotrebljiva ili neupotrebljiva što ovisi o okolnostima. No bez obzira na to ona može biti po svojoj mjeri samo kvalitativnog a nikako kvantitativnog značenja. Po svojoj semantičkoj vrijednosti i korisnosti razlikujemo pet stupnjeva vrednovanja: izuzetno važnu, važnu, korisnu, beskorisnu i štetnu informaciju. Ova procjena je često stvar pojedinca, iako postoje posve jasni etički obrasci koji su podloga procjeni. Postoji savjest.
  • 48. Kvaliteta i korisnost informacije/2 Izuzetno važna informacija: visoki sadržaj apobetike Važna informacija: značajna za postizanje cilja Korisna informacija: općeg značenja, u smislu kontakta, izobrazbe, zabave, dnevnih događaja Beskorisna informacija: općeniti podaci, banalnosti, besmislene novosti, gubitak vremena Štetna informacija: inf. s negativnim posljedicama , vodi k zabludama, štetnim događajima, defektima a postiže se svjesnim ili u zabludi datim iskazima, lažima, podmetanjima, šarlatanstvom, ljutnjom, sektašenjem, ideologizacijom, šundom.
  • 49. Važnost i korisnost informacije Korisnost je objektivna komponenta informacije – vrijedi za većinu ljudi – nije upotrebljiva ako ne postoji ili nije ostvariva – često neotkrivene činjenice – neobjavljena inf. – zaboravljena inf. – beskorisnost je vezana i za nemogućnost djelovanja Važnost je pojedinčeva komponenta informacije – važnost za pojedinca nije isto što i za neku drugu osobu – općenita važnost inf. je samo relativno važna pojedincu – velika većina inf. je pojedincu irelevantna – velika je važnost pojedincu svaka njemu štetna informacija
  • 50. Vrednovanje semantičkog sadržaja informacije Veličine koje obuhvaćaju semantičku kvalitetu informacije u cilju njene možebitne kvantifikacije ili barem relativne usporedbe su semantička kvaliteta q relevantnost r novost (aktualnost) a dostupnost z postojanje e To su semantičke veličine osobnog značaja informacije, korisničke Kreću se dogovorno u rasponu od 0 do 1 osim q koji se prema ranije navedenom kreće u rasponu q = (1,-1)
  • 51. Vrednovanje semantičkog sadržaja informacije semantička kvaliteta Mjera semantičke kvalitete obuhvaća težinu značenja. Posebno se odnosi na tzv proizvodnu upotrebljivost informacije, poput učinkovitosti primijenjenog algoritma u računalu, smanjenjenju memorijskog prostora i vremena obrade, prenosivost programa, pouzdanost programa, primijenjenom programskom jeziku i sl. Koliko pojedini elementi ovog vida informacije utječu na samu kvalitetu informacije ovisi i o subjektivnim procjenama, ali i o objektivno zatečenom stanju. Informacija bez kvalitete, prazna informacija ima q = 0, najkvalitetnija informacija ima q = 1, a najštetnija informacija ima q = -1
  • 52. Semantička relevantnost i važnost Kod informacije posebno se naglašava osobni interes koji donesena informacija daje korisniku, njegovom ostvarenju cilja, osobnom cilju Ono što osobi A može biti izuzetno važno, dakle rA = 1, može osobi B biti potpuno nevažno, dakle može imati rB = 0 Stoga je procjena iznosa parametra relevantnosti od strane neinformiranih promatrača za nepoznate osobe težak zadatak. Tako je npr prognoza vremena za zapadnu Australiju prosječnom hrvatskom gledatelju televizije potpuno irelevantna. Naprotiv, ako netko odavde putuje rođacima u zapadnu Australiju rado će pogledati na TV prognozu vremena i uopće se upoznati s tamošnjim vremenskim prilikama. Za tehnološke procese je relevantnost nebitna, jer nemaju osobni značaj - ili ne bi trebali biti tako projektirani.
  • 53. Aktualnost U mnogim je područjima života potrebno relevantnu i važnu informaciju dostaviti pravodobno. Podatak o zastarjeloj informaciji, “lanjskom snijegu”, ima iznos a=0 Visokoaktualna informacija ima a = 1. Za tehnološke procese je aktualnost nedvojbena i trajno konstantna veličina s a = 1, pa se niti ne procjenjuje posebno. Opadanje iznosa aktualnosti zavisi o vremenskim konstantama pojava na koje se odnose - već i mali prekid govora ili glazbe je štetan Tako su geološki podaci iako izuzetno stari još uvijek aktualni Istraživanjem nekih starih događaja se parametar aktualnosti mijenja Osobito kada se pravilnosti pojavljivanja mogu protegnuti na današnje događaje - dakle nešto davno može postati vrlo aktualno.
  • 54. Dostupnost Ni najvažnija informacija ako nije dostupna nema vrijednosti, dakle za nju je z = 0. Informacija koja je potpuno dostupna ima iznos z = 1. Baze podataka, biblioteke, informacijski centri, računarske mreže, internet povećavaju dostupnost informaciji. Nedostupnost se povećava zaštitnim kodom, klauzuriranosti informacije u pravu, medicini, filozofiji te namjerne klauzuriranosti kod nedostupnih, tajnih ili štićenih podataka poput industrijske svojine ili poslovnih tajni. Nedostupnost može biti i mjera manipulacije. Industrijski podaci moraju biti dostupni operatorima, tehnolozima ili voditeljima smjeni, iako selektivno. Smatra se da je dostupnost u proizvodnim procesima jednaka jedinici.
  • 55. Postojanje Postojanje informacije je pitanje da li informacija uopće postoji na svojem izvoru (ili materijalnoj kopiji). Potpuna upitnost postojanja izražava se iznosom parametra e = 0. Potpuna poznatost, osvjedočenost postojanja izražava se iznosom parametra e = 1. Tako je pitanje postojanje terapije raka želudca između 0 i 1, a isto to kod raka jetre jednako je ništici. Procesni i tehnološki podaci smatraju se da redovito postoje, iako često preko posrednog mjerenja. U teoriji sustava smatra se da neki podaci postoje iako nisu izmjerivi. Do takvih se podataka ne može dostupiti. U principu možemo reći da svi podaci na neki način postoje (Bayes).
  • 56. Mjera semantičkog sadržaja primjer Postojanje Dostupnost Aktualnost Relevantnost PROCES INTERNET VISOKA ŠKOLA Kvaliteta 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
  • 57. Mjera informatičkog sadržaja Pretvorbom tabličnog u pentagramski oblik dobiva se za površinu izraz A = F sin720 (ra+az+ze+eq+qr) / 2 (1) Nadopuna 1: faktor potpunosti F koji je jednak ništici kada su q, ili r ili a ili z ili e jednaki ništici a inače je F jednak jedinici. Dakle, ne smatra se informatičkim sadržajem kada ne postoji neki od parametara. Nadopuna 2: na iznos parametra q koji može biti između -1 i 1 Normalizacija na iznos semantičke mjere jednake maksimalno 100 ili -100 dobiva se relacijom S = 20 ( ra +az +ze + e|q| + |q|r) F sign q (2) Izrazite mjeru informatičkog sadržaja iz prethodnog primjera!
  • 58. 2. Entropija kontinuiranog izvora informacije
  • 59. Zalihost Zalihost ili redundancija jest postojanje nekog detalja, koda, poruke, signala kanala ili sustava više nego što je najnužnije potrebno za predstavljanje ili prijenos tražene informacije. Prijenosom redundantnog signala na primjer, dolazi do neučinkovite uporabe kanala, jer ne prenosi informaciju na svojoj najvećoj brzini Prikažemo li npr. signal DA i signal NE sljedećom shemom – – – – – – DA : ++--NE : +-+-+ dobivamo dosta zališnu shemu jer bi zadovoljilo i DA : + NE : Dakle imali bismo pet puta brži prijenos ili manji prostor skladištenja podatka
  • 60. Prednost zalihosti U slučaju smetnji ili šuma postoji bolja mogućnost ispravne interpretacije t *Kontrolirana ekspanzija informacije daje potpuniji opis procesa na izvoru informacije
  • 61. Zalihost u tehničkoj praksi Zalihost ponavljanjem u vremenu – ponavljanje poruke u vremenu u slučaju otkrivanja pogreške – periodičkim slanjem poruke Zalihost ponavljanjem u prostoru – slanjem poruke u više kanala – bilježenjem podatka na više mjesta Zalihost ponavljanjem u frekvenciji – slanjem poruka na više frekvencijskih područja Zalihost u funkciji - ponavljanjem uređaja, ili kritičnih dijelova uređaja - ponavljanjem softvera ili više načina uporabe softvera
  • 62. Uzorkovanje redundantnog signala Dobivaju se manje redundantni podaci Uzorkovanje frekvencijom višom od Nyquistove Primjer: – – – – a) originalni podaci(V): 2,56 2,05 2,98 8,01 4,87 b) zaokružene vrijednosti(V): 3, 2, 3, 8, 5 c) kodirani iznosi: --++, --+-, --++, +---, -+-+ d) niz impulsa u prijenosu / zapisu : --++--+---+++----+-+ Navedite razliku broj bitova nizova a) i d) !
  • 63. Diskretni informacijski izvor Izvor koji proizvodi konačan broj poruka naziva se diskretnim izvorom informacije Poruka može biti za početak znak poput slova, ili riječ kao smislena kombinacija znakova Kontinuirani izvor poput temperaturnog detektora ili mikrofona proizvodi neizmjerno različiti skup znakova. No većina od tih znakova beznačajna je za korisnika voditelja procesa ili slušatelja glazbe Pretpostavimo za početak da su uzastopne poruke diskretnog informacijskog izvora međusobno neovisni događaji Iznos informacije za svaki znak- poruku jednaka je – I = log (aposteriorna vjerojatnost/ apriorna vjerojatnost) (3) – vjerojatnosti se odnose na pojavljivanje datog znaka - poruke
  • 64. Ukupna informacija diskretnog izvora Kada nema šuma brojnik je u izrazu (3) jednak jedinici tj sigurno smo primili poslani znak, pa ostaje samo apriorna vjerojatnost pojave nekog znaka Stoga možemo izraziti ukupnu informaciju koju očekujemo od niza duljine n od k različitih znakova s poznatim apriornim vjerojatnostima pojave i-tog znaka P(i) kao Ukupna informacija = - n Σ P(i) log P(i) (4) gdje suma ide po svim k različitih znakova Prosječna informacija po znaku jednaka je entropiji tj H = -Σ P(i)log P(i) 1 < i < k (5) Entropija diskretnog izvora uvijek je manja od navedenog izraza. Zašto?
  • 65. Entropija složenog događaja Vjerojatnost pojave dvaju uzastopnih znakova i j H(ij) = - ΣΣ P(ij) log P(ij) 1<i,j<n (6) Opći iznos entropije nekog znaka kada je poznat njegov prethodnik jednak je H(j/i)= - ΣΣ P(ij) log P(j/i) (7). Vrijedi također H(ij) = H(i) + H(j/i)  H(i) + H(j) (8) Gornji se izrazi odnose i na izvore koji emitiraju znakove potpuno nezavisno. Razmotrimo slučaj gdje dva izvora označeni s i j istodobno proizvode znakove: izvor i proizvodi znakove A,B,C a izvor j proizvodi D,E,F, G – data je tablica vjerojatnost P(i) te uvjetne vjerojatnosti P(j/i)
  • 66. Tablica uvjetnih vjerojatnosti složenog događaja A C 1/2 P(i) B 1/3 1/6 P(j/i) D 1/4 3/10 1/6 P(j/i) E 1/4 1/5 ½ P(j/i) F 1/4 1/5 1/6 P(j/i) G 1/4 3/10 1/6
  • 67. Tablica vjerojatnosti složenog događaja - A B C D 1/8 1/10 1/36 E 1/8 1/15 1/12 F 1/8 1/15 1/36 G 1/8 1/10 1/36
  • 68. Entropija složenog događaja Iz (6) slijedi H(ij) = 3,416 bit/znak Iz (5) slijedi H(i) = 1,461 bit /znak Iz (7) i prethodnih tablica slijedi H(j/i) = 1,956 bit/znak Dakle vidimo da vrijedi relacija (8). Ako bismo računali entropiju izvora j (ovo nije jednostavno jer nemamo nigdje eksplicite dato pa računamo preko uvjetnih vjerojatnosti P(D) = P(A)*P(D/A) + P(B) * P(D/B)+ …,) dobili bismo H(j) = 1,977 bit /znak što bi dalo maksimum entropije H(ij)max = 3,458 bit/znak Pitanje: Jesu li to jako povezani izvori? Koliko?
  • 69. Entropija diskretiziranog kontinuiranog izvora Neka su vjerojatnosti diskretiziranog izvora informacije date tablicom i= 0 1 2 j=0 9/11 1/8 0 j=1 2/11 3/4 2/9 j=2 0 1/8 7/8 Vjerojatnosti p(0)=11/36, p(1)=4/9 , p(2)=1/4 računaju se iz površina ispod funkcije gustoće vjerojatnosti. Odatle je H(i) = 1,542 bit/impuls Računanje P(ij) = P(i)*P(j/i) daje P(00)=1/4, P(01)=1/18, P(02)=0, P(10) = 1/18, P(11) = 1/3, P(12)=1/18, P(20)=0, P(21)=1/18 P(22)=7/36. Odatle je H(j/i)=0,890 bit/znak, te je razlika 0,652 bit/znaku zbog međuznačnog utjecaja.
  • 70. Entropija kontinuiranog izvora Kontinuirani izvor ima kontinuiranu funkciju gustoće vjerojatnosti p(v) Ako uzmemo po analogiji s diskretnim izvodom diferencijal vjerojatnosti dv dobivamo za entropiju izraz - Σ p(vj) dv log (p(vj) dv) = =lim dv-0 -( Σ p(vj)(log p(vj)) dv + lim dv-0 -Σ p(vj) (logdv)dv = = - Ϊ p(v)log p(v) dv - lim dv-0 Σ p(vj)(log dv) dv (9) Kako dv0 drugi izraz teži u beskonačno jer log dv teži u minus beskonačno. Ako izostavimo ovaj član ono što možemo izračunati prvim članom je samo relativni iznos entropije. Računanje entropije za svaki konkretni slučaj mora uzeti u obzir i drugi član u izrazu (9). Npr ako pojačamo signal faktorom dva onda i dv biva dva puta veći pa je log1/dv= log2 + log 1/2dv odnosno za jedan bit manji!
  • 71. Rasprava o entropiji kontinuiranog signala Signali su ograničeni frekvencijskim pojasom. Kada se njihova funkcija distribucije postavi kao uniformna onda se postiže maksimum entropije signala. Kada signal ima maksimum entropije onda je maksimalan prijenos bitova po znaku! Druga je stvar kako se ponaša omjer signal/šum. Tu trebna očito težiti manjim pojačanjima šuma kada je signal manji. Inače se dobiva manji omjer signal /šum. Za signale Gaussovskog tipa ograničene snagom N je H = c * log N (10)
  • 72. Teleonomska entropija Ciljna ili teleonomska entropija razmatra entropiju pojedinačnih objekata u nekoj ciljnoj strukturi. Npr. raspored stolaca u učionici. Mjera podjele prostora u tom slučaju određuje prostorne segmente tzv Voronojeve dijagrame koje “zauzima” pojedini predmet. Odnos veličina tih prostora i njihova razdioba prema traženoj ciljnoj raspodjeli određuju trenutno stanje ciljne entropije. Teleonomsku entropiju je prvi izrazio filozof Rudolf Carnap (1956). Ona obuhvaća izračun prostora stanja informacije prema prostoru željenog stanja informacije.
  • 73. 3. Informacija i informacijska mreža
  • 74. Proces, mreža i obrada podataka Obrada podataka i proizvodni proces / usluga povezuju različite vrste komunikacija. U procesu se spontanim odvijanjem procesnih događaja povećava entropija. Svrhovitom obradom tih podataka i djelovanjem na proces postiže se ponovno smanjenje entropije u sustavu. To su povoljni, korisni informatički procesi. Postoje i nepovoljni procesi kod kojih se na pojavu smanjenja entropije djeluje suprotno tome, izaziva nered i šteta. Opća shema: – proces mreža obrada podataka
  • 75. Entropija u sustavu s obradom i komunikacijom Entropija se u sustavima održava na razini prirodne entropije tj raste bez djelovanja u suprotnom smjeru Entropija u sustavu s obradom podataka, informacijskom vezom te efektorima u procesu se općenito smanjuje i održava na razini ravnoteže procesne degradacije i informacijske akcije U prijelaznim režimima kada se tek uspostavlja informacijska obrada sustav teži iz stanja veće u stanje manje entropije. Sustav s obradom informacije i efektorima u procesu kada djeluje pod štetnim utjecajima povećava svoju entropiju do razine djelovanja tih sila Sustavi su redovito u ravnoteži prirodne entropije, sila za smanjenje i sila za povećanje entropije.
  • 76. Informacija i entropija u sustavu Slučaj 1. Korisna informacija je veća od entropije - ukupna entropija u sutavu pada Slučaj 2. Korisna informacija je jednaka entropiji u sustavu entropija sustava je u ravnoteži Slučaj 3. Korisna informacija je manja od entropije u sustavu entropija sustava raste Korisna informacija uključuje lanac: izvor informacije - prijenos i obrada podataka - odluka i djelovanje u povratu na proces / izvor Informacijski kanal je usmjerena veličina s najmanje jednim izvorom i najmanje jednim odredištem; sadržava izvor, koder informacije, koder kanala, prijenosni sustav, dekoder kanala, dekoder informacije i odredište - prijamnik.
  • 77. Informacijski kanal Informacijski kanal ima semantičku bazu koja je zajednička za izvor i korisnika, odredište Pragmatika i apobetika se pri tome mogu značajno razlikovati U tehničkom i informacijskom smislu razlikujemo kanale sa ili bez memorije, dakle kod kojih se prijenos informacije u nekom trenutku ne uvjetuje prethodnim prijenosom (znakom) Isto tako lučimo stacionarne i nestacionarne kanale, dakle kanale kojima se svojstva mijenjaju odnosno ne mijenjaju s vremenom Fizička i tehnička podrška informacijskom kanalu je vrlo različite prirode poput telefonske veze, telegrafa, satelitskih, radijskih komunikacija, do, po vlasničkom principu i izgradnji, različitih namjenskih ili vlasničkih mreža
  • 78. Osnovni parametri informacijskog kanala Kanali se razlikuju po kašnjanju u prijenosu, propusnoj moći, cijeni, pouzdanosti, kvaliteti usluge. Komunikacijska mreža čini barem 40% ukupne cijene nekog tehnološkog projekta - ako se gradi iznutra Kašnjenje u sustavu zbog obrade dato je srednjim vremenom Tw – Tw = Tx - u (11) – gdje su Tx srednje vrijeme odziva kanala / sustava a u je vrijeme obrade u čvorovima sustava
  • 79. 4. Bayesov teorem i Bayesov stavak Ako postoji događaj A, P(A)>0, pokušajmo odrediti kolika je vjerojatnost da neki drugi događaj B poprimi svojstvo događaja A. Dakle P(B/A) = P (AB) / P(A) (12) –B AB A
  • 80. Složeni događaj Ako je B neki događaj koji se prostire preko više područja A onda vrijedi P(BA1)+P(BA2)+… +P(BAn) = P(B) (13) Odnosno P(B)= P(B/A1)P(A1)+P(B/A2)P(A2)+…+P(B/An)P(An) (14). Obrnuto da događaj A poprimi vrijednost događaja B je P(A/B)=P(AB)/P(B) (15). Kako je P(AB) = P(BA) to vrijedi P(A/B)=P(B/A) P(A) / P(B) (16) Poopćenje za Ai ti događaj daje P(Ai/B)=P(B/Ai)P(Ai) / ( P(B/A1+…+P(B/An)P(An)) (17) što se zove Bayesov teorem koji povezuje apriornu i aposteriornu vjerojatnost tj vjerojatnosti prije i nakon pojave događaja Ai.
  • 81. Bayesov teorem - primjer Izvor informacije šalje s jednakom vjerojatnosti p=0,5 jedan od dva znaka 0 ili 1. Znamo s vjerojatnosti 0,001 da je moguće bilokoji od ova dva znaka krivo interpretirati. Dobili smo 1. Koliko je sigurno jedinica i poslana? P(A1/B)= 0,999 0,5 /(0,999 0,5 + 0,001 0,5) = 0,499/0,5 = 0,999 Dakle zbog jednake vjerojatnosti odašiljanja aposteriorna vjerojatnost jednaka je apriornoj. Što bi bilo da je p0=0,2? Bayesov stavak : Makako malo vjerojatan događaj ipak ima određenu iako vrlo vrlo malu vjerojatnost pojave.
  • 82. 5.Binarni simetrični kanal Kanal: bez memorije, dio je informacijskog sustava i stacionaran je. Na ulazu je skupina znakova A (a1,a2,a3,…aq) a na izlazu skupina znakova B (b1,b2,b3,…,bs). Ulazna abeceda je veća zbog mogućnosti ispravljanja greški redundancijom u kodu. Kanal opisuje skup uvjetnih vjerojatnosti P(bj/ai) =Pij tj vjerojatnosti da neki ulazni znak ai bude interpretiran kao izlazni znak bj. Dakle imamo shemu: p(a1)P11+p(a2)P21+ …+ p(aq)Pq1= p(b1) …. p(a1)P1s+p(a2)P2s+…+ p(aq)Pqs=p(bs) Ako kanal nema smetnji onda je za svaki i jedan Pij=1 a svi ostali jednaki su ništici. Tada je p(bj)=p(ai).
  • 83. Binarni simetrični kanal sa šumom/2 Rabimo sada Bayesovu formulu tj P(ai/bj)=P(bj/ai)p(ai) / Σ P(bj/ai)p(ai)=P(bj/ai)p(ai)/p(bj) (16) Svaki ulazni znak izaziva pojavu nekog izlaznog znaka. Problem je što mi ulaz ne poznajemo! Binarni simetrični kanal: p(a1=0)=p, p(a2=1)=1-p a1=0, a2 =1 P00=P11=P b1=0, b2=1 P10=P01=Q Što je Q? Kako ga možemo mjeriti?
  • 84. Binarni simetrični kanal/3 Uz uvjet da znamo koji je znak primljen treba odrediti vjerojatnost odašiljanja različitih znakova tj P(a=0,b=0)= Pp/ (Pp+Q(1-p)) P(a=1,b=0)=Q(1-p) / (Pp+Q(1-p)) P(a=0,b=1)=Qp/(Qp+P(1-p)) P(a=1,b=1)=P(1-p)/(Qp+P(1-p)) (17) Za P=0,9 Q=0,1 p(0)=19/20 p(1)=1/20 dobivamo iz (17) P(a=0,b=0)=171/172, P(a=1,b=0)=1/172, P(a=0,b=1)=19/28 te P(a=1,b=1)=9/28. Proizlazi da se, za navedeni primjer, bez obzira na to koji je znak poslan mora pretpostaviti da je poslana ništica! Isto je tako veći utjecaj izbora znakova na kanalu od šuma na kanalu.
  • 85. Entropije diskretnog kanala sa šumom Zamisao entropije može se primijeniti na ulazni i izlazni niz znakova, H(A)= Σp(ai)logp(ai), H(B)=Σp(bj)logp(bj) (18) Za uvjetne entropije H(A/B) iz H(A/bj)= Σ P(ai/bj) logP(ai/bj) H(A/B)= Σ p(bj) H(A/bj)=ΣΣ P(ai,bj)logP(ai/bj) H(A,B)=ΣΣ P(ai,bj) log P(ai,bj) … slikom H(A) H(A/B) I(A,B) H(B) H(B/A) H(A,B)
  • 86. Entropije diskretnog kanala sa šumom/5 Vrijedi: H(A/B)≤ H(A), H(B/A)≤H(B) H(A,B)=H(A)+H(B/A)=H(B)+H(A/B) H(A)+H(B) = H(A,B) za nezavisne A i B Transinformacija I(A,B)= H(A)+H(B) - H(A,B) (19). I(A,B)=H(B)- W W=ΣB P(b/a) log(1/ P(b/a))=Plog(1/P)+Qlog(1/Q)=H(P) (19a) I(A,B)=H(B)-H(P), uz p(b=0)=pP+(1-p)Q=x te p(b=1)=1-x slijedi I(A,B)=H(x)-H(P) Kapacitet C=maxAI(A,B)=1-H(P) (19b), jer je max(H(x)) jednako 1 za x=1/2
  • 87. 6. Markovljev izvor, kodiranje na izvoru, procesni izvori Izvori podataka često traže prilagodbu zbog svojeg optimalnog kodiranja. To se naziva kodiranje na izvoru. Uobičajena pretpostavka da su vjerojatnosti pojavljivanja znakova međusobno neovisne je dosta gruba i netočna. Uključuje zapravo gubitak memorije između pojava pojedinih znakova Uključenje memorije svojstvo je izvora Markovljevog tipa. Dakle vjerojatnost emitiranje nekog znaka ovisi o prethodnim znakovima, tj P(ai u intervalu t/ aj u intervalu t+1) = P(an u intervalu t-n,…, ai u intervalu t/ aj u intervalu t+1) (20). Markovljev proces je određen kada se zna početna raspodjela vjerojatnosti pojave znakova pj i matrica prijelaza izmedju svakog od znakova. Element matrice pij označava vjerojatnost da se iza znaka ai šalje znak aj.
  • 88. Markovljev izvor /2 Da bi izvor podataka Markovljevog tipa bio stacionaran mora biti ispunjeno pj = Σ pi *pij j=1,2,…a (21), odnosno u matričnom obliku ΠT pij = pij (22), gdje je T oznaka za transponiranu matricu. Markovljev izvor je izvor prvog reda kada ima memoriju prvog reda. Možete li procijeniti kolikog je reda cijena automobila kao Markovljev izvor? Što moramo uzeti u obzir? A kojeg je reda automobilska nezgoda? Markovljev izvor podataka može biti ergodičan ili neergodičan. Ergodičan je kada se izvor iz svakog stanja može u konačnom vremenu vratiti u svako stanje.
  • 89. Neergodičan Markovljev izvor Na slici je prikazan neergodičan Markovljev izvor: d b a Izvor se nikada ne vraća u početno stanje a! c e
  • 90. Kodiranje podataka Markovljeva izvora Pretpostavimo da prijelazna matrica Markovljeva izvora ima izgled: a b c – – – – – – – – – a 1/3 1/3 1/3 b 1/4 1/2 1/4 c 1/4 1/4 1/2 Višestrukim množenjem matrice samom sa sobom što je ispunjeno za homogenu nedjeljivu matricu dobivaju se tzv ravnotežne vjerojatnosti pojavljivanja znakova a,b,c kao pa=3/11, pb = 4/11 pc = 4/11. Kodiranjem matrice prijelaza Huffmanovim kodom za a=1, b=00 i c=01 slijedi: La = 1*1/3 + 2*1/3 +2*1/3 = 1,667 bita, Lb= 2*1/4+1*1/2+2*1/4= 1,5 bita i Lc= 1,5 bita U ravnoteži dobivamo prosječnu duljinu koda Lm=3/11La+4/11Lb+4/11Lc= 17/11 bita Kodiranjem prema frekvencijama pojavljivanja dobivamo L=2*3/11+2*4/11+1*4/11=18/11> Lm !
  • 91. Procesni izvori podataka Vrsta entropije Primjer varijable Skup znakova Brzina snimanja Razdioba podatka Entropija Tok podataka Vremenska Temperatur ni pretv. mA Tlak u cijevi 0-1 bar Onečišćenj e tla, 0-10 ppm Vrem. Raspored rada kem. reaktora Svakih 0,1mA 10 znak/s Jednolika 763 bit/znak 76,3 bit/znak Svaki 0,1 bar 1 znak/m Drugi korijen 3,25 bit/znak 3,25 bit/m Svaki ppm 1 znak/km2 Eksponenci 1,5 bit/znak 1,5 bit jalna /km2 Uk / isk 1 znak/dan Prostorna 2D prostorna Entropija uporabe Puk=0,7 Pisk=0,3 O,899 bit/znak 0,899 bit/dan
  • 92. Optimiranje procesnih izvora podataka Osnovno je što više reducirati nepotrebne obrade podataka. U tu svrhu najjednostavnije je izostaviti redundantne podatke. Smanjuje se razlučivanje osjetila ili povećava vremenski i prostorni korak snimanja. Ograničenje za brzo promjenjive procese je zahtjev Nyquistova teorema uzorkovanja ( uzimanje najmanje dva uzorka od najbrže promjene - kako se to nosi sa šumom?) Drugi je način ne uzimati u prvoj fronti one podatke za koje postoje izravna stohastička zamjena, sličnost. Ovo se naziva ortogonalizacija izvora podataka. Poseban je problem vjerodostojnost podatka pojedinog izvora. To se rješava poznavanjem povezanosti ponašanja tog izvora s ostalim izvorima podataka u procesu. Stoga je određena redundantnost snimanja nužna.
  • 93. 7. Shannonov teorem za binarni simetrični kanal
  • 94. Sheme odlučivanja Na prijamnoj strani odlučujemo, nakon dobivanja znaka bj, koji je znak ai poslan. Ovo ovisi o p(bj/ai) te o vjerojatnosti p(ai). Na primjer – b1 b2 b3 a1 0,5 0,3 0,2 a2 0,2 0,3 0,5 a3 0,3 0,3 0,4 Ovdje postoje tri pravila odlučivanja Pravilo 1: o(b1)=a1 o(b2)=a1 o(b3)=a2 Pravilo 2: o(b1)=a1 o(b2)=a2 o(b3)=a2 Pravilo 3: o(b1)=a1 o(b2)=a3 o(b3)=a2 Argumenti postoje u prilog svake pojedine odluke. Promatra se jedan znak u vremenskom nizu, a ne cijeli nizovi znakova.
  • 95. Sheme odlučivanja /2 U općem slučaju postoji qs shema odlučivanja, q je broj ulaznih a s broj izlaznih znakova. Stoga se uvodi pojam pravila najveće vjerojatnosti odnosno uzimaju se najvjerojatniji znakovi. Ako to primijenimo dobivamo za gornji slučaj i b1 : o(b1)=a1. Ako je dobiven b2 možemo uzeti jednu od odluka o(b2)= a1, o(b2)=a2 ili o(b2)=a3. Kada na prijamniku dobijemo b3 onda istim načinom odlučujemo za o(b3)=a3. Općenito je vjerojatnot pogreške odlučivanja pri dobivanju znaka bj jednaka P(E/bj)= 1- P (o(bj)/bj) (23)
  • 96. Prosječna pogreška odlučivanja Općenito je vjerojatnost pogreške pri prijamu znaka bj jednaka P(E/bj) = 1 - P( o(bj)/ bj) (24). Prosječna pogreška jednaka je uz p(a)=1/q Pe=Σ P(E/bj) p(bj)= 1 - 1/q * Σ P(bj/a ispr) (25), gdje je P(bj/ a ispr) vjerojatnost da je znak aispr bio uzrok dobivanja bj na prijamniku. Tada iz našeg primjera imamo Pe = 1 - 1/3 * (0,5 + 0,3 + 0,5) = 1 - 1/3 * 1,3 = 0,56667. Vidimo da je iznos prosječne pogreške znatan. Tim prije se vidi potreba uvođenja kodova koji povećanjem zalihosti smanjuju očekivanu pogrešku kod prijama.
  • 97. Pogreška na binarnom simetričnom kanalu Binarni simetrični kanal može prenositi informaciju sa smanjenom pogreškom ako se uvede zalihost. Pretpostavimo dakle da prenosimo 0 kodom (000) a 1 kodom (111). Tada su preostale kombinacije kodova neiskorištene. Pretpostavimo da je vjerojatnoast točnog prijenosa P a netočnog Q, Q<0,5. Za Q=P=0,5 imamo samo šum na kanalu i kapacitet C=0. Sada je vjerojatnost prijenosa bez greške jednaka P3, jedne pogreške je 3P2Q (ispravljivo!), dvije pogreške je 3PQ2 te tri pogreške Q3. Odatle je – – – – Pe ≈ Q2 (Q + 3P). Za P=0,99 dobivamo Pe ≈ 3*10 -4 vidimo da je minimalni Hammingov razmak detektor s najvećom razlučivošću.
  • 98. Shannonov teorem Teorem : Neka je dan binarni simetrični diskretni kanal bez memorije kapaciteta C>0. Tada postoji blok kod (n,k) i shema odlučivanja g tako da vrijedi da se prosječna pogreška može načinit po volji malena izborom dovoljno velikog n koji je po volji blizu granice kapaciteta kanala. Dokaz: Za kanal kojim prenosimo jedan od M jednako vjerojatnih znakova, tj p=1/M, informacija po prenešenom znaku ai je I(ai)= ln (1/p)=ln M (26). No, znamo da je kapacitet bin.sim.kan. jednaka (19c) C=1-H(P)=1-H(Q) po binarnom znaku, pa će za n znakova biti na granici kapaciteta tj I(ai)= n(C-ε1), gdje je epsilon neki mali pozitivni broj. Odatle je M= 2 exp n(C-ε1)= 2exp nC / 2 exp nε1 (27) (27). Povećanjem n uzimamo mali dio znakova koji prolaze kanalom blizu njegovog kapaciteta. Jesu li ti znakovi dovoljno različiti?
  • 99. Shannonov teorem /2 Slaganje n-bitnog Hammingova koda za prijenos informacije daje vjerojatnost greške po prenešenom bitu od Q=1-P, a očekujemo nQ pogrešaka. Dakle nalazimo se negdje oko sfere radiusa nQ oko znaka ai: nQ nε2 bj ai Radius r je broj, ε2 je malen tako da u zbroju s Q ne prelazi 1/2
  • 100. Shannonov teorem /3 Kod prijama se slika invertira: nQ bj ai nε2 Sada tražimo formulu za pogrešku zbog nemogućnosti ispravnog dekodiranja primljene poruke.
  • 101. Shannonov teorem /4 Slučaji Ispravan ai u S(r) Drugi ai u sferi S(r) Greška 1 da da da 2 da ne ne 3 ne da da 4 ne ne da
  • 102. Shannonov teorem /5 Vjerojatnost pogreške prijama je PE=P{ai ∉S(r)}+P{ai ∈S(r)}P{najmanje neki drugi kod je u S(r)} (28) Prvi član uključuje slučajeve 3 i 4, drugi član uključuje slučaj 1. Budući da je P{ai∈S(r)}≤1, a drugi član u (28) možemo pisati kao ΣA-ai P{a∈S(r)} onda dobivamo: PE ≤ δ + ΣA-ai P{a∈S(r)} (29), gdje δ=δ(ε2,n) možemo načiniti po volji malenim ako n dovoljno povećamo, tako da sfera radijusa r= n(Q+ε2) pokriva sve razmake osim za po volji mali broj slučajeva. Dakle prvi član odgovoran je za grešku za određeni poslani znak, a drugi član odgovara za brzinu prijenosa jer sadržava sve ostale M-1 članove, osim koda za ispravni znak.
  • 103. Shannonov teorem /6 Slučajni kod bira M n-bitnih riječi kao poruke. Sada je očekivana pogreška Pe ≤ δ + (Μ−1)Po a ∈ S(r) ≤ δ + MPo{a∈S(r)} aai (30). Za jednoliku vjerojatnost raspršenja svih kodova, osim ai, svuda po prostoru koda, vjerojatnost nalaženja u sferi S(r) jednaka je omjeru volumena sfere i ukupnog volumena, 2 exp n, dakle Po= N(r) / 2 exp n (31), N(r) je broj kodnih točaka u sferi S(r). Taj je broj za binarni simetrični kanal jednak N(r)=1 + C(n,1) + C(n,2) + …+ C(n,r) = Σ C(n,k), k=0,…,r (32). Iz poznatih r=(Q+ε2)n, Q+ε2<1/2, te Q+ε2 =λ dobivamo N(r)≤2 exp (n H(λ)), odnosno Po≤2exp(-n(1-H(λ)) (33).
  • 104. Shannonov teorem /7 Dakle, Pe ≤ δ + Μ 2exp (-n(1-H(λ))) (34). Eksponent u (34) (1-H(λ))= C - (H(Q+ε2) - H(Q)) Zbog konveksnosti se entropijska funkcija može u bilo kojoj točki ograničiti s tangentom na krivulju u toj točki tj H(Q+ε2) ≤ H(Q)+ ε2 dH/dQ, gdje zbog 0<Q<1/2 vrijedi dH/dQ = log (1-Q)/Q > 0. Odatle je 1-H(λ) ≥ C - ε2 log (1-Q)/Q = C - ε3. Odatle je Pe ≤ δ + Μ2exp (-n(C-ε3)), odnosno Pe ≤ δ + 2 exp(n(C-ε1)) 2 exp(-n(C-ε3))=δ+2exp(-n(ε1-ε3)) (35). Dakle uz izbor ε2 takvog da je ε1-ε3>0 prosječna pogreška Pe može biti po volji malena uz n dovoljno velik.
  • 105. Shannonov teorem /8 Vidimo da postoje teorijski pogodni kodovi za optimalan prijenos na kanalu sa šumom, sa zanemarivom pogreškom.Nadalje: kodovi mogu biti prilično dugi. Duge poruke zahtijevaju dugo prikupljanje podataka prije slanja, tj ništa se neće slati prije nego se dovoljno ne prikupi (čekanje!). Nadalje: kod nekog izvora ne znamo u kojoj je fazi kodiranja. Nadalje: knjiga kodova je jako velika, njezin je opis velik. Nadalje: nitko ne zna koji je od tih dugačkih kodova koja se moraju mučno ispravljati zapravo onaj najbolji. O tome u Shannona nema ni riječi! Očito je da za otkrivanje prave informacije treba jako puno vremena i čekanja: čak i uz naoko relativno povoljan kapacitet kanala. U ekspanziji koda se možda krije i neka druga zakonitost? Lema(F.J): ako vam neka informacija izgleda nejasna, a ne možete povećati brzinu kanala, onda vam preostaje strpljenje. Danas se svi bave povećanjem brzina kanala. Sama informacija pritom nije važna!
  • 106. 8. Železnikarove teze 1. Informacija je kružna spontana pojava informacije. – Kad izgovaramo rečenicu: “Iva pije vodu” gdje je tu kružnost, kamo spontanost? 2. Informacija posjeduje sposobnost samokontrole. - je li samokontrola osnovno svojstvo izvora informacije? - možemo li samokontrolu izvesti bez kružnosti? 3. Informacija unutar informacije iskazuje se kao protuinformacija pitanje - može li se samokontrola izvesti bez pitanja? 4. Uključenje informacije znači njeno ubacivanje, ugnježdenje, smještavanje u neko tijelo koje je razumije. - informacija bestjelesnog / neenergetskog je nepristupačna, ulazom u tjelesno - energetsko ona se postvaruje / manifestira - da bi tijelo razumjelo informaciju ono mora kao prvo razumjeti okoliš - no okoliš nije informacija - okoliš je zamagljenje informacije!
  • 107. Železnikarove teze /2 5. Informacijski paralelizam je informacija po sebi – paralelizam je inherentan informaciji – informacija je i paralelna i trenutna 6. Informacijska slijednost je spontana kružnost informacijske prirode – serijska priroda informacije teži svom izvoru, odatle i njezina kružnost 7. Ukupna fenomenologija živog i neživog je fenomenologija informacijskog oblika i informacijskog procesa – informacijski oblik i proces su dijalektička cjelina 8. Informacijski oblik je statička a informacijski proces dinamička informacijska slika fenomena – fenomeni se pojavljuju u statičkom (forma) i dinamičkom (sadržaj) obliku; u ovom potonjem su neopisivi - dok se ne oblikuju u statičkom – u računala je forma primarna veličina - ono je bez informatičkog sadržaja
  • 108. 9. Estimacija i interpretacija signala Trenutna frekvencija signala Pojam trenutne frekvencije vezan je za npr harmonijsko gibanje tijela, ili općenito vibraciju, tj broj titraja u jedinici vremena. Signal s(t), kada ga promatramo kao zbroj harmoničkih vibracija, možemo predočiti vlastitim spektrom pomoću Fourierove transformacije tj S(f) = ∫ s(t) e -j2πft dt, -∞< t < ∞ (36). Slično tome se signal može sintetizirati iz svojeg spektra kao s(t) = ∫ S(f) e j2πft df, -∞< f < ∞ (37). Postupci su opravdani za signale sa stalnim spektrima u vremenu! No u praksi nastupaju slučajevi s vremenski promjenjivim spektrima.
  • 109. Estimacija i interpretacija signala /2 Poopćenje pojma frekvencije na nestacionarne signale Van der Pol je 1947. razmatrao pojam trenutne frekvencije na signalu: s(t) = a cos (2πft + Θ) (38) a je amplituda, f je frekvencija a Θ je fazna konstanta, odnosno argument kosinus funkcije je faza Φ(t) = 2 πft + Θ . Dakle definirao je amplitudnu modulaciju kao a(t) = a0(1+µg(t)) (39). Faznu modulaciju je definirao kao Θ = Θ(1 + µg(t)) (40), a faza je argument kosinus funkcije u (38) postaje Φ(t) = 2πft + Θ(t) (41).
  • 110. Estimacija i interpretacija signala /3 Frekvencijska modulacija se ne može izraziti poput (39) jer ne dobivamo (41) već je potrebno rabiti izraz s(t) = a cos [∫ 2πfi(t) dt + Θ] (42), gdje je argument kosinus funkcije faza. Dakle imamo definiciju trenutne frekvencije fi kao fi(t) = 1/2π * d(φ)/dt (43). Gabor je predložio nalaženje trenutne frekvencije iz FT stvarnog signala pa modifikacijom spektra tako da se potisnu negativne a dvostruko pojačaju pozitivne frekvencije spektra signala, dakle z(t) = s(t) + jH(s(t)) (44), z(t) je Gaborov složeni signal, s(t) je stvarni signal a H je Hilbertova transformacija koja se definira kao: H(s(t)) = p.v. ∫ s(t-τ) / πτ dτ -∞<τ<∞ (45). P.v. je Cauchy-jeva principijelna vrijednost integrala (45).
  • 111. Estimacija i interpretacija signala /4 Opravdanje za svoj postupak Gabor je vidio kod izračunavanja centralnih momenata frekvencije signala, jer bi se svi neparni momenti spektara bili jednaki nuli, a to ne bi išlo u stvarnosti. Gaborov složeni signal naziva se analitički signal. Ville je izrazio trenutnu frekvenciju signala s(t)= a(t) cos φ(t) kao fi(t) = 1/2π d/dt(arg(z)) (46), gdje je z(t) analitički signal dat u (44). Ville veli nadalje da, ako je t.f. vremenski varira onda (intuitivno) i postoji neki trenutni spektar koji mu se pridružuje, gdje su srednje vrijednosti frekvencija u tom spektru te t.f. Uporabom Gaborovih prosječnih mjera dokazao je tu vezu prosječnih frekvencija i vremenskih prosjeka, odnosno ∫f*Z(f)2 df / ∫z(f)2 df = ∫fi*z(t)2dt / ∫z(t)2 dt (47), a granice integrala su preko područja -∞<f<∞, -∞<t<∞.
  • 112. Estimacija i interpretacija signala/5 Odatle su Ville i Wigner definirali raspodjelu signala po vremenu i frekvenciji (42cit), označenu kao W(t,f), koja svojim prvim momentom određuje trenutnu frekvenciju složenog signala. Ostali autori, poput Rihaczeka i Ackroyda ukazali su na točke u vremensko-frekvencijskoj ravnini gdje se koncentrira energija! Osnovni problem je u tome što mi jednu jedinstvenu pojavu u vremenu naime s(t) želimo prikazati dvjema funkcijama vremena, poput para ovojnica-faza ili realni-imaginarni dio. Ovo koji puta ide bez pogreške kao u slučaju kad razmatramo vrijedi li a(t)cosφ(t) + jH(a(t)cosφ(t)) = a(t)e jφ(t) (48). Rješenje (48) , prema Bedrosianu, je valjano ako spektar A(f) = F{a(t)} leži potpuno u području f< f0 a spektar F{cosφ(t)} postoji potpuno izvan tog područja. Dakle amplituda a(t) i faza φ(t) mogu se smatrati neovisnima samo ako spektar a(t) i cosφ(t) imaju odvojena frekvencijska područja.
  • 113. Estimacija i interpretacija signala /6 Trenutna frekvencija i grupno kašnjenje (GK) Složeni signal z(t) =a(t) exp(jθ(f)) ima složeni spektar oblika Z(f) = A(f) exp(jθ(f)) (49), gdje su a(t) i A(f) pozitivno definitne funkcije. Veličina zanimljiva za opis signala je grupno kašnjenje: τg(f) = -1/2 π * d/df θ(f) (50). Grupno kašnjenje može se predstaviti kao da je promjena vremena propagacije funkcija frekvencije impulsa koji putuje kroz linearni filter s impulsnim odzivom h(t) = s(t). Jasno je da fazni spektar θ(f) i GK ovise i o fazi i amplitudi vremenskog signala. Isto tako faza signala φ(t) i TF također ovise i o faznom i amplitudnom spektru. Za signal s(t), ako je vrijednost t= τg jedinstvena, smatramo da opisuje položaj signala u vremenskoj domeni. Ako je τg funkcija f tada opisuje lokalizaciju različitih komponenti spektra u vremenskoj domeni.
  • 114. Estimacija i interpretacija signala/7 Utjecaj umnoška BT na TF I GK Vrijeme trajanja T i širina pojasa B su značajke signala koje opisuju “epohu” pojave signala i njegova spektra. Smanjnjem trajanja signala u vremenu dolazimo do nestanka signala u šumu. No signal se katkada, iako manji od šuma može smatrati signalom u smislu njegove detekcije. To se naravno odnosi na ponavljajuće pojave. Djelatno trajanje signala je po dogovoru Ts2= ∫t2s(t)2 dt / ∫s(t)2 dt (51) a djelatna širina pojasa Bs2 = ∫f2S(f)2 df / ∫ S(f)2 df (52). Odnos između B i T možemo lako razmotriti ako signal s(t) usporimo ili ubrzamo. Razvučeni signal sr = s(rt), gdje je r faktor razvlačenja. Tada je pripadni spektar Sr(f) = 1/r S(f/r) , r>0 (53).
  • 115. Estimacija i interpretacija signala /8 Dakle rastezanje signala dovodi do sažimanja spektra. Odatle je odnos B i T vezan, odnosno umnožak BT= const za svaki signal. Dapače iz (51) i (52) slijedi da je minimalni BT= 1/4 π za gaussovski oblik signala. Signale s konačnim trajanjem spektrom i energijom ako imaju BT>10 smatraju se “asimptotskim signalima ”. Landau i Pollak su pronašli da signali s BT>5 imaju 99% energije u području definiranom unutar B i T. Dakako signali s malim BT u informatičkom smislu nisu dovoljno “bogati”. Njihove estimacije su slabe. Neke korisne definicije i svojstva asimptotskih signala s(t): Neki asimptotski signal s(t) je monokomponentan ako njegova trenutna frekvencija fi(t) točno predstavlja modulacijski zakon signala, jednoznačna je i postoji njen invers fi-1(t) Neki je asimptotski signal s(t) višekomponentan ako postoji konačan broj N monokomponentnih signala sj(t) takvih da u zbroju daju s(t). Samo jedna od njenih komponenata mora biti asimptotska. Dekompozicija je ovisna o primjeni!
  • 116. Estimacija i interpretacija signala/9 Monokomponentni signal Višekomponentni signali t t f t f f
  • 117. Estimacija i interpretacija signala /10 Svojstva asimptotskih signala 1. Energijska razdioba asimptotskog signala s(t) usredotočena je u konačnom vremensko-frekvencijskom području oko TF, a stupanj koncentracije je ovisan o umnošku BT. 2. Za jednokomponentni asimptotski signal s velikim BT i monotonim zakonom promjene može se pokazati da se fi(t) približava prema τg-1, tj ove su dvije funkcije međusobno inverzne. Tada fi(t) opisuje zakonitost frekvencijske modulacije signala s(t), a τg(f) predstavlja vremensko kašnjenje signala. 3. Za jednokomponentni asimptotski signal s malim BT ne vrijedi jednakost fi(t) = τg-1. Ne postoji niti fizikalno značenje koje se može pripisati ponašanju u t-f ravnini, iako je matematički dobro definirano. Dakle traži se monotonost ponašanja TF i veliki iznos BT-a. Monotonost osigurava jednu prasliku u području T, a veliki iznos BT osigurava da se svaki element u T preslikava na jednu sliku u B, dakle da postoji dominantnost jedne frekvencije npr. f0.
  • 118. 10. Pretraživanje podataka Pretraživanje podataka (data mining) je analitička tehnika kojom se grade modeli za obilježavanje podatka u cilju nalaženja informacije. Procjena uspješnosti skupe marketinške kampanje, otkrivanje bitnih uzroka kvarenja energetskih transformatora ili postizanje veće odzivnosti na potrebe kupca telefonske usluge - važan je motiv za opsežnu, skupu i često dugotrajnu analizu velike količine podataka. Tehnike kojima se služimo možemo grubo grupirati na: - pomoć pri boljem razumijevanju podataka - ugradnja značajki u podatke za njihovu kasniju analizu - omogućavanje mjerenja uspješnosti ugrađenih značajki Opisuje se niz postupaka od predobrade sirovih podataka do korisnih postupaka njihovih odvajanja i obilježavanja. Naglasak je na razumijevanju podataka već prije početka postupka obrade.
  • 119. Važnost podat(a)ka Iznosi podataka penju se brzo na milijarde jedinica. Ako želimo obilježiti živi svijet na nekom području tada za 2000 vrsta, u 2000 različitih lokaliteta te sa 2000 bajtova po lokalitetu imamo 8GBy podataka. Ipak zaključci koje možemo izvesti iz sintaksnih okvira računarskih podataka i semantička interpretacija njezinih vrijednosti je ograničena. Sve ovisi jako o kvaliteti podataka s kojima raspolažemo. Tehnike rijetko kada imaju sposobnost uporabe znanja iz date domene a zasigurno nemaju pristup obilju infromacije koja je na raspolaganju analitičaru. Stoga analitičar mora osigurati da se donose najbolji mogući podaci koji daju i najviše moguće iznose informacije. Kvaliteta podataka odnosi se na njihovu potpunost, odvojivost i razumljivost za analitičara. Potpunost ovisi o tome ne posjeduje li zapis sve podatke. Nedostatak podataka obezvređuje osobine sustava. Postoje neki načini da se nadiđe i takav slučaj.
  • 120. Važnost podat(a)ka /2 Odvojivost podataka odnosi se na lakoću kojom se mogu obilježavati klase podataka u datom skupu. Obilježavanje mora moći ići u smislu postizanja cilja obrade. Tako se obilježavanje podataka puta ne smije izbjeći kod analize problema trgovačkog putnika i sl. Često je to kombinacija obilježja koja igra ulogu u nalaženju informacije. No analitičar koji ne razumije područje rada teško će otkrivati svojstva obilježavanja! Razumljivost podataka može se kretati od poznavanja vrste podataka atributa (obilježnika) do razumijevnja stohastičkih modela koji se koriste i pravog sadržaja informacije. Semantičko razumijevanje značenja atributa bila bi poželjna osobina, no malo sustava za pretraživanje podataka posjeduje svojstvo uporabe domenskog znanja.
  • 121. Važnost podat(a)ka /3 Vrste podataka U biti postoje dvije vrste podataka: brojčani (kvantitativni) i simbolički (kvalitativni). Brojčani podaci (cjelobrojnici ili realni brojevi) donose svojstvo razlikovanja značajnosti dvaju podataka iz razlike njihovih brojčanih iznosa. Simbolički podaci ( brojke ili znakovi) donose svojstvo da im je za istu jedinicu različito značenje. Dakle za neko svojstvo obrade mora postojati neka skala obilježavanja simbola koja je primjerena datom cilju obrade. Često je već postizanje skale obilježavanja veliki doprinos pretraživanu podatka. Skale obilježja dakle moraju izrađivati eksperti iz područja problema koji se rješava datom obradom pretraživanja. Zadatak: poredajte po skali obilježja vaše informatičke uređaje: računalo, telefon (mobilni?), TV prijamnik, kućno zvonce. Ovisi li to i o okolnosti uporabe?
  • 122. Važnost podat(a)ka /4 Predočavanje podataka Kada skup podataka prelazi tri atributa ili 1000 jedinki teško ga je predstaviti s dovoljnom jasnoćom. Porast broja i složenosti podataka u računalima taj je problem samo povećao. Jako je teško stvarne podatke “vidjeti” kao nakupine, grozdove. Svakako da je dobro predočavanje podataka uvjet za njihovo bolje razumijevanje.Uz sve isto podatke ćemo najbolje predočavati tako da istaknemo one atribute, dimnezije gdje se najviše razlikuju. Isto tako možemo one dimenzije gdje se ne razlikuju naprosto zanemariti u predočavanju. Tako možemo prikaz smanjiti na onaj broj dimenzija 2,3 koji je najprimjereniji za predočavanje čovjeku. Nadalje, dovoljno je izabrati do stotinu oglednih podataka za prikaz od više od tisuću njih, da bi se dobio uvid u osnovna svojstva skupa podataka.
  • 123. Tehnika predobrade Predobrada podataka je važan korak u njihovom boljem prikazu korisniku, otkrivanju skrivenih svojstava i svođenju na oblik u kojem se mogu uspoređivati podaci iz različitih izvora. Postupci predobrade svode se na filtraciju, skaliranje, normalizaciju te regresiju dimenzije. No, bez obzira koji se postupak uvodi podaci nakon predobrade nisu više jednaki onim sirovim podacima. Budući da se radi o tome da ne znamo informacijski model na izvoru, niti mu možemo pristupiti, ne možemo doći do čistog informacijskog signala, a ne znamo ni model šuma niti mu možemo pristupiti a znamo samo mjerni signal, to je problem pristupu informaciji daleko teži nego izgleda. Naravno da predobradom samo smanjujemo neke od nepoznatih veličina, nikako sve.
  • 124. Tehnika predobrade /2 Opća shema predobrade Nedostupni model šuma Nedostupni šum Model=? Nedostupni inf. izvor Model=? * Filter Nedostupni inf. signal Mjerenje, podatak Predobrađeni podatak
  • 125. Tehnika predobrade /3 Filtriranje se može izraziti iz osnovne formule (Graupe, 176) yk = x k + nk (54), gdje je yk mjerenje, sirovi podatak, xk je signal a nk je aditivno dodani šum, k je k-ti vremenski interval. Filter daje procjenu, estimaciju xke signala xk samo na osnovici yk. Pri tome optimalni linearni filter zahtijeva poznavanje parametara modela signala i šuma. Linearni Wienerov filter u smislu minimuma kvadratnih odstupanja estimacije daje linearnu estimaciju xke informacijskog signala s obzirom na mjerenja tj xke = Σαi* yk-i sumiranje od 0<i<M (55), gdje su αi parametri filtera koji se izračunavaju prema minimumu kvadrata odstupanja od estimacije, a M je dubina utjecaja na estimaciju. Kada doprinos estimaciji s porastom M padne ispod nekog iznosa onda se daljnje računanje po dubini više ne uzima u obzir. Možemo li za niz podataka 4,6,3,7 izračunati α0 i α1?
  • 126. Tehnika predobrade /4 Norm iranje i skaliranje podataka Skaliranje je promjena mjerila podataka u smislu povećanja njihove razdvojivosti. Nakon skaliranja potrebno je često podatke podvrgnuti zajedničkom normiranju. Teorijski promatrano klasifikatori se mogu podučiti kako primijeniti odgovarajuće linearno ili nelinearno skaliranje podataka na svojim ulazima, što je vrlo složen postupak. Uobičajeni postupci preobrade je pretvorba podataka u podatke sa srednjom vrijednosti jednakoj ništici te normiranje varijance ulaznih atributa. Uzmimo da posjedujemo dva niza podataka: m1 = 3, 4, 6, 4 te m2 = 11,14, 15, 12. Postavimo ih linearnom pretvorbom u skalu1 - 10 Normiramo tako pretvorene podatke u nizove sa srednjom vrijednosti ništa. Pokušajmo ih pretvoriti u podatke s istom varijancom. Što opažamo? Kuda su nestale izvorne veličine? Možemo li ih obnoviti?
  • 127. Tehnika predobrade /5 Regresija Regresija je zajednički naziv za raznorodnu grupu postupaka kojima se smanjuje broj opisnih atributa promatranog skupa podataka. Uobičajeno je odrediti kolika je međusobna statistička ovisnost parametara, pa onda izostaviti one parametre koji su već dovoljno dobro predstavljeni drugim veličinama. Takvi međusobno neovisni parametri nazivaju se glavni parametri ili glavne analitičke komponente, GAK. Daljnja se obrada onda odvija na puno manjem broju GAK-a što pojednostavljuje prikaz i smanjuje broj pretraga. No, ostaje osnovni problem - kojom metodom to postići! Odnosno kakav model regresije rabiti. Linearna regresija tako svodi opis neke mjerne pojave y kao linearne kombinacije GAK-a x1 , x2 ... Sljedećom shemom: Y = a1 X1 + a2 X2 + a3 X3 + o (56), gdje je o oznaka za ostatak aproksimacije pojave. X1, X2 i X3 su tada GAK-e.
  • 128. Primjer regresije podataka Y X1 X2 X3 X4 5 1 4 -3 2 8 0.2 6 -2 3 12 2 7 -1 2 15 0,6 10 1 1 -6 2 -3 2 0,6
  • 129. Tehnika predobrade /6 Koeficijent korelacije niza y i x računa se prema izrazu r = 1/n *Σ (xi- xsr)(yi - ysr) / ( 1/n *Σ (xi- xsr)2 )1/2) * ( 1/n *Σ (yi - ysr)2) 1/2) (57), gdje je n broj parova događaja, xi i yi su podaci i-tog događaja xsr i ysr su srednje vrijednosti svakog niza. Koeficijent korelacije rangiranih nizova y i x računa se prema izrazu rq = 1- 6 Σ δ2/ n2 (n-1) (58), gdje je δ2 kvadrat razlike rangova dvaju nizova. Izraz (58) vrijedi za nizove sa svim različitim rangovima u pojedinom nizu. Što možemo dobiti ispitujući podatke iz Primjera ovim relacijama? Možemo li možda postaviti regresijski izraz? Kako se ponašaju nizovi na rang korelaciju?
  • 130. Tehnika klasifikacije Klasifikacija je postupak podjele ulaznih podataka prema krajnjem ishodu događaja. Moguća je postupcima samoorganizacije podatka dakle postupcima umjetne inteligencije poput umjetnih neuronskih (živčevnih) mreža, genetičkih algoritama, ili polukvalitativnih postupaka (Quacol algebra)- ili induktivnim postupcima - stablom ili pravilom odlučivanja, te statističke - CART metoda, statistička klasifikacija ili entropijska klasifikacija. Obradit ćemo samo neke od navedenih postupaka. Zajednička osobina svim metodama je unošenje jakih elemenata kvalitativnog u postupku donošenja odluke, pa ćemo na sklopu diskriminatora objasniti postupak pretvorbe kvantitativne u kvalitativnu veličinu. Drugi vrlo značajan element je pojačanje. Bilo da se radi o skaliranju ili normalizaciji, podaci su, kada uđu u postupak ili uređaj za klasifikaciju, izloženi značajnim pretvorbama. Takve pretvorbe vrlo je teško do kraja razumjeti, obrazložiti i interpretirati. Osobito kada se radi o samoorganiziranim postupcima.
  • 131. Sklop za diskriminaciju Sklop kojem se ulaz mijenja od -5V do 5V i koji ima prag okidanja smješten na 0V prikazan je shemom: Uul Uiz Uul t Uiz Uiz Uul Sklop pretvara ulazni niz koji je u rasponu +/- 5V u izlazni niz koji ima samo dva stanja + ili - . Na ovaj način na izlazu ne znamo koliko točno iznosi ulazni niz, ali znamo da li je veći ili manji od ništice.Dakle podatak je iz kvantitativnog prešao u kvalitativno područje: veće / manje.
  • 132. Sklop za zbrajanje i skaliranje Sklop za zrajanje s postupkom skaliranja dat je na shemi: X - ulaz, Y - izlaz, W - težinski udio, S - zbrajalo Koliki je Y ako su X1=5, X2=7, W1=1, W2=10? Tko dominira? Kako možemo ovu shemu izvesti elektronički, elektromehanički? X1 W1 S X2 Y=X1W1+X2W2 W2 Kako možemo na elektroničkom sklopu promijeniti W, X?
  • 133. Samoorganizacija Promotrimo sklop na slici (strjelice označavaju podešavanja ulaznih struja u sumatore npr promjenom otpora): Za svaku ulaznu pobudu može se podešavanjem dobiti odgovarajući izlazni odziv. Ovo podešavanje naziva se samoorganizacija. X1 s D s D s D s D X2 X3 s D s D s Y
  • 134. Klasifikacija podataka /5 Klasifikacija samoorganizacijom Svaka samoorganizacija sastoji se od strukture, mogućnosti njene promjene i kriterija prilagodbe. Opisujemo tri takve klasifikacije: neuralnom mrežom, genetičkim algoritmom i Quacol algoritmom(Medusa). Neuralnoj mreži se ne mijenje struktura, promjena je na razini težinskih udjela a kriterij prilagodbe je minimum odstupanja izlaza za dati skup ulaza. Ta se samoorganizacija izvodi u etapi učenja. U etapi klasifikacije se dati obrazac propušta kroz mrežu i opaža njen učin - tj kamo uzorak pripada po svojim atributima. Genetički algoritam polazi od skupa različitih struktura, ispituje prikladnost rješanja, uzima one najbolje, kombinira ih u nove strukture tako da u kombinaciji slučajnim izborom promijeni strukturu npr svakom stotom rješenju, pa dobivene strukture opet ispituje na prilagođenost….
  • 135. Klasifikacija podataka /6 Quacol (algebra kvalitativne korelacije) rangira ulazne podatke, normira i rangira njihove algebarske kombinacije čime generira različite algebarske strukture, pa one koje su kvalitativno najsličnije ciljnoj funkciji bira za nove algebarske strukture. Što je zajedničko svim samoorganiziranim postupcima? Pretvorba kvantitativno u kvalitativno odvija se u više uzastopnih koraka (cikličnost informacije!): – kod neuronske mreže se na diskriminatoru izvodi pretvorba kvantitativno - kvalitativno a na ulazu u sumator obrnuto. – Kod genetičkog algoritma su rekombinacija i mutacija kvalitativni koraci, a određivanje rezultata i biranje potomaka je kvalitativne prirode – kod Quacol algebre je rangiranje kvalitativni postupak, a određivanje rezultata i biranje najpovoljnijih algebarskih struktura je kvantitativan postupak.
  • 136. Klasifikacija podataka /7 Induktivne metode Dvije su induktivne metode: stablo indukcije i indukcijsko pravilo Kod indukcijskog stabla računa se grananje na stablu u grupi podataka po principu podjele u dvije grupe. Podaci se ispituju prema nekoj vrijednosti atributa npr X1≥3 u ovisnosti o ishodu npr Y=7. Ispituju se svi podaci. Ide se sve prema finijoj podjeli podataka sve dok se ne dosegnu kriteriji zaustavljanja. Često se računa informacijska dobit, kao kod ID3 postupka, pa kada je više nema onda se klasifikacija zaustavlja. Indukcijsko pravilo rabi mali skup prostornih i logičkih konstrukata, poput “NA”, “I”, “U DOTICAJU”, “ILI” koji tvore početni skup pravila zasnovan na nekom početnom kriteriju. Tim se pravilima klasificiraju podaci - uzorci I mjeri učinak klasifikacije. Nova se pravila dobivaju poopćenjima, specijalizacijama i opet ispituju…Poznat je sustav AQ-11 za klasifikaciju bolesti soje.
  • 137. Klasifikacija podataka /8 Statistička klasifikacija podataka Statistička parametarska klasifikacija: Podaci se dijele linijom u 2D prostoru (ravninom u 3D), tako da ona prolazi područjem gdje je u oba podijeljena skupa minimum kvadrata razlike od njegovog centra a maksimum razlike između podataka različitih grupa. Ako je potrebno jedan se od parametara skalira da bi se dobili traženi maksimumi, odnosno minimumi. Vodi se računa o tipu funkcije razdiobe vjerojatnosti Neparametarska statistička klasifikacija: izvodi se na sličan način kao parametarska, ali ne vodi računa o tipu raspodjele, već računa centre okupljanja (K-najbliži susjed) tako da postižu minimume razmaka untar grupe i maksimum između članova različitih grupa. CART(Classification And Regression Tree) metoda: dijeli skup podataka prema sve homogenijem sastavu do ispunjenja određenog kriterija. Svaka dioba ovisi samo o jdnoj vrijednosti jednog atributa i binarnog je tipa.Kada su parametri opisni onda se podjela izvodi po njima a kada su numerički određuju se regresijska pravila.
  • 138. Klasifikacija podataka /9 Entropijska klasifikacija Metoda se zasniva na grupiranju podataka prema parametru koji posjeduje maksimum informacije, odnosno minimum entropije. Računaju se udio entropije uvjetne vjerojatnosti p(cj/ai) da ishod bude cj ako je ulazni parametar a ima iznos ai, tj H*(cj/ai) = - Σ p(cj/ai) log p(cj/ai), za sve ai od 1 do n (59), gdje je n ukupan broj kombinacija ishoda cj i klasa atributa A. Taj se udio množi težinskim udjelom svakog iznosa ai ukupnom parametru A tj H(A) = Σ p(ai) H*(cj/ai) 1<ai<k (60), k je broj klasa atributa A. Odabiranjem najinformativnijeg atributa otvara se stablo klasifikacije za ostale atribute.
  • 139. Klasifikacija podataka /10 Kriteriji odrezivanja na stablu odlučivanja Dva su kriterija odrezivanja: kada broj slučajeva padne ispod nekog iznosa koji je značajan za donošenje odluke ili kada padne do iznosa kada se događa da u neku klasu više ne dospijeva nijedan slučaj. Nedogađanje slučaja izaziva umjetni pad entropije i “ruši” metodu, jer pad entropije tada ne predstavlja smanjenje nereda već nedostatak pojave! Ako imamo c slučaja u datoj klasi a g ishoda ( npr. porast snage, pad snage motora) te jednoliku raspodjelu gustoće vjerojatnosti ishoda tada je vjerojatnost dobivanja jedne ništice unutar nekog od ishoda jednaka P( jedan ishod =0) = ((g-1)/g)c ( 61). Za slučaj c=15, g=4 vjerojatnost u (61) jednaka je 0,01336. Računamo li pad entropije za slučaj g=4, c=15 npr iz obrasca H(5,5,4,1)=0,54956 na H(5,5,5,0)=0,47712 on iznosi H=0,07244 ili 15,8%, što je zamjetno.
  • 140. Klasifikacija podataka /11 Ako kao razumnu granicu za odrezivanje stabla uzmemo klase s 2% ili manje slučajeva od ukupnog broja, tada npr za se sve klase s manje od 740*0,02 ≈15 slučajeva dalje ne klasificiramo. Ovo može biti drugi kriterij - potpuno pragmatički. Analiza klasifikacijskih postupaka Nema “najbolje “ klasifikacijske tehnike. Prema svakom slučaju se mora posebno postupiti, prilagoditi. Ipak klasificiranje po maksimumu sličnosti i potpuno odvajanje klasa kakvo je u entropijskoj klasifikaciji daje joj prednost. No za veliki broj parametara i ova klasifikacija gubi uvjerljivost. Izračunajte koliko klasa ima u skupini podataka obilježenih s 10 parametara ako svaki ima dvije veličine!(1024 klasa) Koja najvrjednije informatičko svojstvo krije u sebi postupak klasifikacije? (selekcija)
  • 141. Postklasifikacijska analiza Klasifikacija je samo jedan dio posla. Drugi je odgovarajući prikaz rezultata klasifikacije i njegovo opravdanje. Analiza dobrote klasifikatora 1. Analiza postupka učenja 1.1 Uzima se samo jedan dio podataka i klasificira. Kada se klasifikator “uvježba” onda se njime klasificira pokusna skupina podataka (od 9:1 do 1:1). Pretrenirani klasifikator nema svojstvo generalizacije. 1.2 Uzima se n skupina uzoraka za učenje i testiranje. Računa se križna validacija s nasumce izabranim parovima uzoraka. Ispituje se statistička značajnost razlike postignutih rezultata. 1.3 Stvaraju se nove skupine uzoraka iz starih odgovarajućim zamjenama nešto slično slučaju 1.2. Tada se izvodi validacija postignutog i računaju odstupanja. Ova metoda ima nedostatak u pojavi predrasudnih ocjena. 2. Ubacivanje funkcije troška Procjenjuje se cijena neispravne klasifikacije - ovo je dosta teško vrednovati.
  • 142. Postklasifikacijska analiza /2 3. Analiza statističke značajnosti rezultata klasifikacije Matrica smušenosti Massy-jeva matrica A klas. Bklas. Apredv. N11 N12 Bpredv. N21 N22
  • 143. Postklasifikacijska analiza /3 N11 - broj primjera klase A ispravno klasificiranih N12 - broj primjeraka klase B neispravno klasificiranih N21 - broj primjeraka klase A neispravno klasificiranih N22 - broj primjeraka klase B ispravno klasificiranih vrijedi N = N11+N12+N21+N22 Hi-kvadrat test se rabi za testiranje statističke značajnosti rezultata klasifikacije. Zasniva se na razlici između opaženih (O) i očekivanih (E) frekvencija pojava: χ2 = Σ (O-E)2 / E za svih N slučajeva. (62). Za veliki χ2 odbacuje s tzv nulta hipoteza da je razlika slučajna, pa je i klasifikacija statistički značajna.
  • 144. 11. Govorna informacija - mrežni agenti Govorna informacija razmatrat će se sa stajališta: – 1. Postignuća automatskog prepoznavanja govora od strane strojeva – 2. Mogućnost automatskog čitanja pisanog teksta – 3. Mogućnost prikupljanja podataka u otvorenom sustavu - mrežnim agentima – 4. Načini izgradnje konverzacijskog mrežnog agenta – Slični postupci mogu se primijeniti i na području automatskog prepoznavanja slike, automatskog crtanja, prikupljanja slikovnog materijala i izrade umjetnog agenta za prikupljanje slikovnih obrazaca, njihovu analizu i prepoznavanje. – Sva navedena svojstva strojeva svode se na pitanje kako natjerati stroj da prepozna govor, tekst ili slikovni obrazac, te kako ga isprogramirati da sintetizira komunikaciju sve iz određene baze podataka - znanja prema određenom obrascu. – Dakle kako stroj naučiti značenju, semantici! Stroj dakako ne može naučiti semantiku, ali se može dobro isprogramirati za tu funkciju.
  • 145. Agent - komunikacijski posrednik Nedruštveni agent (Poole) Agent je nešto što djeluje u svijetu, poput osobe, robota, crva, vjetra, gravitacije, svjetiljke. Ciljni agenti djeluju prema preferencijama, vole neka stanja više od drugih, dok (naoko) besciljne agente zovemo “prirodom”. Uloga nekog agenta je stvar modelskih pretpostavki. Pas može u jednom scenariju biti ciljni, a u drugom prirodni agent. Agenti mogu imati osjetila, memoriju, aktore; oni zaključuju i djeluju u vremenu. Agent osjetilima ne mora odražavati pravu sliku svijeta u kojem djeluje. Agent može kontrolirati jedino svoju akciju, poruku u datom okolišu. Agent prevodi ulazni signal u izlaz u svakom trenutku vremena. To je ponašanje kauzalno jer ulazno-izlazni odziv može ovisiti samo o datom i prijašnjim ulazima i datom i prijašnjim izlazima. Nema govora o predviđanju ili inkurziji (sadašnje ponašanje ne ovisi o budućim stanjima). Ovakvo predstavljanje modelira svijet, agente i ciljeve njihovog ponašanja na neki projektirani (sub)optimalni način.
  • 146. Konverzacijski agent Konverzacijski agent (Allen, /6/) može potpuno sudjelovati u razmjeni informacije Kakav je to stroj? Zašto bi trebao komunicirati? Zašto bi trebao razumijevati ono što mu je preneseno? Možda zato što je jednostavno programiran za nešto takvo. Agent koji razgovara s bazom podataka naprosto 1. Prepoznaje i interpretira ulazno pitanje u logički oblik koji predstavlja upit za bazu podataka 2. Izvodi upit u bazi podataka i generira izlaz zasnovan na dobivenom odgovoru Ovo nije inteligentan agent, a ne može prepoznati ništa osim onoga što stoji u bazi podataka. Nema nezavisnosti u njeovom ponašanju, što bi dovelo do primisli da je agent inteligentan. Nešto više inteligencije dobili bismo predstavljanjem na način koji više odražava stvari koje motiviraju ljudsko ponašanje.
  • 147. Društveni agent Društveni agent (Castelfranchi) ne živi sam u svijetu njegove se osobine tvore na socijalnoj interakciji, koja nije reducirana na komunikaciju već je komunikacija zbog potrebe društvenosti, djeluju u zajedničkom svijetu, sučeljavaju se, utječu međusobno i ovise jedan o drugome. Ta je akcija zasnovana na ispoljavanju moći, uni(bi)lateralnom pokušaju utjecaja na drugog tako da mu mijenja pamćenje, memoriju i nakanu. Društvena akcija nije nužno i kooperativna akcija. Agenti i njihove akcije vođeni su ciljnom funkcijom. Često ponašanja agenta nisu praćena nekom internom (mentalnom) predstavom učina tog istog ponašanja. Cilj je interna predstava stanja svijeta koji je kandidat za: upravljačku i vodeću akciju s pomoću ponavljanja ispitivanja učina akcije ili suprotne predstavljanju, određivanje akcije pretraživanja i izabiranja, te kvalifikacije uspjeha ili neuspjeha. Cilj razlikuje društvenu od nedruštvene akcije. Akcija je moguća I na podspoznajnoj razini npr u umjetnim samoorganiziranim strukturama,ANN. Ovdje se razmatraju samo ciljno usmjerene akcije interno zasnovane na spoznajno vođenim agentima čije se akcije interno reguliraju ciljevima zasnovanim na uvjerenjima.
  • 148. Međudjelovanje agenata i ciljeva Prilagodba Uvođenje Negativno djelovanje Modifikacija plana u cilju izbjegavanja prepreke Navođenje drugog da napusti svoj prijeteći cilj Pozitivno djelovanje Prilagodba plana ubacivanjem iskorištenja akcije drugog Navođenje drugog da slijedi cilj koji je nama nužan
  • 149. Stupnjevi interakcije društvenih agenata Prvi stupanj: smetnja i ovisnost (vidjeti tablicu ranije datu) Drugi stupanj: slaba društvena akcija - uvjerenje u mišljenje drugog - tj traži se mogućnost predstavljanje mišljenja drugog agenta. Kooerdinacija je tada moguća na reaktivni način tj da se uoči porble ili na proaktivni način tj da se anticipiraju mogući ishodi akcije drugog Treći stupanj: delegiranje akcije drugog, gdje prvi agent treba ili želi akciju drugog agenta i uključuje je u svoj plan. Prvi agent ima povjerenje u drugog. Četvrti stupanj: jaka društena akcija - stvaranje ciljeva o akcijama i ciljevima drugog agenta. Peti stupanj: društveno prekrajanje cilja - agent dolazi do stupnja prihvaćanja novog cilja ili razloga za prihvaćanje ciljeva drugog agenta, dakle društveni agent je sposoban prihvatiti ciljeve izvana od drugih agenata drugih frupa poput zahtjeva, potreba, naredbi, normi. Razine kolaboracije: x prihvaća točno ono što mu je delegirao y, x prelazi tu razinu, no cilj y-a se ne mijenja, x zadovoljava rezultete traženog plana/akcije ali ih pritom mijenja (kritično!), x shvaća da je pretjerao i mijenja akciju ...
  • 150. Struktura komunikacije agenata Osnovna struktura komunikacije int. agenata sastoji se u potrebi definiranja dosega konteksta. Razgovor agenata možemo promatrati kao linearni segment sve dok se na počne pozivati na kontekst iskazan jednom ranije. U tom smislu možemo razlikovati događajni i komunikacijski od informatičkog dijela razgovora. Intuitivno je jasno kada se neki dio razgovora može izdvojiti. No ne postoji konsenzus o tome što je to segment razgovora. Osnovno je uvidjeti da: postoji tehnika analize rečenica unutar segmenta i postoji suodnos segmenata razgovora. Iz praktičnih razloga segment razgovora se sastoji od iskaza koji očitavaju lokalnu neproturječnost. Segement bi trebao imati sljedeća svojstva: – upotrebljivost neke tehnike za vremensko referiranje za postupak s kratkim izrazima (elipse) – čvrsto vrijeme i mjesto obilježava iskaze ili je napredovanje vremena i mjesta jednostavno – čvrsto određeni skup govornika i slušatelja sudjeluje u razgovoru – čvrsti skup pozadinskih pretpostavki je relevantan
  • 151. Opis događaja, informatički odnos, komunikacijski cilj Analizira se linearni niz događaja koji čini segment -u segmentu ne smije doći do promjene situacije - npr promjene broja konverzanata, skok u vremenu. Strukture segmenata mogu biti linearne, uklopljene. Ključne riječi odrđuju promjenu strukture događaja. Konverzanti se određuju svojim informatičkim (semantičkim) i komunikacijskim (volja, moć, apobetika, pragmatika) vidom. Informatički odnos uključuje pretpostavke o ponašanju okoliša. Komunikacijski cilj se u osnovici sastoji od prepoznavanja cilja sugovornika.
  • 152. Što je nužno za izgradnju konverzacijskog agenta Ljudi djeluju zato što imaju ciljeve, zbog svjesnosti situacije u kojoj se nalaze, a imaju pozitivne i negativne osjećaje prema datoj situaciji. Recimo da želite prijeći prometnu cestu na neoznačenom prijelazu. Tada morate: – – – – – – – promotriti cestu - opažaj imati predstavu o tome što se događa - uvjerenje moći stvoriti pozitivne / negativne osjećaje prema datoj situaciji želja / potreba biti u stanju izvoditi zaključke - planiranje / zaključivanje biti u stanju stvaranje odluke djelovanja - odlučnost biti u stanju održati namjeraveni tijek akcije - nakana moći djelovati i time promijeniti stanje - djelovanje Dakle, morate posjedovati četiri procesne (opažaj, planiranje, odlučnost i djelovanje) te tri spoznajne ( uvjerenje, želje i nakane) osobine.
  • 153. Što je nužno za izgradnju konverzacijskog agenta/2 Dijagram: uvjerenje - želje - nakane Planiranje Opažaj Uvjerenja Odlučnost Želje Nakane Djelovanj e
  • 154. Razgovor Razgovor kao linearni niz iskaza Pojam segmenta razgovora i ključnih fraza koji ukazuju na strukturu segmentacije Utjecaj strukture segmenta na interpretaciju pojedinih izraza posebno pridjeva Utjecaj međudjelovanja segmenta i zaključivanja za razumijevanje sadržaja razgovora Utjecaj vremenski ovisnih pojava i uzročno - posljedičnih pojava na segmentiranje razgovora Konačni model razumijevanja razgovora Primjer
  • 155. Komunikacija kao djelovanje među agentima Govor (slika, riječ, simbol, signal) nužno uključuje više agenata. Cilj govora je djelovanje jedne osobe na spoznajno stanje druge. Situacije: – Agent A signalizira znak X - Agent B to prepozna i koristi – Agent A signalizira znak X - ali iz drugog razloga - B prepozna i griješi – Agent A signalizira znak X - Agent B misli da je to neki drugi razlog i ne reagira – Dakle komunikacija se događa kada jedan agent namjerava komunicirati a drugi prepozna tu njegovu nakanu. Druga strana komunikacije je dogovoreni skup konvencija s unaprijed dogovorenim značenjem. – Postoji dakle važna razlika između fizičkog čina i komunikacijskog čina. – Austin je (1962) ustvrdio da postoje: čin lokucije (recimo: izgovaranje riječi) čin ilokucije ( čin izričaja značenja) čin perlokucije (stvarni učin, rezultat izgovorenog)
  • 156. Predstavljanje spoznajnih stanja Podaci su ono što postoji u bazama podataka. Ako međutim skupljamo znanje onda možemo oblikovati bazu znanja. Znanje se predstavlja u obliku općepoznatog znanja i znanja svojstvenog nekoj datoj situaciji. Opće znanje služi za razlučivanje značenja u dvosmislenim iskazima i situacijama. Specifično znanje služi za opis date situacije te za razlučivanje značenja riječi, signala u konkretnoj situaciji. Sustav za predstavljanje znanja sastoji se od baze znanja i pravila zaključivanja. Pravila zaključivanja izvode iz baze znanja nove iskaze, zaključke. Mnogi zaključci su sadržani u bazi znanja, ili se izvode iz baze znanja, tzv implikacijama. Tehnike zaključivanja su deduktivne ili nededuktivne. Deduktivno zaključivanje je logički opravdano. Nededuktivno zaključivanje može biti: učenje općeg iz posebnog (induktivno zaključivanje) ili zaključivanje na odziv iz pobude (abduktivno zaključivanje).
  • 157. Tehnika zaključivanja Zaključivanje tipa A ⊃B (glasi: ako A onda B) je deduktivno. Abduktivno je zaključivanje na A ako znamo da postoji B. Težinsko zaključivanje dozvoljava iznimke. Označava se s A ⇒B i glasi: ako vrijedi A⇒B a ¬B ne možemo dokazati tada zaključujemo da je B istinito. Tako rečenicu “Ptice lete” možemo predstaviti kao ∀ x PTICA(x)⇒LETI(x) (63). Ovakvo zaključivanje naziva se nemonotono. Postoji nemonotono zaključivanje drugog tipa zasnovanog na zamisli zatvorenog svijeta. Tada se za sve što ne možemo dokazati da je ispravno uzima da je neispravno (jezik Prolog). Za zaključivanje se rabi predikatska logika prvog reda (s proširenjima), tzv modalna logika, tako da se sheme predstavljanja znanja poput semantičke mreže ili okvira mogu relativno jednostavno obraditi.
  • 158. Predstavljanje znanja Obradimo djelovanje tipa “KUPNJA” sljedećim okvirom: Klasa akcije: KUPNJA(k) Uloge: Kupac, Prodavač, Predmet, Novac Ograničenja: Čovjek(Kupac), AgentProdaje(Prodavač), JestPredmet(Predmet) Vrijednost(Novac), Cijena(Predmet) Preduvjeti: POSJEDUJE(Kupac, Novac), POSJEDUJE(Prodavač, Predmet) Učini: ¬POSJEDUJE(Kupac,Novac),¬POSJEDUJE(Prodavač,Predmet) POSJEDUJE(Kupac,Predmet), POSJEDUJE(Prodavač,Novac) Opis: DAJE(Kupac,Prodavač,Novac), DAJE(Prodavač, Kupac, Predmet)
  • 159. Koherentno znanje Znanje o djelovanju uzročnosti i svakodnevnosti bitno je za razumijevanje informacijskog konteksta i jednoznačno djelovanje. Ovo je znanja osnovica za stvaranje očekivanja i usporedbe mogućih interpretacija ulazne pobude. Značajna je tu kontrola generiranja očekivanja. Koriste se postupci poput: referentnih znanja, očekivanja, razumijevanja stereotipičnih situacija, hijerarhijskih planova i zaključivanje tipa pobude-učina. Inteligentan agent ponaša se u krugovima postupaka: – 1. Promatra tekuću situaciju, uključivo i nadzor nad uspjehom neposredno poduzete akcije – 2. Odabire cilj, skup ciljeva, na koje se usredotočuje – 3. Započinje razvijati plan kako postići te ciljeve – 4. Izvodi akcije u planu kada ih smatra primjerenim
  • 160. Prostori uvjerenja Razmjena informacije je ograničena ako agent posjeduje samo jednu bazu znanja - svoju! Tada ne može npr predstaviti informaciju o uvjerenju drugog agenta. Nadalje, nema nikakve svijesti o sebi jer ne može razlikovati između onog što on vjeruje i onog što vidi u svijetu oko sebe. Dakle, nema osnovice ni za uporabu opažaja. Najjednostavnije rješenje jest podjela baze znanja na dva područja uvjerenja. Takav prostor je naprosto skup iskaza i sam po sebi je baza znanja. Svaka se može koristiti za predstavljanje nekog agentovog uvjerenja. Za razgovor dviju strana tada trebamo dva prostora: jedan za predstavljanje znanja jednog a drugi za predstavljanje znanja drugog agenta Ovo nije realističan model znanja jednog agenta, jer mu daje izravan uvid u znanje drugog agenta. Bolje je sve postaviti relativno na stranu agenta čije ponašanje modeliramo. Uvodimo predikat: UVJ(erenje).
  • 161. Predstavljanje agentovog uvjerenja UVJ(Ivo1,Pas(Fido1)) UVJ(Ivo1, ∀x:Pas(x), Laje(x)) UVJ(Ivo1,UVJ(Ana1, Pas(Fido1)) UVJ(Ivo1,UVJ(Ana1,∀x: Pas (x). Laje(x))) UVJ(Ivo1, UVJ(Ana1, ∀x: Pas(x), Laje(x) ⊃ Oštar(x)) Iskazi u modalnoj logici Prostor 1: Ivino uvjerenje Pas(Fido1) ∀x: Pas(x), Laje(x) UVJ(Ana, Prostor 2) Prostor 2: Ivino uvjerenje o Aninom uvjerenju Pas(Fido1) ∀x: Pas(x), Laje(x) ∀x: Pas(x), Laje(x) ⊃ Oštar(x) Iskazi u prostorima uvjerenja
  • 162. Predstavljanje spoznajnih stanja: želja, nakana i planova Želje i nakane se razlikuju po stupnju unutrašnje konfliktnosti. Želje su konfliktne i traže kompromise. Nakane su povezane s ponašanjem: može se namjeravati izvršiti samo jedna akcija u jednom vremenu. Nakane koje imaju usmjerenje k budućnosti odražavaju odluke o akcijama. Racionalni agent u budućim akcijama: – Ograničenje 1: Ne može namjeravati izvesti dvije akcije koje su međusobno isključive – Ograničenje 2: Ne može namjeravati izvesti akciju za koju je uvjeren da je ne može izvesti Ovo je teško izraziti logički, pa se pribjegava procesu planiranja koji garantira proceduralnu ispravnost agentovog ponašanja te tako ne dolazi u položaj preuzimanja nakana koje ne može ostvariti.
  • 163. Mehanizam nalaženja informacije iz provokacije Slučajnosti: – - Ključna provokacija (slučajni upad) – - Smetnja provokacije (nedostatak ure, poziv, … čudna situacija ) – - Smetnja ključne provokacije (rad na nečem drugom…) Osoba kojoj se poručuje Osoba koja poručuje Scenarij - pomoćni igrači Prethodna poruka(tjedan ranije,obično ne reagiramo) Pozadinski radnici - koji aranžiraju informaciju Pažnja prema osobi koja poručuje
  • 164. Literatura 1. Jaspers K.Was ist Philosophie, Piper Muenchen Zuerich 1997. 2. de Sausure, F. Opšta lingvistika, Naučna knjiga, Beograd 1977. 3. deBono E., Five days course in thinking, Bantam Books, NY 1975. 4. Sinković / Matković: Teorija informacije, Školska knjiga, Zagreb 1980 5. Željko Pauše: Uvod u teoriju informacije, Školska knjiga, Zagreb, 1989. II izdanje 6. James Allen: Natural Language Understanding, The Benjamin / Cummings Publ. Comp. Inc., Redwood City, 1995. 7. A.M. Rosie: Information and Communication Theory, Blackie & Son Ltd, London, 1966. 8. A.P. Železnikar: On the Way to Information, Ljubljana 1990, izdanje autora. 9. J.L. Pollock: Goal Regression Planning in Autonomous Agents, Artificial Intelligence 106 (1998) 267-334. 10. De Castro E.: Fondamenti di comunicazioni elettriche, Zanichelli, Bologna, 1967. 11. Hamming: Coding and information theory

×