Baze znanja
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,038
On Slideshare
1,038
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
8
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. SVEUČILIŠTE U ZAGREBU FAKULTET ORGANIZACIJE I INFORMATIKE VARAŽDINLuka Rajčević Baze znanja SEMINARSKI RAD Varaždin, 2011.
  • 2. SVEUČILIŠTE U ZAGREBU FAKULTET ORGANIZACIJE I INFORMATIKE VARAŽDINLuka RajčevićRedoviti studentBroj indeksa: 38117/09-R.Smjer: Informacijski sustaviPreddiplomski studij BAZE ZNANJA SEMINARSKI RAD Mentor: Dr. sc. Kornelije Rabuzin Varaždin, studeni 2011.
  • 3. Sadržaj1. UVOD ..................................................................................................................................................................12. O BAZAMA ZNANJA ........................................................................................................................................2 2.1 ŠTO SU BAZE ZNANJA? .....................................................................................................................................2 2.2 KORISTI PRIMJENJIVANJA BAZE ZNANJA ...........................................................................................................23. STVARANJE BAZE ZNANJA ..........................................................................................................................3 3.1 VRSTE BAZA ZNANJA .......................................................................................................................................3 3.2 DIZAJNIRANJE I SPECIFICIRANJE BAZA ZNANJA .................................................................................................44. ALATI ZA KREIRANJE BAZA ZNANJA...................................................................................................7 4.1 KBPUBLISHER .................................................................................................................................................7 4.2 INSTANTKB.NET ............................................................................................................................................8 4.3 WINDOWS SHAREPOINT: KNOWLEDGE BASE ...................................................................................................95. PRIMJERI BAZA ZNANJA ........................................................................................................................ 10 5.1 MICROSOFTOVA BAZA ZNANJA ...................................................................................................................... 10 5.2 ANTEPEDIA................................................................................................................................................... 126. ZAKLJUČAK ................................................................................................................................................... 14LITERATURA ...................................................................................................................................................... 15 I
  • 4. 1. UvodJednostavna definicija baze znanja bi bila slijedeća: „Baza znanja je, u općenitom smislu,centralizirano skladište (repozitorij) za informacije.“ Primjećujemo da se u definiciji spominju„informacije“ a ne „podaci“. Iz ove definicije se da zaključiti da se u bazama znanja nalaze samostvari za koje se smatra da su nam bitne.„Informacija je sadržaj koji za primatelja ima karakter novosti i potiče ga na određenuaktivnost.“[Čerić, V., Poslovno računarstvo. Znak, Zagreb, 1998.]U ovom seminarskom radu ću objasniti što su to baze znanja, kako one nastaju, što se nalazi unjima te na koji način se koriste informacije koje su u njima pohranjene. 1
  • 5. 2. O bazama znanja2.1 Što su baze znanja?Iako je u uvodu već navedena definicija, u nastavku ću pokušati pobliže objasniti sam pojambaze znanja. Dakle, baza znanja (Knowledge Base – KD) je kolekcija činjenica i pravila kojasluži rješavanju problema. To je kolekcija (skladište) informacija koja služi za potporu pridonošenju raznih odluka bitnih za poslovanje, na način da nam nudi informacije koje su nampotrebne, i to na zahtjev. Uloga baza znanja je omogućavanje lakše potrage za znanjem.Omogućava svojim korisnicima da lakše dođu do potrebnih informacija, jer se sve informacijenalaze na jednom mjestu, bazi.Baza znanja sama po sebi nije statična baza. Ona se, kao i baze podataka, nadopunjuje noviminformacijama. Dakle, zaključuje se da su baze znanja statički elementi koji moraju mijenjati,brisati i stvarati novo „znanje“ s vremenom. Na neki način baze znanja utjelovljuju umjetnuinteligenciju. Unošenjem novih informacija u bazu, baza sama zaključuje što su te informacije,gdje ih mora staviti i kako se treba odnositi prema tim novim podacima. Određuje da li jepotrebno modificirati neke stare informacije s novima, da li je potrebno brisanje ili samoažuriranje starijih informacija.Baze znanja se najčešće integriraju uz neku kompanije, tj. kompanije imaju svoju bazu znanjanadohvat ruke, i ta baza im omogućava brz i lak pristup informacijama u svakom trenutku. Uzpomoć baza znanja se mogu stvoriti sustavi temeljeni na znanju, tj. Knowledge based systems.To su sustavi koji rade sa informacijama iz baze znanja. O njima će biti riječi nešto kasnije.2.2 Koristi primjenjivanja baze znanjaU moderno doba, u doba interneta i razvoja komunikacije, informacije se šire velikom brzinompreko cijelog svijeta. One su dostupne svima i svatko je slobodan da ih iskoristi na najboljimogući način. Mogućnosti korištenja informacija koje su nam dostupne su velike. Baze znanjasu jedna od tih mogućnosti. Baze znanja spremaju informacije, manipuliraju s njima prikazujunam ih u razumljivom formatu. Upravljaju tim znanjem i „serviraju“ ga u vrlo kratkom vremenute na taj način stvaraju dodatnu vrijednost za osobe ili kompanije koje koriste takve sustave.Ugrađivanje baza znanja u poslovanje ima mnogo koristi od kojih su neke navedene ranije, alitakođer, u današnjem vremenu, vremenu velikog i brzog napretka tehnologije, gotovo jenezamislivo da neka veća kompanija ne posjeduje svoju bazu znanja. 2
  • 6. 3. Stvaranje baze znanja3.1 Vrste baza znanjaBaze znanja su u suštini zatvoreni ili otvoreni repozitoriji (skladišta) podataka. Mogu sepodijeliti na dvije vrste. To su: 1. Strojno čitljive baze znanja (Machine readable knowledge bases) 2. Baze znanja čitljive ljudima ( Human readable knowledge bases) - Strojno čitljive baze znanja spremaju informacije u obliku koji je čitljiv i prepoznatljiv računalima. Razlog zbog kojeg se stvaraju takve baze znanja je radi postizanja automatiziranog deduktivnog zaključivanja i donošenja odluka. Takve baze znanja sadrže skupove podataka koje se često nalaze u obliku pravila koja opisuju određeno znanje na logički dosljedan način. U takvim bazama se uglavnom u mnogome koriste osnovni logički operatori disjunkcija (ili), konjunkcija (i), implikacija i negacija. Uz pomoć osnovnih logičkih operatora, od malog skupa podataka (informacija) se može doći do znanja činom logičkog zaključivanja. Neke od strojno čitljivih baza podataka se koriste s umjetnom inteligencijom, npr. kao dio ekspertnog sustava koji je fokusiran na neko područje primjene. Ovakve base znanja se također koriste i za semantički web („Semantički web je vizija, ideja, da se informacije na Web-u definiraju i povezuju na način da mogu biti korištene, sa strane strojeva, ne samo za prikazivanje, već i za automatizaciju, integraciju te ponovnu upotrebu informacija duž kojekakvih aplikacija.“ Luka Gospodnetić, Semantički web). - Baze znanja čitljive ljudima su dizajnirane tako da znanje koje posjeduju može biti interpretirano od strane čovjeka (zaposlenika, radnika, upravitelja). Korisnici takvih baza mogu pronaći znanje koje se nalazi u bazi i iskoristiti ga za svoje potrebe. Ovakve baze su najčešće implementirane kao Help Desk preko kojeg se informacije dijele zaposlenima u organizaciji. U ovakvim bazama se mogu nalaziti informacije za riješavanje problema, informacije o riješenim problemima, članci, upute ili odgovori na često postavljena pitanja (faqs). Način na koji korisnici dolaze do informacija je uglavnom implementiran tražilicom koja pretražuje bazu znanja na temelju upita koji joj je postavljen, i ukoliko pronađe odgovarajuće znanje, dostavi ga korisniku koji je to znanje zatražio. 3
  • 7. 3.2 Dizajniranje i specificiranje baza znanjaPrva faza u dizajniranju baze znanja je prikupljanje općenitog znanja (general knowledgeaquisition). U toj fazi se prate određene smjernice za prikupljanje znanja. Te smjernice se mogupreuzeti od eksperata koji su osmislili načine za prikupljanje podataka kao što su npr. Boose iliGaines koji su u svome radu „Knowledge aquisition for knowledge based systems“ opisali načinna koji se prikuplja znanje.Cilj ove faze je da se prikupi znanje koje će omogućiti sustavu da obavlja svoj zadatak. Način nakoji se prikupljaju podaci uvelike ovisi o tipu baze znanja koji se dizajnira, tj. za koje područje sedizajnira baza znanja. Pokušati ću objasniti koncept dizajniranja baze znanja kroz primjer kojisam pronašao. Baza znanja koju želimo dizajnirati odnosi se na osobe zadužene za pisanjetehničke dokumentacije. Prva faza (prikupljanje znanja) se odvijala u 2 dijela. Prvi dio sesastojao od detaljnog istraživanja područja kao i analize tehničkih dokumenata. U drugom dijelu,znanje se prikupljalo od samih pisaca tehničke dokumentacije. Vršeni su intervjui osoba kroz 12mjeseci i to prema već uhodanim metodama preuzetima iz različitih objavljenih radova. Nakonobavljenih istraživanja i intervjuiranja osoba, potrebno je klasificirati znanje prema određenimkategorijama. U primjeru koji opisujem te kategorije su: 1. Znanje o domeni (području) koje razmatramo 2. Znanje o tekstualnim objektima te domene (područja) i njihovoj strukturi 3. Znanje o različitim zadacima koji su uključeni u sam proces proizvodnje dokumenata, kao i različite procedure prikupljanja znanja nužne za obavljanje ovakve vrste posla 4. Znanje o jezičnim izvedbama (lingvistici) pojedinih jezikaKada gledamo sam termin prikupljanje znanja, trebamo razlučiti dva tipa prikupljanja. Prvi je tajkoji pravi prvu instancu repozitorija znanja (baze znanja) i njega obavlja inžinjer znanja(knowledge engineer). Drugi dio se odnosi na prikupljanje znanja potrebno za neki određenizadatak (problem) koji se javlja u budućnosti i koji obavlja sam korisnik.Iz ovog primjera možemo izvesti određene zaključke: 1. Izgradnja baze znanja započinje prikupljanjem podataka. 2. Podaci se mogu prikupljati na više načina (samostalnim istraživanjem i upoznavanjem procesa i/ili razgovorom sa ekspertima u području koji već posjeduju određeno znanje koje bi moglo biti dobar temelj za bazu znanja). 4
  • 8. 3. Nakon što se podaci prikupe, potrebno ih je klasificirati po određenim kriterijima. Kriteriji ovise o području za koje se baza znanja gradi i mogu varirati ovisno o istom.Druga faza u dizajniranju baze znanja je organizacija znanja. Iako se na prvi pogled čini da smoorganizaciju znanja obavili klasifikacijom znanja u prvoj fazi, to nije točno. Ova faza uključujeprocese kao što su analiza i sinteza znanja.Ono što nastaje ovom fazom je hijerarhijski koncept koji odgovara modelu dokumanta i koji semože formalizirati u skladu s DPL-om (document planning language).Iz druge faze također možemo otkriti ponešto općenitih zakonitosti koje bi se trebale poštivati pridizajniranju neke druge baze znanja. Prije svega tu se analiza i sinteza znanja. Dakle, znanje kojese prikupi analizira se i sintetizira kako bi se stvorila kompaktna cjelina, kompaktno znanje.Nakon toga se prilazi izgradnji apstraktne strukture, tj. same baze. Izgradnjom baze koja sesastoji od kompaktnog znanja dobivenog analiziranjem prikupljenog znanja završava se čindizajniranja baze. Novonastala baza bi trebala biti sposobna pomoći korisnicima u rješavanjuodređenih problema ili poteškoća na koje nailaze u svojem radu.U prethodnom poglavlju je opisan način na koji se dizajnira baza znanja. Sam čin dizajniranja jeopisan kroz primjer dizajniranja baze znanja za pisce tehničke dokumentacije. Sam izvor izkojeg je preuzet način dizajniranja je prilično detaljan i pun tehničkih izraza koje je teško shvatitiukoliko se dovoljno ne razumijemo u samo područje.U svojem istraživanju o kreiranju i dizajniranju baza znanja došao sam do jednog drugog člankakoji bi na jednostavan i intuitivan način mogao opisati kako se kreiraju baze znanja danas, umodernom svijetu.„Kako izgraditi bazu znanja“ [A. E. Hurt ]Mnoge organizacije koriste baze znanja. Baza znanja može biti nešto jednostavno poputkreiranja FAQ stranice ili nešto opširno kao sustav koji se sastoji od mnogo informacija i koristitehnike umjetne inteligencije. Kreiranje baze znanja bi se moglo provesti kroz 5 koraka: 1. Skupljanje, kreiranje ili kopiranje onformacija potrebnih za bazu znanja. U nekim slučajevima su informacije koje trebamo već kreirane i potrebno je samo razaznati bitne i skupiti ih. Ukoliko je potrebno stvoriti članke za bazu, treba imati na umu da oni moraju biti opširni. Članak o nekoj temi bi trebao biti što opširniji i ne bi trebao biti zbunjujuć. 2. Organizacija prikupljenih informacija. Ona se može obaviti na više različitih načina, kao na primjer pomoću ključne riječi, prema temi ili datumu kreiranja. Naravno organizacija 5
  • 9. podataka ovisi o samoj bazi, o području kojim se bavi i o predispozicijama organizacije koja ju posjeduje.3. Razviti predložak kako bi omogućili i drugima da kreiraju članke koji će se dodavati u bazu znanja.4. Stvoriti način za pristup informacijama. Najčešće se danas baze znanja nalaze na internetu, međutim, to nije jedini način pristupa podataka. Ukoliko je znanje rasprostranjeno samo među nekolicinom ljudi, moguće je pretvoriti ga u knjigu kako pristup znanju ne bi ovisio o računalu. Također je bitno u obzir uzeti i privatnost baze ako se odlučujemo bazu staviti online, pogotovo ako ona posjeduje neka vrlo bitna znanja koja ne bi smjela biti dostupna svima.5. Stvoriti način ažuriranja ili ponovnog kreiranja informacija. Ovo je potrebno zato što se potrebe organizacije mijenjaju s vremenom. Na tržištu se pojavljuje novi softver ili se određene procedure mijenjaju. Dolazi do razvoja tehnologije i promjene znanja, te je iz tog razloga potrebno modificirati znanje koje se nalazi u bazi. Baza znanja u kojoj je znanje zastarjelo i nije bitno za današnji način rješavanja stvari nema svrhe i ne služi ničemu. Iz tog razloga potrebno je ažuriranje. 6
  • 10. 4. Alati za kreiranje baza znanjaNa tržištu se nalazi mnogo alata za kreiranje baza znanja. Većina njih je zatvorenog koda, tj. zakorištenje se mora platiti naknada. Neki od njih su: KBPublisher, InstaKB.Net itd. Naravno, natržištu postoje i besplatni predlošci za baze znanja. Najčešće u obliku wiki ili faq sustava. Nekiod njih su: Mediawiki, Pmwiki, phpMyFAQ, FAQEngine itd. U slijedećim stranicama ću opisatineke od alata za kreiranje baza znanja.4.1 KBPublisherKBPublisher je baza znanja i sustav za upravljanje sadržajem. Sa službene stranice se možeizvući slijedeći citat:„KBPublisher can be pretty much anything you want it to be. Use it to share knowledge withothers. Articles, white papers, user manuals, business processes, FAQs, online help, APIs andany other type of information you need to manage. Share information with employees, customersand partners.“Zamisao ovog sustava je da služi za dijeljenje informacija s zaposlenicima, kupcima iliposlovnim partnerima. Sustav se integrira tako da se instalira na server i na taj način dijeli svimaspojenima na njega. Sustav nudi pregršt funkcija i nije ograničen na samo jedan predložak.Moguće je podesiti i izgled i funkcionalnosti baze prema potrebama korisnika (kompanije) kojakoristi bazu. Postoje tri načina prikazivanja baze znanja u KBPublisheru. Prvi je kao samostalnabaza znanja, zatim kao stranica sa često postavljenim pitanjima (FAQ) ili kao online pomoć.Slika 2. prikazuje sučelje alata (baze) KBPublisher koji je instaliran na server. Na slici jevidljivo grafičko sučelje sa nekim bitnim svojstvima ovog alata kao što su: pretraga dokumenataprema kategorijama, obrada rezultata, manipulacija dobivenih rezultata, manipulacijadokumenata, pretraživanje korisnika, dodavanje novih sadržaja ažuriranje već postojećihsadržaja i sl. Slika 1: KBPublisher Logo 7
  • 11. Slika 2: Screenshot KBPublishera4.2 InstantKB.NetInstantKB.Net je slijedeći u nizu alata koji pruža usluge baza znanja. Ovaj alat (baza) jedizajnirana da kompanijama bilo koje veličine pomaže u podršci korisnicima. InstaKB.Netomogućuje vrlo jednostavno stvaranje web baze znanja u kojoj se nalaze članci i čestopostavljena pitanja koja bi trebala pomoći korisnicima.InstantKB.Net ima razlike u odnosu na KBPublisher, prije svega zato što ne nudi bazu znanja zasamu kompaniju nego samo podršku za klijente. To je također jedan od oblika baza znanja.Također, ova baza se nudi samo preko interneta, tj. nije moguće imati offline verzijuInstantKB.Net baze.Za pristup vlastitoj bazi znanja, korisnik se mora ulogirati sa svojim korisničkim imenom ilozinkom koja se dobije nakon kupovine alata. Slika 3: InstantKB.Net log in 8
  • 12. Slika 4: InstantKB.Net screenshot4.3 Windows SharePoint: Knowledge BasePredložak baze znanja za Microsoft Windows Sharepoint servise.„Ova aplikacija pomaže timovima da upravljaju informacijama koje se nalaze unutar njihovihorganizacija. Predložak omogućava članovima tima da uploadaju postojeće dokumente ilikreiraju nove koristeći web alate za kreiranje.“Microsoftov alat za kreiranje baze znanja koji se integrira uz Micosoft Sharepoint. Alat jeprilično sličan KBPublisheru zato što je namjenjen zaposlenicima u nekoj kompaniji(organizaciji). Njima je omogućeno dijeljenje informacija, razgledavanje informacija, dodavanjenovih, ažuriranje postojećih i slično. 9
  • 13. 5. Primjeri baza znanja5.1 Microsoftova baza znanjaMicrosoftova baza znanja je jedna od popularnijih baza znanja na internetu. Ona sadrži znanja oproblemima vezanim za sve Microsoftove proizvode, i općenito o računalnoj tehnologiji. Načinpružanja pomoći je vrlo intuitivan i krajnje jednostavan čak i za korisnike koji slabije poznajuinformacijsku tehnologiju. Na početnoj stranici se odabere područje o kojemu želimo nešto višesaznati ili u kojemu imamo problem. Između ostalog može se odabrati pomoć vezana zawindowse, internet explorer, Microsoft office, hardware i sl. Slika 5: Microsoftova baza znanja 1Nakon odabira područja koje nam je od interesa pojavljuje se nova stranica na kojoj se nalaziogromna količina podataka vezanih uz odabrano područje. Podaci su razvrstani po kategorijamakako bi sam proces rješavanja problema bio što jednostavniji. Naravno, ponekad se teško snaći usvom tom tekstu pa je na stranicu ugrađena i tražilica koja omogućava lako i brzo pretraživanje 10
  • 14. baze. I daje rezultate u jako kratkom vremenskom roku. Baza sadrži više od 150 000 članaka.Time njena vrijednost u smislu znanja raste, ali i potreba za što boljom search opcijom također. Slika 6: Početna stranica podrške za XBox 360 Slika 7:Napredno pretraživanje baze 11
  • 15. 5.2 AntepediaOsim Microsoftove baze, na internetu se nalazi mnoštvo drugih baza znanja za razna područja.Antepedia je jedna od većih baza znanja koja se može pronaći. Antepedia je jedna od najvećihbaza znanja za open source komponente. U bazi se nalazi 537 milijuna datoteka i više od milijunprojekata. Sadržaj ove baze se stalno nadopunjuje novim projektima. Novi projekti dolaze sastranica koje inače sadrže kod open source programa (code.google.com, sourceForge, Apache,Debian, Maven Central). Pristup bazi je besplatan svima. Tvrtka koja stoji iza ove baze jeAntelink, i ona je pružila mogućnost pretraživanja baze pomoću tražilice. Veličina podataka ubazi znanja premašuje 18TB, i baza svakodnevno raste. U mehanizme baze je uključenoautomatsko osvježavanje, i provjeravanje izvora znanja u potrazi za novim datotekama iprojektima, što znači da se novi podaci dodaju konstantno, svaki dan. Slika 8:Statistički podaci Antepedie 12
  • 16. Način na koji se baza znanja pretražuje je drukčiji od klasičnog pretraživanja. Upoznati smo spretraživanjem u kojem mi upisujemo ključne riječi i baza nam vraća rezultate u odnosu na našupit. Kod antepedie je stvar malo drukčija. Od korisnika se očekuje da posjeduje neku datotekuza koju bi želio saznati licencu, verziju ili projekt s kojeg je ta datoteka (u kojemu projektu jekorištena). Na slici 9. se vidi rezultat Antepedijinog pretraživanja za file TestCase.java koji jejedan od testnih fajlova za pretragu baze. Rezultati nam objašnjavaju da se TestCase.javakoristila ili pojavljivala u tri projekta i to Junit, Marathon i test. Uz svaki projekt je postavljenlink na izvornu stranicu projekta na kojoj se može dobiti više informacija i s koje se može skinutiprojekt ili dobiti više dokumentacije. Slika 9:Rezultat pretrage za TestCase.java 13
  • 17. 6. ZaključakRazvojem moderne tehnologije i informacijske infrastukture ljudi su svakim danom izloženi svevećem i većem broju informacija.Informacije su dostupne svima, no pravi problem je od tihinformacija napraviti znanje, odnosno organizirati znanje tako da bude lako dohvatljivo, dobroorganizirano i kategorizirano i da postoje potrebni mehanizmi upravljanja znanjem.Način na koji se danas upravlja znanjem je uz pomoć baza znanja. One služe za čuvanje znanja i zabrzu isporuku znanja onome tko ga zatraži. Upotreba baza znanja se pokazuje kao dobar potez,pogotovo zato što se smanjuju potencijalni troškovi obrazovanja zaposlenika. Pomoću baze znanjaoni već imaju na dohvat ruke to znanje i nije potrebno stvarati dodatne troškove.Većim napretkom civilizacije, povećava se količina podataka, informacija a samim time i znanja štoznači da će i u budućnosti biti potrebne baze znanja i to čak u većem opsegu nego danas jer ćekoličina informacija koja se treba pohraniti biti mnogostruko veća. U svakom slučaju, područje bazaznanja je vrijedno područje koje treba istraživati i proširivati mogućnosti. 14
  • 18. Literatura1. Čerić, V. , Poslovno računarstvo. Znak, Zagreb, 1998.2. http://www.zpr.fer.hr/zpr/LinkClick.aspx?fileticket=Ycxu9at- fas%3D&tabid=89&mid=554&language=en-GB Baze znanja, rad dostupan 08.11.2011.3. Baza znanja, Računalna podrška udaljenom učenju. M. Šaravanja, dostupno na http://www.ucionica.info/files/Prezentacija_BazaZnanja.pdf 08.11.2011.4. Knowledge base, članak dostupan na http://searchcrm.techtarget.com/definition/knowledge-base5. Designing and specifying knowledge base, dostupno na http://www.issco.unige.ch/en/research/projects/ewg95/node222.html 08.11.2011.6. Antepedia the largest Knowledge Base of Open Source components, dostupno 08.11.2011. na http://www.antelink.com/blog/antepedia-largest-knowledge-base-open-source- components.html7. How to create knowledge base, članak dostupan 08.11.2011. na http://www.ehow.com/how_6801226_create-knowledge-base.html8. Podrška tvrtke Microsoft, dostupna na http://support.microsoft.com/?ln=hr9. Službena stranica alata KBPublisher dostupna na http://www.kbpublisher.com/10. Službena stranica alata InstantKB.Net dostupna na http://www.instantasp.co.uk/products/instantkb/ 15