1. A.9 tétel
A hagyományos tartalmi feltáró eszközök fejlődési tendenciái, funkciói és egymásra épülése a
korszerű információs rendszerekben. Állításait igazolja egy szabadon választott szakirodalmi
adatbázis tartalmi feltáró rendszerének bemutatásával.
Bevezető, a tartalmi feltárás célja
A tartalom fogalma:
Az információközvetítő tevékenység a tudástársadalomban értelmezett ismeretek
közvetítését jelenti.
A könyvtár számára a tudás szövegben jelenik meg.
A tartalom a szöveg jelentése.
Azt az üzenetet kell megkeresni és kifejezni, amelynek információs értéke van annak a
közösségnek a számára, amelyet az információs rendszer célközönségének, használóinak
tekintünk.
A feldolgozás célja:
- Az állomány reprezentálása, áttekinthetővé tétele formai és tárgyi szempontok
szerint,
- az információk visszakereshetővé tétele,
- valamint törekszik a kompatibilitásra, a szabványosságra.
A feltárás két egymástól jól elkülöníthető szempont szerint folyik:
- A tartalmi feltárás a dokumentum tárgyát írja le valamely természetes vagy
mesterséges nyelvű osztályozási rendszer segítségével Eredménye a tárgyi
katalógus
- A formai feltárás magát a dokumentumot írja le a rajta megjelenő adatokkal és fizikai
jellemzőkkel Eredménye a leíró katalógus
Eredménye:
- Tárgyi katalogizálás: A tudásfeldolgozás azon folyamata, melynek során a
dokumentumban tárolt tudás rekonstrukciójával és az Információ Kereső nyelv (IKNY
= közös nyelv, a könyvtár és a felhasználó között, amin a kommunikáció
megvalósulhat) jelkészletének segítségével történik a reprezentáció.
- Két típusuk van: A tárgyszókatalógus, és a szak-vagy szakrendi katalógus.
Mindegyiken belül annyi változat alakult ki, ahány tárgyszó- vagy osztályozási
rendszer létezik. Maga a tárgyszókatalógus amúgy is gyűjtő megnevezése minden
mellérendelő indexelés alapján készített katalógusnak.
Tartalmi feltárás
- a dokumentum tárgyát írja le valamilyen természetes vagy mesterséges nyelvű
osztályozási rendszer segítségével (pl. ETO)
- feladata:
- A szöveg egyedi információinak elemzése
- A tartalom meghatározása
- Tartalmi csoportok kialakítása
- Hasonló tartalmú információk együtt tartása
- Valamennyi tartalmi információ visszakereshetővé tétele
2. - Eredménye a tárgyi katalógus
A tartalmi feltárás szintjei
- Regisztrációs szint
alapvető adatok: szerző, cím, kiadó, év
- Generalizáló osztályozás
Az információk átfogó, generikus tartalmi-tematikus csoportosítása
- Egyedi információk tartalmi leírása
Kulcsszó, tárgyszó stb. – a konkrét kérdésre való válaszadást teszi lehetővé
- Annotáció
1-2 mondatnyi információ a tartalomról
- Referátum
Rövid, lényegre törő tartalmi kivonat, amely összefüggő szövegbe ágyazva
tartalmazza az eredeti szöveg lényeges megállapításait
Indikatív referátum – csak jelzi, hogy milyen témákról szól az eredeti szöveg
Informatív referátum – összefoglalja az eredeti mondanivalóját
Minőségi szempontok:
Teljesség: Tartalmazza az eredeti dokumentum minden lényeges
tartalmi elemét,
Pontosság: Pontosan tükrözze az eredeti szöveg teljes tartalmát és az
abban foglalt véleményt,
Objektivitás: Ne értékeljen,
Rövidség,
Érthetőség
Referátumkészítés:
1. Kihagyás
2. Tömörítés
3. Tisztázás
4. Szövegszervezés
5. Stílus
- Tömörítvény
Az eredetit pótló összefoglalás
- Analitikus-szintetikus feltárás
Több dokumentum tartalmi szintézise – szemle, trendtanulmány
A tartalmi feltárás folyamata:
- Fogalmazzuk meg a dokumentum tartalmát egy mondatban (esetleg 2-ben).
- Ha nem foglalható egy mondatba, több témáról van szó.
- Keressük meg az újdonságot.
- Keressük meg a cselekvést. Határozzuk meg fogalmakkal.
- Keressük meg a cselekvés tárgyát és végrehajtóját. Határozzuk meg fogalmakkal.
- Szükség van-e a téma idő- és hely-viszonyainak kifejezésére? Határozzuk meg.
- Szükség van-e a dokumentumtípus kifejezésére? Adjuk meg.
3. A tartalmi feltárás eszközei
I. Az információkereső nyelvek rendszere
Információkereső nyelv: az a nyelv, amely alkalmas az információk és az információkereső
kérdések leírására, azaz a természetes nyelven megfogalmazott kérdések szabályozott nyelvre
történő lefordítására.
Cél: a kommunikáció az információ forrása és a használója között.
IKNY-ek feladatai:
- létre kell hozni a feldolgozási egységek vagy dokumentumok tartalmi csoportját
- fel kell tárni a feldolgozási egység egyedi tartalmát
- szurrogátum együttese létrehozása, amelyekben a hasonlók kerülnek a hasonlókhoz.
- Az ismereteket tartalmi – tematikai szerkezetüket tükröző rendszerré kell szervezni
IKNY jellemzői:
- szókészlet = jelkészlet
- szemantika = jelentés
- szintaxis = nyelvtan, használati szabályok
Az információkereső nyelvek típusai – a 7 szempont:
1. szabályozottság
Természetes nyelven alapuló IKNY-ek
Az osztályozási kifejezéseket az eredeti szövegből emeljük ki, Pl. kulcsszó
Szabályozott IKNY-ek
Az osztályozási kifejezéseket nyelvi, logikai szabályozásnak vetjük alá, Pl. tárgyszó,
ETO jelzet stb.
2. logikai szerkezet
Hiererachikus IKNY-ek
Az általánostól az egyedi felé haladó logikai felosztás.
Alá-fölérendeltségi és egész-rész relációk alapján jön létre.
Mellérendelő IKNY-ek
Az osztályozó fogalmak egymástól függetlenekű
3. mélység
Generalizáló IKNY-ek
Átfogó témák, nagyobb témacsoportok leírására alkalmas osztályozási rendszerek.
Individualizáló IKNY-ek
Mély tartalmi feltárást biztosítanak.
Az osztályozás az egyedi információk mélységéig elvégezhető
4. szerkezet
Prekoordinált IKNY-ek
osztályozási rendszerekben az osztályok sorrendje, kapcsolatrendszere, az
osztályozási fogalom helye eleve meghatározott, így független a dokumentum
tartalmától.
4. Posztkoordinált IKNY-ek
osztályozási rendszerekben a lexikai egységek a dokumentum tartalmától függően
rendelhetők egymás mellé. A fogalmak sorrendje előzetesen nem szabályozott.
5. tartalom
Általános osztályozási rendszerek: felölelik az emberi tudás egészét, az ismeretek
teljes körét. Osztályozásukban a különféle szakterületek fogalmait összehangoltan
rendezik el.
Speciális (szakterületi, autonóm) osztályozási rendszerek: egy-egy tudományterület,
szűkebb szakterület, ágazat ismereteit foglalják magukba. Figyelemmel vannak az
adott szakterületen működő szakemberek, kutatók sajátos igényeire és szokásaira is.
6. automatizáltság
Nem automatikus: az osztályozás munkafolyamataiban nem használnak gépi
megoldásokat.
Félautomatikus: a lexikai egységek megállapítása intellektuális úton történik, míg a
rendezés és a szelektálás számítógéppel.
Automatikus: mind az osztályozási fogalmak meghatározását, mind
csoportosításukat géppel végzik.
7. területiség
Egyetemes: az egész világra kiterjedő
Regionális: egy-egy terület fogalmait rendszerező
Nemzeti: országhoz, nemzethez kötődő
II. Tudományfelosztáson alapuló osztályozási rendszerek
- A felosztás mögött valamilyen tudományrendszertan áll, amelynek alapja filozófiai vagy
"általánosan elfogadott" gyakorlat lehet.
- Az ismeretkörökön belül az osztályok, alosztályok stb. kialakítása logikai alapokon történik
(alá-fölé rendeltség, egész-rész viszony).
- Az osztályozó ismérveket általában kódokkal is megjelölik, ami mutatja a hierarchiában
elfoglalt helyet.
- Az osztályozás feladata, hogy elhelyezze a témát az ismeretkörök között, illetve megadja a
helyét a tudomány(ok) rendszerében
PL.: ETO
0 - Általános tartalmú művek
1 – Filozófia, pszichológia
2 - Vallás, teológia
3 - Társadalomtudományok
4 - (1964 óta betöltetlen főosztály, eredetileg Nyelvészet)
5 - Alaptudományok. Matematika. Természettudományok
6 - Alkalmazott tudományok
7 - Szépművészetek. Iparművészetek. Szórakozások, játékok, sport
8 - Nyelvészet. Irodalom
9 - Régészet. Földrajz. Életrajz. Történelem
5. III. Tartalomelemzés
- Egy olyan kutatási eljárás, amely az irodalmi szövegeket és a tömegközlés ágait különböző
tartalmi és formai elemein keresztül mennyiségi úton, az ún. statisztikai nyomozás
eszközeivel vizsgálja.
- Elsősorban a kommunikációs funkció elemzéséről van szó, azon belül is a szimbolikus
jelentések feltárásáról.
- A tartalomelemzés módszerével levont következtetések más célokat szolgálnak, mint az
információs célú tartalomelemzés
- definíciók:
A tartalomelemzés olyan kutatási technika, amelynek segítségével adatokból a
kontextusaikra vonatkozóan megismételhető és érvényes következtetéseket
vonhatunk le.
A tartalomelemzés egy kutatási módszer, amely egy sorozat művelet segítségével
érvényes következtetéseket von le a szövegből. Ezek a következtetések az üzenet
küldőjére, az üzenetre magára, illetve az üzenet befogadójára vonatkoznak.
- célja:
A szimbolikus jelentés feltárása
Az adatokat mindig többféle nézőpontból lehet szemügyre venni, különösen
akkor, ha szimbolikus jellegűek.
Minden írott közleményben meg lehet számolni a betűket, a szavakat vagy a
mondatokat.
Lehet kategorizálni a szókapcsolatokat, leírni a kifejezések logikai szerkezetét,
meghatározni az asszociációkat, a konnotációkat, a denotációkat, a szónoki
fogásokat, de szó lehet pszichiátriai, szociológiai vagy politikai
interpretációkról is.
Mindez egyszerre is érvényes lehet.
Egyvalamely közlés igen sokféle tartalmat hordozhat egy befogadó számára
is.
Ilyen körülmények között az a törekvés, amely „a” tartalmat kívánja elemezni a
kommunikációban, tudományos szempontból nem állja meg a helyét.
- célja könyvtári szempontból:
Ha elfogadjuk Krippendorff érveit, akkor sohasem „a” tartalmat fogjuk közvetíteni,
hanem mindig egy aktuális rendszerben – nevezzük ezt információs rendszernek –
tartalomnak tekinthető szövegjelentést.
Abban a pillanatban, hogy más információs rendszerbe kerül a szöveg, adott esetben
teljesen más is lehet a „tartalom” tartalma.
Ezen a gondolatmeneten tovább haladva kell tehát meggondolni az információs
rendszerek közötti adatcserének, egymás elemzései kölcsönös felhasználásának a
problematikáját.
IV. Természetes nyelven alapú osztályozási és indexelési eljárások
- Az ismérvek egyértelmű jelölése a kulcstényező - a nyelvi sokszínűségből eredő
bizonytalanságokat ki kell küszöbölni (homonímia, szinonímia stb.).
- A téma egyediségének, újdonságának felmutatására lehetőséget ad.
6. - Az ismérvek összefüggéseinek (tematikai, logikai) jelzésére a szótárban kiépített
utalórendszer szolgál.
- Az indexelés szolgálja az egyedi ismérvek leírását.
- A nyelvi alapú osztályozás során a dokumentumok információtartalmát valamely –
természetes nyelvhez hasonló – nyelv segítségével írják le.
- A nyelvi alapú osztályozási rendszer rendelkezik a nyelvre jellemző kritériumokkal:
rendelkeznek a szavaknak, kifejezéseknek, szószerkezeteknek egy halmazával (szókincs-
szókészlet), e kifejezésekhez jelentés kötődik (szemantika-jelentés), továbbá e kifejezések
használati szabályaival arra vonatkozóan, hogyan lehet ezeket összekötni (szintaxis-
nyelvtan, használati szabályok).
- A hierarchikus információkereső nyelvek és az ezekre épülő katalógusok bonyolultsága és
bizonyos előképzettséget feltételező használata, valamint a specifikusabb kifejezések
szerinti keresési igények folytán szükségszerű elvárásként alakult ki a természetes nyelv
használata információkereső nyelvként. A nyelvészeti irányzat legelső, legnagyobb
hagyományokkal rendelkező osztályozási eljárásai a tárgyszavas rendszerek.
- Előnye:
nem igényelnek előzetes felkészülést, vagyis az ilyen nyelvekre épülő katalógusokban
vagy gépi rendszerekben „mindenki tud keresni”.
- Hátránya:
a természetes nyelv eredeti állapotában nem, vagy kevéssé alkalmas
információkeresés céljaira. Ezért szükség volt bizonyos megalkuvásokra, másrészt a
természetes nyelvet bizonyos mértékig szabályozó vagy legalábbis kiegészítő
megoldásokra. Ennek eredményeként létrejövő információkereső nyelveket
mellérendelő nyelveknek, a gyakorlatban pedig tárgyszavas nyelveknek nevezik. Fő
sajátosságuk a fogalmak közti értelmi, jelentésbeli összefüggések rögzítése, valamint,
hogy ABC sorrendben lehet keresni. Negatív hatás: a nyelv sajátossága (sokszínű,
változatos nyelv).
Kulcsszó: a cím valamely szava (a névelőt kivéve). Léteznek stop vagy tiltott szavak (például
azért, hogy ne lehessen keresni az „és”-re és a „hogy”-ra).
- Kulcsszó problémái: (példák)
o angol címe van, de magyarul keresek
o nem a keresett témáról szól a könyv
o csak szám a címben
Szövegszó: a teljes szövegből (szöveg testből) származó szó. Kulcsszóból szabályozás útján lesz
tárgyszó.
Tárgyszó: szabályozott nyelvi eszköz (szabályozott információkereső nyelv). A dokumentum,
információ, szöveg lényegének leírására kiválasztott tömör és egyértelmű kifejezés.
Szabályozott: (formailag és tartalmilag)
Formai:
mindig főnév
Ragozatlan főnév
Egyes számú főnév (kivétel gyűjtőnevek)
Tartalmi:
Tárgyszójegyzékbe gyűjtjük a tárgyszavakat
Tárgyszócikként jelennek mega szavak
Tárgyszó és kapcsolataiból áll
Természetes nyelven alapuló
7. Mellérendelő
Rugalmas, bővíthető
Biztosítja a több szempontú feldolgozás és visszakeresés lehetőségét
Elvárások a tárgyszavas osztályozással szemben:
- az adott szakterület teljes egészét lefedje a tárgyszókészlet hézagmentesen, de
átfedésesen
- a jelölt (fogalom vagy valóságos dolog) és a jel (szókép, nyelvi alak) között egyértelmű
megfeleltetést kell biztosítania (a megnevezés mindenkinek ugyanazt a fogalmat takarja)
A tárgyszavas osztályozás feladatai:
- tárgyszavakkal leírja a dokumentumot, objektum lényeges vonásait
- tárgyszavak rendje határozza meg a tárolási rendszer szerkezetét
- alkalmas a keresőkérdések kifejezésére
Szószerkezetek: többletjelentést hordoz az összetétel, mint maguk az elemek.
TAUBÉ – UNITERM rendszer: egyszavas tárgyszórendszer: sok rossz összetétel, fölösleges találatok.
Szabad tárgyszavazási eljárás: nincs kötött tárgyszójegyzék, 5-6 szóban leírják a tartalmat.
Szinonimák esetében egyet kiválasztunk tárgyszónak, a többi nem tárgyszó (a többinél utalunk rá).
Egységes szempont alapján döntünk például: hivatalos, többen használják.
Kvázi szinonima: a szó nyelvtani értelmében nem szinonima csak hasonló kifejezés (pl.: jogszabály-
törvény)
Homonima: azonos alakú szavak (pl.: levél). Egy kifejezés hangalakja több jelentést hordoz.
Ilyenkor értelmezőt kell használni. (pl.: daru- élőlény, daru- emelőszerkezet)
A tárgyszavak közötti lehetséges kapcsolatok:
H- helyette
L – lásd
LM – lásd még
Példa
Tárgyszó Burgonya
H: nem tárgyszó H: krumpli
Pityóka
Nem tárgyszó Krumpli
L: tárgyszó L: burgonya
Pityóka
Specifikus tárgyszó-elv: azt a kifejezést használjuk, amely az egyedi, specifikus szintet képviseli. A
tárgyszó-rendszerekbe hivatkozásokat építenek be, hogy kielégítsék mind az egyedi, mind az
átfogóbb témában keresők igényeit. Általában lefelé hivatkoznak, a generikustól a specifikus felé
halad (a lásd még utalással, pl.: vallás LM: kereszténység).
Specifikustól a generikusig: pl.: pénz LM: fizetőeszköz, pénz LM: hitelügy, pénz LM: hamisítás). A
lásd még utalást mindig oda-vissza kell feltűntetni.
A tárgyszójegyzék szótári és szakcsoportos részekből áll. A tárgyszójegyzéknek tartalmaznia kell a
használati szabályzatot is (gyűjtőkör, felépítés, indexelés, stb.).
A tárolási szerkezetét a tárgyszavak sorrendje határozza meg. A dokumentumok a tárgyszavak
betűrendjében válnak kereshetővé. A legtöbb tárgyszórendszer igyekszik valamilyen struktúrát is
bevinni a tárolási szerkezetébe.
A tárgyszókatalógus lehet:
tiszta (mechanikus, betűrendes, klasszikus)
8. rendszerező (átfogóbb tematikus csoportokból áll)
Bokrosító: a tárgyszavak egy részét felbontja részfogalmakra, alárendelt fogalmakra és
ezeket azután ismét formai jegyek alapján betűrendbe rendezi.
Alárendelő: a tárgyszavak elrendezése, tárolása fogalmi szintek kiépítésével történik.
A 20. század 50-es éveitől jelentek meg az indexek: számítógéppel előállított tájékoztatási
eszközök, valamint az indexművek: a dokumentumok név és tárgymutatóiból fejlődtek ki.
A címindexeknél jelent meg először a tisztán természetes nyelvű osztályozás, amit kulcsszavas
osztályozásnak nevezzük. Az indexek a dokumentumok tartalmát és egyéb jellemzőit leíró
szóláncok- index tételek – rendezett gyűjteményei. Léteznek kulcsszó, ill. tárgyszó-indexek.
Kulcsszó származhat a dokumentum címéből (címindex) vagy a dokumentum szövegéből. Utóbbi
két legelterjedtebb típusa a KWIC és a KWOC.
Kulcsszóindex: a tartalomjegyzékekben szereplő cikk címekből index (a nyomtatott folyóiratok
világa) kétféle típusa:
1. KWIC = Key word in context
Minden szónál betűrendben lehet keresni.
2. KWOC = Key word out of context
Előre ki van emelve a keresett szó.
Permutált tárgyi index: a besorolás, elérés kérdését a tárgyszólánc elemeinek ciklikus
permutációjával oldják meg. Az első helyen álló tárgyszót mindig követi a tárgyszólánc többi eleme
is.
Lánceljárásos tárgyi index: a lánc elemei különböző fogalmi szinteken helyezkednek el. A
tárgyszavak rendezése a specifikustól a generikus felé haladó sorrendben. Az első helyre kerülő
elem után mindig csak az eredetileg is utána következő elemeket adjuk meg. Ma már ritkán
alkalmazzák.
PRECIS (preserved context indexing system=szövegösszefüggést megtartó indexelési rendszer). D.
Austin dolgozta ki. A PRECIS grammatikai szabályok összessége. Első lépésként megalkotják a
dokumentum lényegét leíró mondatot. Majd az egyes szavaknak a mondatban betöltött szerepét
egy speciális jelrendszer segítségével rögzítjük. Végterméke egy számítógéppel ellátott permutált
index. A permutálás során az osztályozási kifejezések sorrendje mindig megtartja a természetes
nyelvi mondat szórendjét.
V. Szöveges ismertetők, tartalmi összefoglalók (annotáció, kivonat, referátum stb.)
1) Annotáció
Rövid terjedelmű ismertetés, amely a dokumentumot jellemzi, a mű tartalmára,
szerzőjére, rendeltetésére, formájára, keletkezési körülményeire, vagy egyéb
sajátosságaira vonatkozik.
Általában a bibliográfiai adatok után következik megjegyzés formájában.
Segíti annak eldöntését, hogy az eredeti dokumentum releváns vagy sem.
Ismertető vagy ajánló jellegű lehet, tartalmazhat ítéletet is.
Nem kell megfelelnie a szövegszerűség valamennyi kritériumának.
2) Recenzió
Röviden leírja a szöveg tartalmát, de kifejezi a recenzor véleményét is.
9. Nem kritériuma az objektivitás.
Fontos eleme az értékelés.
Célja elsősorban a figyelemfelkeltés.
3) Kivonat
Az elsődleges dokumentumból vett részek szó szerinti, átalakítás nélküli kiemelése.
Csak olyan mondatokat, kifejezéseket használ, amelyek az elsődleges dokumentumban is
előfordulnak.
Előállítása viszonylag könnyen automatizálható.
Az eredeti dokumentummal megegyező nyelven kell készülnie.
4) Összefoglalás
Nem önálló műfaj
Állhat akár az eredeti szöveg végén, mintegy annak részeként, de más szövegekbe ágyazva
is.
Célja nem az, hogy az olvasónak segítsen az eredeti szöveg relevanciájának eldöntésében,
sokkal inkább az összefoglalás és a szöveg elhelyezése a kutatási eredmények
rendszerében.
5) Témadokumentáció
Egy adott témára vonatkozó dokumentumok kivonatainak gyűjteménye.
Válogat a téma irodalmából, és annak minden fontos elemét feldolgozza.
Nem csak az olvasásra, de a keresésre fordított időt is lerövidíti.
6) Szakirodalmi szemle
Önálló szerkezetben foglalja össze a témára vonatkozó valamennyi lényeges információt,
több dokumentum együttes feldolgozásával.
A legmagasabb szintű szolgáltatások egyike.
7) Referátum
A dokumentum (vagy része) tartalmának – a legfontosabb adatokra, tényekre és
következtetésekre kiterjedő – olyan rövid ismertetése, amely felhívja a figyelmet az új
ismeretekre, és lehetővé teszi annak eldöntését, hogy célszerű-e tanulmányozni a
dokumentumot.
A referátum természetes nyelvi, önállóan is megálló szöveg, amely megfelel a
szövegszerűség kritériumainak (kohézió, koherencia, szándékoltság, elfogadhatóság,
hírérték, helyzetszerűség, intertextualitás)
A referátum írott szöveg, amely különféle hordozókon jelenhet meg.
A referátum másodlagos dokumentum.
A referátum információs célokra létrehozott szöveg.
VI. Tezaurusz
- A szemantikai információkereső nyelvek lexikai egységeit („tárgyszavait”), vagyis a
valamely fogalom leírására, képviseletére kiválasztott szavakat vagy kifejezéseket
deszkriptoroknak, szótáraikat pedig tezauruszoknak nevezzük.
- Az információs tezaurusz, mélyebb feltárást tesz lehetővé. Mely egy-egy szakterület
természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható
szótára, amely feltünteti a fogalmak közötti legfontosabb logikai kapcsolatokat.
10. - Alapvető követelmény a tezaurusszal szemben, hogy az adott szakterület valamennyi
lényeges fogalmát tartalmazza, a szakterület teljes lefedését biztosítsa, és bővíthető is
legyen.
- A tezaurusz részei:
o deszkriptor,(L): A deszkriptor az információk leírására és keresésére közvetlenül
alkalmazható. A deszkriptor általában egyes számú főnév, kivéve gyűjtőnevek,
illetve többes számú főnév, ha az jelentésében eltér az egyes számú alaktól. A
deszkriptor lehet önmagában álló szó, összetett szó, több szóból álló
kifejezés.(Kerüljük az invertálást!)
o
o nemdeszkriptor,(H): A nemdeszkriptor a deszkriptor szinonim kifejezése, mely az
információk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe
vételével használható.
o reláció: A relációk kimunkálása kötelező (ebben különbözik más osztályozási
rendszerektől).
- A tezaurusz felépítése:
o Bevezetés,
o Főrész,
o Jelentéskörök szerinti rész,
o hierarchikus rész,
o grafikus rész,
o betűrendes mutatókkal kiegészülhet
A Bevezetésben feltüntetjük a tezaurusz célját és felhasználási területét. Leírjuk a készítési módját,
a mennyiségi jellemzőit és a javításának, módosításának módját.
A főrész deszkriptor- és nemdeszkriptorcikkekből áll betűrendes elrendezésben.
A deszkriptorcikk a vezérdeszkriptorból és a vele közvetlen kapcsolatban álló deszkriptorokból épül
fel, illetve feltünteti a kapcsolat jellegét is. A nemdeszkriptorcikk a nemdeszkriptorból és a helyette
álló deszkriptorból áll.
A jelentéskörök szerinti rész kidolgozása azt a célt szolgálja, hogy a tartalmilag összetartozó
deszkriptorokat egy helyre gyűjtsük össze. Egy-egy átfogó fogalom alatt betűrendben megadjuk a
jelentés szerint hozzátartozó deszkriptorokat.
A hierarchikus rész célja, hogy a relációtípusokat kiemelve, kiépítse a deszkriptorok közti teljes
hierarchiát az általános fogalomból kiindulva a specifikusig. Épülhet fogalmi hierarchiára (alá-
fölérendeltség), de létrehozható az egész-rész szerkezeti reláció alapján. (Tranzitív relációk)
A grafikus rész a tezauruszban feltárt ismeretág, szakterület legfontosabb fogalmait és azok
relációit grafikus ábrákban mutatja be. Nem kötelező
A betűrendes mutatót akkor kell alkalmazni, amikor valami kimaradt a főrészből.)
Szinonimának tekinthető az a kifejezés, amely maradéktalanul helyettesíti a másikat. Tezauruszban
szinonimaként kezeljük az idegen nyelvű kifejezést és a magyar megfelelőjét, a tudományos és
köznapi megnevezéseket, a fogalom különböző alakváltozatait, a fogalom rövid és teljes alakját,
illetve a kvázi szinonimákat (a szó nyelvtani értelmében nem szinonimák). Szinonimák jelölése: L
(lásd), H (helyettesíti) utalókkal.
Homonimák: a többjelentésű szavak jelentésbeli megkülönböztetésére értelmezőt használunk:
Pl.: TOLL (íróeszköz)
TOLL (madártoll)
11. Szócikk:
– a szabványok mögött ott áll mindig egy jegyzék (pl.: ETO mögött a táblázatok)
– a szó a hozzá kapcsolódó szavakkal jelenik megtárgyszócikk
– a szinonimák közül egyet kell kiválasztani tárgyszónak, a többi nem tárgyszó
– egységes szempontot kell találni
– attól függ, hogy milyen közönség használja
– pl.: Burgonya H: krumpli
Krumpli L: burgonya
TEZAURUSZ-RELÁCIÓK: A RELÁCIÓK MINDIG KÉTIRÁNYÚAK!!!
– ALÁ-FÖLÉRENDELTSÉG: Ha A fogalom teljes terjedelmében beletartozik B fogalomba, akkor azt
mondjuk, hogy A alárendeltje(a) (faja, speciese) B-nek. Az alárendelt fogalom tartalma
gazdagabb, több ismertetőjegyet tartalmaz, mint a fölérendeltje(b), de terjedelme kisebb.
Mindig csak a közvetlen alá- ill. fölérendeltet adjuk meg. Egy deszkriptornak lehet több alá-
és fölérendeltje különböző szempontok szerint.
– EGÉSZ-RÉSZ: Az egész-rész reláció a fogalmakban általánosított tárgyak, objektumok fizikai,
szerkezeti kapcsolata. A rész(p) nem rendelkezik azokkal a tartalmi jegyekkel, mint az
egész(T), az egész pedig mindig több mint részeinek összessége. Mindig csak a közvetlen
részt ill. egészet adjuk meg. Egy deszkriptornak lehet több része és egésze különböző
szempontok szerint.
– OK-OKOZAT, FELTÉTEL ÉS ELŐFELTÉTEL: Az ok, előfeltétel( E), ezt csak olyankor használjuk, mikor
egyértelmű a mi a következmény, okozat( R)=rezultáns
– ROKON KAPCSOLATOK (x) Gyűjtőfogalom, több különböző kapcsolattípust foglal magában.
Ezek a kapcsolatok lehetnek szimmetrikusak (ellentét, hasonlóság, korreláció, stb.), és
asszimetrikusak (rendeltetés, eszköz, produktum, tulajdonság, stb.)
Az adatbázisokról – csak segítség, nem kell szó szerint tudni
A jó adatbázis hatóköre
- Ki kell elégítenie egyéni használó, illetve egy könyvtár vagy intézmény használóinak
érdeklődését. Pl.: speciális témák: Climbing Database (hegymászók adatbázisa) és a
kiváló Biographies of Women Mathematicians (matematikusnők életrajzai)
- El kell róla dönteni, hogy általános vagy sem: Vannak problémák az általános jellegű
adatbázisokkal. Mert kiderül, hogy mégsem olyan általános mégsem található benne
minden tudomány.
- Megfelelő keresési szűrők lehetnek:
o Téma/tárgy szerinti keresés, nyelv és dokumentumtípus szerinti feltártság, feltárt
időtartományt, címindexek, kulcsszó szerinti keresés
o Egyáltalán nem mindegy, hogy egy magát informatikai adatbázisnak definiáló
tartalomszolgáltató témáiban, tárgy szavaiban és kulcsszavaiban szerepelnek
szakkifejezések vagy csak helyenként, vagy hogy a szakkifejezések elavultak e
vagy sem. Ugyancsak figyelni kell az időtartományra, valószínűleg nem lesz
kurrens azaz orvostudományi vagy informatikai adatbázis, melyben a publikációk
az 1990-es évekből származnak.
o Témák keresése esetében nem mindegy, hogy melyik nyelvterületen, melyik szót
használjuk. Az amerikai szerzők elsődlegesen a postpartum depression kifejezést
12. használják, európai és brit nemzetközösségből származó szerzők gyakran a
puerperal depression kifejezést preferálják. Ebből következően az előbbi kifejezés
használata előnyös a MEDLINE számára az EMBASE-zel szemben (amelynek
szélesebb az európai forrásbázisa), a második fogalom esetén fordított a helyzet.
Az adatbázis dimenziói
Méret:
A legnagyobb nem egyenlő a legjobbal.
Ami számunkra fontos egy példával lehet elmondani:
A legnagyobb orvosi adatbázis, amely nem dolgozza fel Kelet-Ázsia folyóiratait a megfelelő
mértékben, nem lehet a legjobb annak a számára, aki ennek a régiónak a fejlődéséről vagy klinikai
jelentéseiről keres információt.
Időbeliség:
Retrospektivitás jó lehet annak, aki humántudományokkal esetleg társadalomtudományokkal
foglalkozik, rossz egy természettudósnak, orvosnak, informatikusnak, műszaki szakembernek.
Mélység:
Pusztán az, hogy egyes folyóiratok jelen vannak az adatbázisban, nem garantálja, hogy megfelelő
mértékben fel is tárják azokat.
Problémák: elkezdik a feltárását a folyóiratnak, de nem fejezik be. A folyóirat közben nevet vált, de
az adatbázis készítői nem jelölik az eredeti nevével történő utolsó kiadását. Hozzájutási
nehézségekre való hivatkozás: drága a folyóirat, túl messziről érkezik, késve kapják meg.
Frissesség:
Az adatbázisok frissessége arra utal, hogy a primer dokumentumok megjelenése után milyen
gyorsan válik elérhetővé egy rekord CD-ROM vagy online adatbázisban.
Azok a webes adatbázisok, amelyeket közvetlenül a fájlok előállítói szolgáltatnak, drámai módon
növelik az adatbázisok naprakészségét, mivel a közvetítő, az adatbázis kiadója kiiktatódik.
Napilap adatbázisok teljes szövegű változat valószínűleg közvetlenül bekerül az online
szolgáltatásba, mielőtt a nyomtatott változatokat elkezdenék kinyomtatni. Azoknál az
adatbázisoknál, amelyek indexkifejezéseket adnak az újságcikkek rekordjaihoz vagy referátumokat
szolgáltatnak (mint például a Bell & Howell cég Newspaper Abstracts Daily című szolgáltatása),
valószínűleg nagyobb a lemaradás.
Frissítések mennyisége
Kurrens információ iránti igény
Egyéb tényezők
Pontosság
Az adatbázisból visszakeresett információk pontosságát gyakran természetesnek veszik.
A helyesírási hibák és elírások pontatlanságok legáltalánosabb típusai.
Pl.: Szerzői nevek és címjegyzékek
13. A nevek esetében még a kicsit szokatlan név is problémát okozhat: előtagok (pl. von), szokatlan
nevek, az előtagok hátravetése szétszórja nevüket az indexben.
Teljesség
Egy adott adatbázisban szereplő rekordokról kereshető információk mennyire teljesek vagy
hiányosak. Bár a sok adatelem szerint lehet keresni, de a nagyméretű kihagyás nem vezet
eredményhez.
Basch (1990a) állapítja meg, hogy a kihagyások vagy az üresen hagyott mezők gyakran
eredményezik azt, hogy a kereső nem jut hozzá releváns rekordokhoz.
Pl.: Az ERIC-ben például nincs figyelmeztetés arra, hogy a dokumentumtípus mezőt a rekordok
28%-ában kihagyták, de van egy megjegyzés arról, hogy a nyelvet csak 1979-től adták meg.
Nagyon kevés olyan adatbázis van, amely legalább világossá teszi az adatelemek kihagyását a
keresési folyamat során.
A formátum és a tartalom következetessége
- Azért fontos a következetesség, mert ha nem mindig ugyan úgy használjuk a
rövidítéseket vagy jelzőket, akkor megnehezíthetjük vele a felhasználó keresését és a
releváns találatok száma sem lesz egyértelmű.
- Példák
o ERIC adatbázis három különböző formát használ U. S. News & World Report
hetilapból felvett 37 cikkhez. (& helyett and, feloldja a U.S.-t stb.)
- A következetlenségek abból is származhatnak, hogy a különböző primer forrásoknak
eltérő a gyakorlatuk - például a szerzők második vagy harmadik keresztnevének
rövidítésére. Maguk a szerzők is következetlenül használhatták őket a különböző
publikációkban.
- A folyóiratcímeket még a szerzői neveknél is következetlenebbül alkalmazzák a
változatok sokféle lehetősége miatt.
o Pl.: Ezek a következők:
A kiadó testületek rövidítéseinek és teljesen kiírt változatainak
használata,
A címben szereplő szavak közül soknak a rövidítése, az alcímek ötletszerű
felvétele és kihagyása,
Az and és and of következetlen kihagyása, helyettesítésük az & és a
kötőjel (-) karakterekkel, nem említve a kiadás helyével való kiegészítést,
hogy megkülönböztessék egymástól az egyébként teljesen azonos
folyóiratcímeket
A referátumok minősége
- A referátum az eredeti cikk rövid (150-250 szavas) összefoglalását jelenti.
- A jó referátumok segíthetnek a használóknak annak kiválasztásában, hogy melyik
dokumentumot olvassák el a maga teljességében.
- 3 típus: csak ismétlés
o Indikatív referátum: utalhat a forrásdokumentumok (folyóiratcikkek, szabadalmi
leírások, kongresszusi meghallgatások, könyvek, filmek) tartalmára.
o Informatív, amely közvetlenül bemutatja a forrás specifikus információinak egy
részét, összefoglalja a tartalmat.
14. o Kritikai referátum, amely az összefoglalást a referáló, a szakterület specialistája
értékelő és kritikai kommentárjaival egészíti ki.
- A jó referátumok kitűnő szűrők lehetnek a keresés folyamatában.
A tartalmi reprezentáció eszközeinek vizsgálati szempontjai
Mennyiség - a tartalmi feltáró eszközök száma
Az ismérvek forrása
Jelölés
A tartalmi feltáró ismérvek specifikussága
Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok
Mennyiség - a tartalmi feltáró eszközök száma
(A tartalomra utaló információt hordoz- csak magamnak)
Az ismérvek lehetnek:
- Függetlenek, amelyek önállóan szerepelnek (pl. deszkriptorok, osztályozási jelzetek,
tárgyszavak, kiemelt tartalmi jellemzők, dokumentumtípusok)
- Függhetnek egy másik ismérvtől - módosítják annak jelentését, illetve további
információkat adnak a kontextusra vonatkozóan (pl. súlyozás, minősítők, altárgyszavak).
Az ismérvek forrása
A tartalmat reprezentáló ismérvek:
- dokumentum szövegéből (pl. első bekezdés, kulcsszó)
- vagy külső forrásból származhatnak.
o Külső forrás lehet: szótárak, tárgyszójegyzékek, tezauruszok, egyéb ellenőrzött
listák, referátum
Minél specifikusabb egy adatbázis, annál több ellenőrzött listát alkalmaz. A kemény
tudományoknál használják a legtöbb ellenőrzött szótárat. A teljes szövegű adatbázisok is szép
számmal alkalmaznak szabályozott jegyzékeket.
Jelölés
Hogyan jelölik az egyes adatbázisok a tartalmi ismérveket?
Kétféle jelölés:
- Természetes nyelv közvetlenül informál a témáról
- Kód megmutatja az ismérv rendszerben elfoglalt helyét, s közvetlen, szisztematikus
keresést tesz lehetővé
A tartalmi feltáró ismérvek specifikussága
Beszélhetünk generikus (átfogó fogalmi kategóriákat lefedő) és specifikus (a téma egyediségét
megadó) eszközökről. A kettő között nehéz meghúzni a határvonalat, csak egy adatbázison belül
lehet eldönteni egy-egy ismérvről, hogy generikus-e vagy specifikus.
15. Adatbázisokban a tartalmi ismérvek külön adatmezőkben jelenhetnek meg:
- Ilyen kiemelt tartalmi elemek lehetnek például a személynevek, földrajzi nevek,
anyagnevek, kémiai elnevezések, speciális jellemzők.
A generikus kategóriák származhatnak osztályozásból, vagy lehetnek tárgyszó jellegűek.
Specifikus osztályozást csak ritkán alkalmaznak, ilyeneket leginkább a kemény tudományok
adatbázisainak némelyikében találni.
A kemény tudományok adatbázisaiban a specifikus tárgyszavazás és a kiemelt ismérvek a
legjellemzőbbek. A puha tudományoknál a specifikus leírás (deszkriptorok, szabad tárgyszavak)
bizonyulnak a leghatékonyabb tartalmi feltáró eszközöknek.
Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok
Hogyan tükrözi az adatbázisok feltáró rendszere az eredeti szövegbeli kontextust?
- A legáltalánosabb a szöveges ismertetők, összefoglalók alkalmazása (pl. referátumok,
kivonatok). A téma ismérvei és azok forrásbeli viszonyai természetes nyelvi kontextusban
jelennek meg.
- Ugyanezen az elven alapul az az eljárás, amelyben kulcsszóként mondatszerű
kifejezéseket adnak meg (key phrase).
- Egy másik lehetőség, hogy az ismérveket aszerint csoportosítjuk, mennyire
meghatározóak, mennyire hangsúlyosak az adott forrásban. Az ismérvek súlyozása
nagyon kedvelt a bibliográfiai adatbázisokban (pl. major/minor descriptors).
EGY VÁLASZTOTT ADATBÁZIS ELEMZÉSE!!!!
Szempontok
1. Milyen témaköröket dolgoz fel az adatbázis?
2. Milyen időhatárok közötti dokumentumok találhatók meg az adatbázisban?
3. Melyek azok az adatmezők, amelyek tartalomra utaló információkat hordoznak? Hogyan
lehet ezekben a mezőkben keresni?
4. Jellemezze az egyes tartalmi feltáró eszközöket az IKNY-ek tanult tipológiája szerint.
Tartalmi
informáci
ót
hordozó
adatmező
Szabályo-
zottság
Osztályozási
módszer
Mélység szerkezet
igen nem hierar-
chikus
mellé-
rendelő
individu-
alizáló
genera-
lizáló
prekoor
-dinált
posztkoo
r-dinált
5. Értékelje az adatbázis tartalmi feltárását saját keresési tapasztalatai alapján.