SlideShare a Scribd company logo
1 of 15
A.9 tétel
A hagyományos tartalmi feltáró eszközök fejlődési tendenciái, funkciói és egymásra épülése a
korszerű információs rendszerekben. Állításait igazolja egy szabadon választott szakirodalmi
adatbázis tartalmi feltáró rendszerének bemutatásával.
Bevezető, a tartalmi feltárás célja
A tartalom fogalma:
 Az információközvetítő tevékenység a tudástársadalomban értelmezett ismeretek
közvetítését jelenti.
 A könyvtár számára a tudás szövegben jelenik meg.
 A tartalom a szöveg jelentése.
 Azt az üzenetet kell megkeresni és kifejezni, amelynek információs értéke van annak a
közösségnek a számára, amelyet az információs rendszer célközönségének, használóinak
tekintünk.
A feldolgozás célja:
- Az állomány reprezentálása, áttekinthetővé tétele formai és tárgyi szempontok
szerint,
- az információk visszakereshetővé tétele,
- valamint törekszik a kompatibilitásra, a szabványosságra.
A feltárás két egymástól jól elkülöníthető szempont szerint folyik:
- A tartalmi feltárás a dokumentum tárgyát írja le valamely természetes vagy
mesterséges nyelvű osztályozási rendszer segítségével  Eredménye a tárgyi
katalógus
- A formai feltárás magát a dokumentumot írja le a rajta megjelenő adatokkal és fizikai
jellemzőkkel  Eredménye a leíró katalógus
Eredménye:
- Tárgyi katalogizálás: A tudásfeldolgozás azon folyamata, melynek során a
dokumentumban tárolt tudás rekonstrukciójával és az Információ Kereső nyelv (IKNY
= közös nyelv, a könyvtár és a felhasználó között, amin a kommunikáció
megvalósulhat) jelkészletének segítségével történik a reprezentáció.
- Két típusuk van: A tárgyszókatalógus, és a szak-vagy szakrendi katalógus.
Mindegyiken belül annyi változat alakult ki, ahány tárgyszó- vagy osztályozási
rendszer létezik. Maga a tárgyszókatalógus amúgy is gyűjtő megnevezése minden
mellérendelő indexelés alapján készített katalógusnak.
Tartalmi feltárás
- a dokumentum tárgyát írja le valamilyen természetes vagy mesterséges nyelvű
osztályozási rendszer segítségével (pl. ETO)
- feladata:
- A szöveg egyedi információinak elemzése
- A tartalom meghatározása
- Tartalmi csoportok kialakítása
- Hasonló tartalmú információk együtt tartása
- Valamennyi tartalmi információ visszakereshetővé tétele
- Eredménye a tárgyi katalógus
A tartalmi feltárás szintjei
- Regisztrációs szint
 alapvető adatok: szerző, cím, kiadó, év
- Generalizáló osztályozás
 Az információk átfogó, generikus tartalmi-tematikus csoportosítása
- Egyedi információk tartalmi leírása
 Kulcsszó, tárgyszó stb. – a konkrét kérdésre való válaszadást teszi lehetővé
- Annotáció
 1-2 mondatnyi információ a tartalomról
- Referátum
 Rövid, lényegre törő tartalmi kivonat, amely összefüggő szövegbe ágyazva
tartalmazza az eredeti szöveg lényeges megállapításait
 Indikatív referátum – csak jelzi, hogy milyen témákról szól az eredeti szöveg
 Informatív referátum – összefoglalja az eredeti mondanivalóját
 Minőségi szempontok:
 Teljesség: Tartalmazza az eredeti dokumentum minden lényeges
tartalmi elemét,
 Pontosság: Pontosan tükrözze az eredeti szöveg teljes tartalmát és az
abban foglalt véleményt,
 Objektivitás: Ne értékeljen,
 Rövidség,
 Érthetőség
 Referátumkészítés:
1. Kihagyás
2. Tömörítés
3. Tisztázás
4. Szövegszervezés
5. Stílus
- Tömörítvény
 Az eredetit pótló összefoglalás
- Analitikus-szintetikus feltárás
 Több dokumentum tartalmi szintézise – szemle, trendtanulmány
A tartalmi feltárás folyamata:
- Fogalmazzuk meg a dokumentum tartalmát egy mondatban (esetleg 2-ben).
- Ha nem foglalható egy mondatba, több témáról van szó.
- Keressük meg az újdonságot.
- Keressük meg a cselekvést. Határozzuk meg fogalmakkal.
- Keressük meg a cselekvés tárgyát és végrehajtóját. Határozzuk meg fogalmakkal.
- Szükség van-e a téma idő- és hely-viszonyainak kifejezésére? Határozzuk meg.
- Szükség van-e a dokumentumtípus kifejezésére? Adjuk meg.
A tartalmi feltárás eszközei
I. Az információkereső nyelvek rendszere
Információkereső nyelv: az a nyelv, amely alkalmas az információk és az információkereső
kérdések leírására, azaz a természetes nyelven megfogalmazott kérdések szabályozott nyelvre
történő lefordítására.
Cél: a kommunikáció az információ forrása és a használója között.
IKNY-ek feladatai:
- létre kell hozni a feldolgozási egységek vagy dokumentumok tartalmi csoportját
- fel kell tárni a feldolgozási egység egyedi tartalmát
- szurrogátum együttese létrehozása, amelyekben a hasonlók kerülnek a hasonlókhoz.
- Az ismereteket tartalmi – tematikai szerkezetüket tükröző rendszerré kell szervezni
IKNY jellemzői:
- szókészlet = jelkészlet
- szemantika = jelentés
- szintaxis = nyelvtan, használati szabályok
Az információkereső nyelvek típusai – a 7 szempont:
1. szabályozottság
Természetes nyelven alapuló IKNY-ek
 Az osztályozási kifejezéseket az eredeti szövegből emeljük ki, Pl. kulcsszó
Szabályozott IKNY-ek
 Az osztályozási kifejezéseket nyelvi, logikai szabályozásnak vetjük alá, Pl. tárgyszó,
ETO jelzet stb.
2. logikai szerkezet
Hiererachikus IKNY-ek
 Az általánostól az egyedi felé haladó logikai felosztás.
 Alá-fölérendeltségi és egész-rész relációk alapján jön létre.
Mellérendelő IKNY-ek
 Az osztályozó fogalmak egymástól függetlenekű
3. mélység
Generalizáló IKNY-ek
 Átfogó témák, nagyobb témacsoportok leírására alkalmas osztályozási rendszerek.
Individualizáló IKNY-ek
 Mély tartalmi feltárást biztosítanak.
 Az osztályozás az egyedi információk mélységéig elvégezhető
4. szerkezet
Prekoordinált IKNY-ek
 osztályozási rendszerekben az osztályok sorrendje, kapcsolatrendszere, az
osztályozási fogalom helye eleve meghatározott, így független a dokumentum
tartalmától.
Posztkoordinált IKNY-ek
 osztályozási rendszerekben a lexikai egységek a dokumentum tartalmától függően
rendelhetők egymás mellé. A fogalmak sorrendje előzetesen nem szabályozott.
5. tartalom
 Általános osztályozási rendszerek: felölelik az emberi tudás egészét, az ismeretek
teljes körét. Osztályozásukban a különféle szakterületek fogalmait összehangoltan
rendezik el.
 Speciális (szakterületi, autonóm) osztályozási rendszerek: egy-egy tudományterület,
szűkebb szakterület, ágazat ismereteit foglalják magukba. Figyelemmel vannak az
adott szakterületen működő szakemberek, kutatók sajátos igényeire és szokásaira is.
6. automatizáltság
 Nem automatikus: az osztályozás munkafolyamataiban nem használnak gépi
megoldásokat.
 Félautomatikus: a lexikai egységek megállapítása intellektuális úton történik, míg a
rendezés és a szelektálás számítógéppel.
 Automatikus: mind az osztályozási fogalmak meghatározását, mind
csoportosításukat géppel végzik.
7. területiség
 Egyetemes: az egész világra kiterjedő
 Regionális: egy-egy terület fogalmait rendszerező
 Nemzeti: országhoz, nemzethez kötődő
II. Tudományfelosztáson alapuló osztályozási rendszerek
- A felosztás mögött valamilyen tudományrendszertan áll, amelynek alapja filozófiai vagy
"általánosan elfogadott" gyakorlat lehet.
- Az ismeretkörökön belül az osztályok, alosztályok stb. kialakítása logikai alapokon történik
(alá-fölé rendeltség, egész-rész viszony).
- Az osztályozó ismérveket általában kódokkal is megjelölik, ami mutatja a hierarchiában
elfoglalt helyet.
- Az osztályozás feladata, hogy elhelyezze a témát az ismeretkörök között, illetve megadja a
helyét a tudomány(ok) rendszerében
PL.: ETO
0 - Általános tartalmú művek
1 – Filozófia, pszichológia
2 - Vallás, teológia
3 - Társadalomtudományok
4 - (1964 óta betöltetlen főosztály, eredetileg Nyelvészet)
5 - Alaptudományok. Matematika. Természettudományok
6 - Alkalmazott tudományok
7 - Szépművészetek. Iparművészetek. Szórakozások, játékok, sport
8 - Nyelvészet. Irodalom
9 - Régészet. Földrajz. Életrajz. Történelem
III. Tartalomelemzés
- Egy olyan kutatási eljárás, amely az irodalmi szövegeket és a tömegközlés ágait különböző
tartalmi és formai elemein keresztül mennyiségi úton, az ún. statisztikai nyomozás
eszközeivel vizsgálja.
- Elsősorban a kommunikációs funkció elemzéséről van szó, azon belül is a szimbolikus
jelentések feltárásáról.
- A tartalomelemzés módszerével levont következtetések más célokat szolgálnak, mint az
információs célú tartalomelemzés
- definíciók:
 A tartalomelemzés olyan kutatási technika, amelynek segítségével adatokból a
kontextusaikra vonatkozóan megismételhető és érvényes következtetéseket
vonhatunk le.
 A tartalomelemzés egy kutatási módszer, amely egy sorozat művelet segítségével
érvényes következtetéseket von le a szövegből. Ezek a következtetések az üzenet
küldőjére, az üzenetre magára, illetve az üzenet befogadójára vonatkoznak.
- célja:
 A szimbolikus jelentés feltárása
 Az adatokat mindig többféle nézőpontból lehet szemügyre venni, különösen
akkor, ha szimbolikus jellegűek.
 Minden írott közleményben meg lehet számolni a betűket, a szavakat vagy a
mondatokat.
 Lehet kategorizálni a szókapcsolatokat, leírni a kifejezések logikai szerkezetét,
meghatározni az asszociációkat, a konnotációkat, a denotációkat, a szónoki
fogásokat, de szó lehet pszichiátriai, szociológiai vagy politikai
interpretációkról is.
 Mindez egyszerre is érvényes lehet.
 Egyvalamely közlés igen sokféle tartalmat hordozhat egy befogadó számára
is.
 Ilyen körülmények között az a törekvés, amely „a” tartalmat kívánja elemezni a
kommunikációban, tudományos szempontból nem állja meg a helyét.
- célja könyvtári szempontból:
 Ha elfogadjuk Krippendorff érveit, akkor sohasem „a” tartalmat fogjuk közvetíteni,
hanem mindig egy aktuális rendszerben – nevezzük ezt információs rendszernek –
tartalomnak tekinthető szövegjelentést.
 Abban a pillanatban, hogy más információs rendszerbe kerül a szöveg, adott esetben
teljesen más is lehet a „tartalom” tartalma.
 Ezen a gondolatmeneten tovább haladva kell tehát meggondolni az információs
rendszerek közötti adatcserének, egymás elemzései kölcsönös felhasználásának a
problematikáját.
IV. Természetes nyelven alapú osztályozási és indexelési eljárások
- Az ismérvek egyértelmű jelölése a kulcstényező - a nyelvi sokszínűségből eredő
bizonytalanságokat ki kell küszöbölni (homonímia, szinonímia stb.).
- A téma egyediségének, újdonságának felmutatására lehetőséget ad.
- Az ismérvek összefüggéseinek (tematikai, logikai) jelzésére a szótárban kiépített
utalórendszer szolgál.
- Az indexelés szolgálja az egyedi ismérvek leírását.
- A nyelvi alapú osztályozás során a dokumentumok információtartalmát valamely –
természetes nyelvhez hasonló – nyelv segítségével írják le.
- A nyelvi alapú osztályozási rendszer rendelkezik a nyelvre jellemző kritériumokkal:
rendelkeznek a szavaknak, kifejezéseknek, szószerkezeteknek egy halmazával (szókincs-
szókészlet), e kifejezésekhez jelentés kötődik (szemantika-jelentés), továbbá e kifejezések
használati szabályaival arra vonatkozóan, hogyan lehet ezeket összekötni (szintaxis-
nyelvtan, használati szabályok).
- A hierarchikus információkereső nyelvek és az ezekre épülő katalógusok bonyolultsága és
bizonyos előképzettséget feltételező használata, valamint a specifikusabb kifejezések
szerinti keresési igények folytán szükségszerű elvárásként alakult ki a természetes nyelv
használata információkereső nyelvként. A nyelvészeti irányzat legelső, legnagyobb
hagyományokkal rendelkező osztályozási eljárásai a tárgyszavas rendszerek.
- Előnye:
 nem igényelnek előzetes felkészülést, vagyis az ilyen nyelvekre épülő katalógusokban
vagy gépi rendszerekben „mindenki tud keresni”.
- Hátránya:
 a természetes nyelv eredeti állapotában nem, vagy kevéssé alkalmas
információkeresés céljaira. Ezért szükség volt bizonyos megalkuvásokra, másrészt a
természetes nyelvet bizonyos mértékig szabályozó vagy legalábbis kiegészítő
megoldásokra. Ennek eredményeként létrejövő információkereső nyelveket
mellérendelő nyelveknek, a gyakorlatban pedig tárgyszavas nyelveknek nevezik. Fő
sajátosságuk a fogalmak közti értelmi, jelentésbeli összefüggések rögzítése, valamint,
hogy ABC sorrendben lehet keresni. Negatív hatás: a nyelv sajátossága (sokszínű,
változatos nyelv).
Kulcsszó: a cím valamely szava (a névelőt kivéve). Léteznek stop vagy tiltott szavak (például
azért, hogy ne lehessen keresni az „és”-re és a „hogy”-ra).
- Kulcsszó problémái: (példák)
o angol címe van, de magyarul keresek
o nem a keresett témáról szól a könyv
o csak szám a címben
Szövegszó: a teljes szövegből (szöveg testből) származó szó. Kulcsszóból szabályozás útján lesz
tárgyszó.
Tárgyszó: szabályozott nyelvi eszköz (szabályozott információkereső nyelv). A dokumentum,
információ, szöveg lényegének leírására kiválasztott tömör és egyértelmű kifejezés.
 Szabályozott: (formailag és tartalmilag)
 Formai:
 mindig főnév
 Ragozatlan főnév
 Egyes számú főnév (kivétel gyűjtőnevek)
 Tartalmi:
 Tárgyszójegyzékbe gyűjtjük a tárgyszavakat
 Tárgyszócikként jelennek mega szavak
 Tárgyszó és kapcsolataiból áll
 Természetes nyelven alapuló
 Mellérendelő
 Rugalmas, bővíthető
 Biztosítja a több szempontú feldolgozás és visszakeresés lehetőségét
Elvárások a tárgyszavas osztályozással szemben:
- az adott szakterület teljes egészét lefedje a tárgyszókészlet hézagmentesen, de
átfedésesen
- a jelölt (fogalom vagy valóságos dolog) és a jel (szókép, nyelvi alak) között egyértelmű
megfeleltetést kell biztosítania (a megnevezés mindenkinek ugyanazt a fogalmat takarja)
A tárgyszavas osztályozás feladatai:
- tárgyszavakkal leírja a dokumentumot, objektum lényeges vonásait
- tárgyszavak rendje határozza meg a tárolási rendszer szerkezetét
- alkalmas a keresőkérdések kifejezésére
Szószerkezetek: többletjelentést hordoz az összetétel, mint maguk az elemek.
TAUBÉ – UNITERM rendszer: egyszavas tárgyszórendszer: sok rossz összetétel, fölösleges találatok.
Szabad tárgyszavazási eljárás: nincs kötött tárgyszójegyzék, 5-6 szóban leírják a tartalmat.
Szinonimák esetében egyet kiválasztunk tárgyszónak, a többi nem tárgyszó (a többinél utalunk rá).
Egységes szempont alapján döntünk például: hivatalos, többen használják.
Kvázi szinonima: a szó nyelvtani értelmében nem szinonima csak hasonló kifejezés (pl.: jogszabály-
törvény)
Homonima: azonos alakú szavak (pl.: levél). Egy kifejezés hangalakja több jelentést hordoz.
Ilyenkor értelmezőt kell használni. (pl.: daru- élőlény, daru- emelőszerkezet)
A tárgyszavak közötti lehetséges kapcsolatok:
H- helyette
L – lásd
LM – lásd még
Példa
Tárgyszó Burgonya
H: nem tárgyszó H: krumpli
Pityóka
Nem tárgyszó Krumpli
L: tárgyszó L: burgonya
Pityóka
Specifikus tárgyszó-elv: azt a kifejezést használjuk, amely az egyedi, specifikus szintet képviseli. A
tárgyszó-rendszerekbe hivatkozásokat építenek be, hogy kielégítsék mind az egyedi, mind az
átfogóbb témában keresők igényeit. Általában lefelé hivatkoznak, a generikustól a specifikus felé
halad (a lásd még utalással, pl.: vallás LM: kereszténység).
Specifikustól a generikusig: pl.: pénz LM: fizetőeszköz, pénz LM: hitelügy, pénz LM: hamisítás). A
lásd még utalást mindig oda-vissza kell feltűntetni.
A tárgyszójegyzék szótári és szakcsoportos részekből áll. A tárgyszójegyzéknek tartalmaznia kell a
használati szabályzatot is (gyűjtőkör, felépítés, indexelés, stb.).
A tárolási szerkezetét a tárgyszavak sorrendje határozza meg. A dokumentumok a tárgyszavak
betűrendjében válnak kereshetővé. A legtöbb tárgyszórendszer igyekszik valamilyen struktúrát is
bevinni a tárolási szerkezetébe.
A tárgyszókatalógus lehet:
 tiszta (mechanikus, betűrendes, klasszikus)
 rendszerező (átfogóbb tematikus csoportokból áll)
 Bokrosító: a tárgyszavak egy részét felbontja részfogalmakra, alárendelt fogalmakra és
ezeket azután ismét formai jegyek alapján betűrendbe rendezi.
 Alárendelő: a tárgyszavak elrendezése, tárolása fogalmi szintek kiépítésével történik.
A 20. század 50-es éveitől jelentek meg az indexek: számítógéppel előállított tájékoztatási
eszközök, valamint az indexművek: a dokumentumok név és tárgymutatóiból fejlődtek ki.
A címindexeknél jelent meg először a tisztán természetes nyelvű osztályozás, amit kulcsszavas
osztályozásnak nevezzük. Az indexek a dokumentumok tartalmát és egyéb jellemzőit leíró
szóláncok- index tételek – rendezett gyűjteményei. Léteznek kulcsszó, ill. tárgyszó-indexek.
Kulcsszó származhat a dokumentum címéből (címindex) vagy a dokumentum szövegéből. Utóbbi
két legelterjedtebb típusa a KWIC és a KWOC.
Kulcsszóindex: a tartalomjegyzékekben szereplő cikk címekből index (a nyomtatott folyóiratok
világa) kétféle típusa:
1. KWIC = Key word in context
Minden szónál betűrendben lehet keresni.
2. KWOC = Key word out of context
Előre ki van emelve a keresett szó.
Permutált tárgyi index: a besorolás, elérés kérdését a tárgyszólánc elemeinek ciklikus
permutációjával oldják meg. Az első helyen álló tárgyszót mindig követi a tárgyszólánc többi eleme
is.
Lánceljárásos tárgyi index: a lánc elemei különböző fogalmi szinteken helyezkednek el. A
tárgyszavak rendezése a specifikustól a generikus felé haladó sorrendben. Az első helyre kerülő
elem után mindig csak az eredetileg is utána következő elemeket adjuk meg. Ma már ritkán
alkalmazzák.
PRECIS (preserved context indexing system=szövegösszefüggést megtartó indexelési rendszer). D.
Austin dolgozta ki. A PRECIS grammatikai szabályok összessége. Első lépésként megalkotják a
dokumentum lényegét leíró mondatot. Majd az egyes szavaknak a mondatban betöltött szerepét
egy speciális jelrendszer segítségével rögzítjük. Végterméke egy számítógéppel ellátott permutált
index. A permutálás során az osztályozási kifejezések sorrendje mindig megtartja a természetes
nyelvi mondat szórendjét.
V. Szöveges ismertetők, tartalmi összefoglalók (annotáció, kivonat, referátum stb.)
1) Annotáció
 Rövid terjedelmű ismertetés, amely a dokumentumot jellemzi, a mű tartalmára,
szerzőjére, rendeltetésére, formájára, keletkezési körülményeire, vagy egyéb
sajátosságaira vonatkozik.
 Általában a bibliográfiai adatok után következik megjegyzés formájában.
 Segíti annak eldöntését, hogy az eredeti dokumentum releváns vagy sem.
 Ismertető vagy ajánló jellegű lehet, tartalmazhat ítéletet is.
 Nem kell megfelelnie a szövegszerűség valamennyi kritériumának.
2) Recenzió
 Röviden leírja a szöveg tartalmát, de kifejezi a recenzor véleményét is.
 Nem kritériuma az objektivitás.
 Fontos eleme az értékelés.
 Célja elsősorban a figyelemfelkeltés.
3) Kivonat
 Az elsődleges dokumentumból vett részek szó szerinti, átalakítás nélküli kiemelése.
 Csak olyan mondatokat, kifejezéseket használ, amelyek az elsődleges dokumentumban is
előfordulnak.
 Előállítása viszonylag könnyen automatizálható.
 Az eredeti dokumentummal megegyező nyelven kell készülnie.
4) Összefoglalás
 Nem önálló műfaj
 Állhat akár az eredeti szöveg végén, mintegy annak részeként, de más szövegekbe ágyazva
is.
 Célja nem az, hogy az olvasónak segítsen az eredeti szöveg relevanciájának eldöntésében,
sokkal inkább az összefoglalás és a szöveg elhelyezése a kutatási eredmények
rendszerében.
5) Témadokumentáció
 Egy adott témára vonatkozó dokumentumok kivonatainak gyűjteménye.
 Válogat a téma irodalmából, és annak minden fontos elemét feldolgozza.
 Nem csak az olvasásra, de a keresésre fordított időt is lerövidíti.
6) Szakirodalmi szemle
 Önálló szerkezetben foglalja össze a témára vonatkozó valamennyi lényeges információt,
több dokumentum együttes feldolgozásával.
 A legmagasabb szintű szolgáltatások egyike.
7) Referátum
 A dokumentum (vagy része) tartalmának – a legfontosabb adatokra, tényekre és
következtetésekre kiterjedő – olyan rövid ismertetése, amely felhívja a figyelmet az új
ismeretekre, és lehetővé teszi annak eldöntését, hogy célszerű-e tanulmányozni a
dokumentumot.
 A referátum természetes nyelvi, önállóan is megálló szöveg, amely megfelel a
szövegszerűség kritériumainak (kohézió, koherencia, szándékoltság, elfogadhatóság,
hírérték, helyzetszerűség, intertextualitás)
 A referátum írott szöveg, amely különféle hordozókon jelenhet meg.
 A referátum másodlagos dokumentum.
 A referátum információs célokra létrehozott szöveg.
VI. Tezaurusz
- A szemantikai információkereső nyelvek lexikai egységeit („tárgyszavait”), vagyis a
valamely fogalom leírására, képviseletére kiválasztott szavakat vagy kifejezéseket
deszkriptoroknak, szótáraikat pedig tezauruszoknak nevezzük.
- Az információs tezaurusz, mélyebb feltárást tesz lehetővé. Mely egy-egy szakterület
természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható
szótára, amely feltünteti a fogalmak közötti legfontosabb logikai kapcsolatokat.
- Alapvető követelmény a tezaurusszal szemben, hogy az adott szakterület valamennyi
lényeges fogalmát tartalmazza, a szakterület teljes lefedését biztosítsa, és bővíthető is
legyen.
- A tezaurusz részei:
o deszkriptor,(L): A deszkriptor az információk leírására és keresésére közvetlenül
alkalmazható. A deszkriptor általában egyes számú főnév, kivéve gyűjtőnevek,
illetve többes számú főnév, ha az jelentésében eltér az egyes számú alaktól. A
deszkriptor lehet önmagában álló szó, összetett szó, több szóból álló
kifejezés.(Kerüljük az invertálást!)
o
o nemdeszkriptor,(H): A nemdeszkriptor a deszkriptor szinonim kifejezése, mely az
információk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe
vételével használható.
o reláció: A relációk kimunkálása kötelező (ebben különbözik más osztályozási
rendszerektől).
- A tezaurusz felépítése:
o Bevezetés,
o Főrész,
o Jelentéskörök szerinti rész,
o hierarchikus rész,
o grafikus rész,
o betűrendes mutatókkal kiegészülhet
A Bevezetésben feltüntetjük a tezaurusz célját és felhasználási területét. Leírjuk a készítési módját,
a mennyiségi jellemzőit és a javításának, módosításának módját.
A főrész deszkriptor- és nemdeszkriptorcikkekből áll betűrendes elrendezésben.
A deszkriptorcikk a vezérdeszkriptorból és a vele közvetlen kapcsolatban álló deszkriptorokból épül
fel, illetve feltünteti a kapcsolat jellegét is. A nemdeszkriptorcikk a nemdeszkriptorból és a helyette
álló deszkriptorból áll.
A jelentéskörök szerinti rész kidolgozása azt a célt szolgálja, hogy a tartalmilag összetartozó
deszkriptorokat egy helyre gyűjtsük össze. Egy-egy átfogó fogalom alatt betűrendben megadjuk a
jelentés szerint hozzátartozó deszkriptorokat.
A hierarchikus rész célja, hogy a relációtípusokat kiemelve, kiépítse a deszkriptorok közti teljes
hierarchiát az általános fogalomból kiindulva a specifikusig. Épülhet fogalmi hierarchiára (alá-
fölérendeltség), de létrehozható az egész-rész szerkezeti reláció alapján. (Tranzitív relációk)
A grafikus rész a tezauruszban feltárt ismeretág, szakterület legfontosabb fogalmait és azok
relációit grafikus ábrákban mutatja be. Nem kötelező
A betűrendes mutatót akkor kell alkalmazni, amikor valami kimaradt a főrészből.)
Szinonimának tekinthető az a kifejezés, amely maradéktalanul helyettesíti a másikat. Tezauruszban
szinonimaként kezeljük az idegen nyelvű kifejezést és a magyar megfelelőjét, a tudományos és
köznapi megnevezéseket, a fogalom különböző alakváltozatait, a fogalom rövid és teljes alakját,
illetve a kvázi szinonimákat (a szó nyelvtani értelmében nem szinonimák). Szinonimák jelölése: L
(lásd), H (helyettesíti) utalókkal.
Homonimák: a többjelentésű szavak jelentésbeli megkülönböztetésére értelmezőt használunk:
Pl.: TOLL (íróeszköz)
TOLL (madártoll)
Szócikk:
– a szabványok mögött ott áll mindig egy jegyzék (pl.: ETO mögött a táblázatok)
– a szó a hozzá kapcsolódó szavakkal jelenik megtárgyszócikk
– a szinonimák közül egyet kell kiválasztani tárgyszónak, a többi nem tárgyszó
– egységes szempontot kell találni
– attól függ, hogy milyen közönség használja
– pl.: Burgonya H: krumpli
Krumpli L: burgonya
TEZAURUSZ-RELÁCIÓK: A RELÁCIÓK MINDIG KÉTIRÁNYÚAK!!!
– ALÁ-FÖLÉRENDELTSÉG: Ha A fogalom teljes terjedelmében beletartozik B fogalomba, akkor azt
mondjuk, hogy A alárendeltje(a) (faja, speciese) B-nek. Az alárendelt fogalom tartalma
gazdagabb, több ismertetőjegyet tartalmaz, mint a fölérendeltje(b), de terjedelme kisebb.
Mindig csak a közvetlen alá- ill. fölérendeltet adjuk meg. Egy deszkriptornak lehet több alá-
és fölérendeltje különböző szempontok szerint.
– EGÉSZ-RÉSZ: Az egész-rész reláció a fogalmakban általánosított tárgyak, objektumok fizikai,
szerkezeti kapcsolata. A rész(p) nem rendelkezik azokkal a tartalmi jegyekkel, mint az
egész(T), az egész pedig mindig több mint részeinek összessége. Mindig csak a közvetlen
részt ill. egészet adjuk meg. Egy deszkriptornak lehet több része és egésze különböző
szempontok szerint.
– OK-OKOZAT, FELTÉTEL ÉS ELŐFELTÉTEL: Az ok, előfeltétel( E), ezt csak olyankor használjuk, mikor
egyértelmű a mi a következmény, okozat( R)=rezultáns
– ROKON KAPCSOLATOK (x) Gyűjtőfogalom, több különböző kapcsolattípust foglal magában.
Ezek a kapcsolatok lehetnek szimmetrikusak (ellentét, hasonlóság, korreláció, stb.), és
asszimetrikusak (rendeltetés, eszköz, produktum, tulajdonság, stb.)
Az adatbázisokról – csak segítség, nem kell szó szerint tudni
A jó adatbázis hatóköre
- Ki kell elégítenie egyéni használó, illetve egy könyvtár vagy intézmény használóinak
érdeklődését. Pl.: speciális témák: Climbing Database (hegymászók adatbázisa) és a
kiváló Biographies of Women Mathematicians (matematikusnők életrajzai)
- El kell róla dönteni, hogy általános vagy sem: Vannak problémák az általános jellegű
adatbázisokkal. Mert kiderül, hogy mégsem olyan általános mégsem található benne
minden tudomány.
- Megfelelő keresési szűrők lehetnek:
o Téma/tárgy szerinti keresés, nyelv és dokumentumtípus szerinti feltártság, feltárt
időtartományt, címindexek, kulcsszó szerinti keresés
o Egyáltalán nem mindegy, hogy egy magát informatikai adatbázisnak definiáló
tartalomszolgáltató témáiban, tárgy szavaiban és kulcsszavaiban szerepelnek
szakkifejezések vagy csak helyenként, vagy hogy a szakkifejezések elavultak e
vagy sem. Ugyancsak figyelni kell az időtartományra, valószínűleg nem lesz
kurrens azaz orvostudományi vagy informatikai adatbázis, melyben a publikációk
az 1990-es évekből származnak.
o Témák keresése esetében nem mindegy, hogy melyik nyelvterületen, melyik szót
használjuk. Az amerikai szerzők elsődlegesen a postpartum depression kifejezést
használják, európai és brit nemzetközösségből származó szerzők gyakran a
puerperal depression kifejezést preferálják. Ebből következően az előbbi kifejezés
használata előnyös a MEDLINE számára az EMBASE-zel szemben (amelynek
szélesebb az európai forrásbázisa), a második fogalom esetén fordított a helyzet.
Az adatbázis dimenziói
Méret:
A legnagyobb nem egyenlő a legjobbal.
Ami számunkra fontos egy példával lehet elmondani:
A legnagyobb orvosi adatbázis, amely nem dolgozza fel Kelet-Ázsia folyóiratait a megfelelő
mértékben, nem lehet a legjobb annak a számára, aki ennek a régiónak a fejlődéséről vagy klinikai
jelentéseiről keres információt.
Időbeliség:
Retrospektivitás jó lehet annak, aki humántudományokkal esetleg társadalomtudományokkal
foglalkozik, rossz egy természettudósnak, orvosnak, informatikusnak, műszaki szakembernek.
Mélység:
Pusztán az, hogy egyes folyóiratok jelen vannak az adatbázisban, nem garantálja, hogy megfelelő
mértékben fel is tárják azokat.
Problémák: elkezdik a feltárását a folyóiratnak, de nem fejezik be. A folyóirat közben nevet vált, de
az adatbázis készítői nem jelölik az eredeti nevével történő utolsó kiadását. Hozzájutási
nehézségekre való hivatkozás: drága a folyóirat, túl messziről érkezik, késve kapják meg.
Frissesség:
Az adatbázisok frissessége arra utal, hogy a primer dokumentumok megjelenése után milyen
gyorsan válik elérhetővé egy rekord CD-ROM vagy online adatbázisban.
Azok a webes adatbázisok, amelyeket közvetlenül a fájlok előállítói szolgáltatnak, drámai módon
növelik az adatbázisok naprakészségét, mivel a közvetítő, az adatbázis kiadója kiiktatódik.
Napilap adatbázisok  teljes szövegű változat valószínűleg közvetlenül bekerül az online
szolgáltatásba, mielőtt a nyomtatott változatokat elkezdenék kinyomtatni. Azoknál az
adatbázisoknál, amelyek indexkifejezéseket adnak az újságcikkek rekordjaihoz vagy referátumokat
szolgáltatnak (mint például a Bell & Howell cég Newspaper Abstracts Daily című szolgáltatása),
valószínűleg nagyobb a lemaradás.
Frissítések mennyisége
Kurrens információ iránti igény
Egyéb tényezők
Pontosság
Az adatbázisból visszakeresett információk pontosságát gyakran természetesnek veszik.
A helyesírási hibák és elírások  pontatlanságok legáltalánosabb típusai.
Pl.: Szerzői nevek és címjegyzékek
A nevek esetében még a kicsit szokatlan név is problémát okozhat: előtagok (pl. von), szokatlan
nevek, az előtagok hátravetése szétszórja nevüket az indexben.
Teljesség
Egy adott adatbázisban szereplő rekordokról kereshető információk mennyire teljesek vagy
hiányosak. Bár a sok adatelem szerint lehet keresni, de a nagyméretű kihagyás nem vezet
eredményhez.
Basch (1990a) állapítja meg, hogy a kihagyások vagy az üresen hagyott mezők gyakran
eredményezik azt, hogy a kereső nem jut hozzá releváns rekordokhoz.
Pl.: Az ERIC-ben például nincs figyelmeztetés arra, hogy a dokumentumtípus mezőt a rekordok
28%-ában kihagyták, de van egy megjegyzés arról, hogy a nyelvet csak 1979-től adták meg.
Nagyon kevés olyan adatbázis van, amely legalább világossá teszi az adatelemek kihagyását a
keresési folyamat során.
A formátum és a tartalom következetessége
- Azért fontos a következetesség, mert ha nem mindig ugyan úgy használjuk a
rövidítéseket vagy jelzőket, akkor megnehezíthetjük vele a felhasználó keresését és a
releváns találatok száma sem lesz egyértelmű.
- Példák
o ERIC adatbázis három különböző formát használ U. S. News & World Report
hetilapból felvett 37 cikkhez. (& helyett and, feloldja a U.S.-t stb.)
- A következetlenségek abból is származhatnak, hogy a különböző primer forrásoknak
eltérő a gyakorlatuk - például a szerzők második vagy harmadik keresztnevének
rövidítésére. Maguk a szerzők is következetlenül használhatták őket a különböző
publikációkban.
- A folyóiratcímeket még a szerzői neveknél is következetlenebbül alkalmazzák a
változatok sokféle lehetősége miatt.
o Pl.: Ezek a következők:
 A kiadó testületek rövidítéseinek és teljesen kiírt változatainak
használata,
 A címben szereplő szavak közül soknak a rövidítése, az alcímek ötletszerű
felvétele és kihagyása,
 Az and és and of következetlen kihagyása, helyettesítésük az & és a
kötőjel (-) karakterekkel, nem említve a kiadás helyével való kiegészítést,
hogy megkülönböztessék egymástól az egyébként teljesen azonos
folyóiratcímeket
A referátumok minősége
- A referátum az eredeti cikk rövid (150-250 szavas) összefoglalását jelenti.
- A jó referátumok segíthetnek a használóknak annak kiválasztásában, hogy melyik
dokumentumot olvassák el a maga teljességében.
- 3 típus: csak ismétlés
o Indikatív referátum: utalhat a forrásdokumentumok (folyóiratcikkek, szabadalmi
leírások, kongresszusi meghallgatások, könyvek, filmek) tartalmára.
o Informatív, amely közvetlenül bemutatja a forrás specifikus információinak egy
részét, összefoglalja a tartalmat.
o Kritikai referátum, amely az összefoglalást a referáló, a szakterület specialistája
értékelő és kritikai kommentárjaival egészíti ki.
- A jó referátumok kitűnő szűrők lehetnek a keresés folyamatában.
A tartalmi reprezentáció eszközeinek vizsgálati szempontjai
Mennyiség - a tartalmi feltáró eszközök száma
Az ismérvek forrása
Jelölés
A tartalmi feltáró ismérvek specifikussága
Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok
Mennyiség - a tartalmi feltáró eszközök száma
(A tartalomra utaló információt hordoz- csak magamnak)
Az ismérvek lehetnek:
- Függetlenek, amelyek önállóan szerepelnek (pl. deszkriptorok, osztályozási jelzetek,
tárgyszavak, kiemelt tartalmi jellemzők, dokumentumtípusok)
- Függhetnek egy másik ismérvtől - módosítják annak jelentését, illetve további
információkat adnak a kontextusra vonatkozóan (pl. súlyozás, minősítők, altárgyszavak).
Az ismérvek forrása
A tartalmat reprezentáló ismérvek:
- dokumentum szövegéből (pl. első bekezdés, kulcsszó)
- vagy külső forrásból származhatnak.
o Külső forrás lehet: szótárak, tárgyszójegyzékek, tezauruszok, egyéb ellenőrzött
listák, referátum
Minél specifikusabb egy adatbázis, annál több ellenőrzött listát alkalmaz.  A kemény
tudományoknál használják a legtöbb ellenőrzött szótárat. A teljes szövegű adatbázisok is szép
számmal alkalmaznak szabályozott jegyzékeket.
Jelölés
Hogyan jelölik az egyes adatbázisok a tartalmi ismérveket?
Kétféle jelölés:
- Természetes nyelv közvetlenül informál a témáról
- Kód megmutatja az ismérv rendszerben elfoglalt helyét, s közvetlen, szisztematikus
keresést tesz lehetővé
A tartalmi feltáró ismérvek specifikussága
Beszélhetünk generikus (átfogó fogalmi kategóriákat lefedő) és specifikus (a téma egyediségét
megadó) eszközökről. A kettő között nehéz meghúzni a határvonalat, csak egy adatbázison belül
lehet eldönteni egy-egy ismérvről, hogy generikus-e vagy specifikus.
Adatbázisokban a tartalmi ismérvek külön adatmezőkben jelenhetnek meg:
- Ilyen kiemelt tartalmi elemek lehetnek például a személynevek, földrajzi nevek,
anyagnevek, kémiai elnevezések, speciális jellemzők.
A generikus kategóriák származhatnak osztályozásból, vagy lehetnek tárgyszó jellegűek.
Specifikus osztályozást csak ritkán alkalmaznak, ilyeneket leginkább a kemény tudományok
adatbázisainak némelyikében találni.
A kemény tudományok adatbázisaiban a specifikus tárgyszavazás és a kiemelt ismérvek a
legjellemzőbbek. A puha tudományoknál a specifikus leírás (deszkriptorok, szabad tárgyszavak)
bizonyulnak a leghatékonyabb tartalmi feltáró eszközöknek.
Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok
Hogyan tükrözi az adatbázisok feltáró rendszere az eredeti szövegbeli kontextust?
- A legáltalánosabb a szöveges ismertetők, összefoglalók alkalmazása (pl. referátumok,
kivonatok). A téma ismérvei és azok forrásbeli viszonyai természetes nyelvi kontextusban
jelennek meg.
- Ugyanezen az elven alapul az az eljárás, amelyben kulcsszóként mondatszerű
kifejezéseket adnak meg (key phrase).
- Egy másik lehetőség, hogy az ismérveket aszerint csoportosítjuk, mennyire
meghatározóak, mennyire hangsúlyosak az adott forrásban. Az ismérvek súlyozása
nagyon kedvelt a bibliográfiai adatbázisokban (pl. major/minor descriptors).
EGY VÁLASZTOTT ADATBÁZIS ELEMZÉSE!!!!
Szempontok
1. Milyen témaköröket dolgoz fel az adatbázis?
2. Milyen időhatárok közötti dokumentumok találhatók meg az adatbázisban?
3. Melyek azok az adatmezők, amelyek tartalomra utaló információkat hordoznak? Hogyan
lehet ezekben a mezőkben keresni?
4. Jellemezze az egyes tartalmi feltáró eszközöket az IKNY-ek tanult tipológiája szerint.
Tartalmi
informáci
ót
hordozó
adatmező
Szabályo-
zottság
Osztályozási
módszer
Mélység szerkezet
igen nem hierar-
chikus
mellé-
rendelő
individu-
alizáló
genera-
lizáló
prekoor
-dinált
posztkoo
r-dinált
5. Értékelje az adatbázis tartalmi feltárását saját keresési tapasztalatai alapján.

More Related Content

Similar to A.9 tartalmi feltárás

Merész Gergő: Tudománymetriai adatok elemzése
Merész Gergő: Tudománymetriai adatok elemzéseMerész Gergő: Tudománymetriai adatok elemzése
Merész Gergő: Tudománymetriai adatok elemzéseZoltan Varju
 
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációbanA mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációbanCsaba KOLLAR (Dr. PhD.)
 
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzésiA tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzésiszandrettina
 
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzésiA tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzésiszandrettina
 
Reklamok Ertelmezese 3
Reklamok Ertelmezese 3Reklamok Ertelmezese 3
Reklamok Ertelmezese 3Zoltan Havasi
 
Tudásszervezési rendszerek
Tudásszervezési rendszerekTudásszervezési rendszerek
Tudásszervezési rendszerekAndrás Molnár
 
Gondolatterkepek web1 web2-fülep_adam
Gondolatterkepek web1 web2-fülep_adamGondolatterkepek web1 web2-fülep_adam
Gondolatterkepek web1 web2-fülep_adammediakommunikacio
 
Elektronikus tananyagkeszites
Elektronikus tananyagkeszitesElektronikus tananyagkeszites
Elektronikus tananyagkeszitesPeter Antal
 
Multimédia értékelés
Multimédia értékelésMultimédia értékelés
Multimédia értékelésMediainformatik
 
Multimédia értékelés
Multimédia értékelésMultimédia értékelés
Multimédia értékelésMediainformatik
 

Similar to A.9 tartalmi feltárás (12)

Merész Gergő: Tudománymetriai adatok elemzése
Merész Gergő: Tudománymetriai adatok elemzéseMerész Gergő: Tudománymetriai adatok elemzése
Merész Gergő: Tudománymetriai adatok elemzése
 
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációbanA mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
 
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzésiA tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
 
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzésiA tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
A tananyag kiválogatásának és elrendezésének szempontjai a felnőttképzési
 
Tanterv fogalmak
Tanterv fogalmakTanterv fogalmak
Tanterv fogalmak
 
Mt kti 03
Mt kti 03Mt kti 03
Mt kti 03
 
Reklamok Ertelmezese 3
Reklamok Ertelmezese 3Reklamok Ertelmezese 3
Reklamok Ertelmezese 3
 
Tudásszervezési rendszerek
Tudásszervezési rendszerekTudásszervezési rendszerek
Tudásszervezési rendszerek
 
Gondolatterkepek web1 web2-fülep_adam
Gondolatterkepek web1 web2-fülep_adamGondolatterkepek web1 web2-fülep_adam
Gondolatterkepek web1 web2-fülep_adam
 
Elektronikus tananyagkeszites
Elektronikus tananyagkeszitesElektronikus tananyagkeszites
Elektronikus tananyagkeszites
 
Multimédia értékelés
Multimédia értékelésMultimédia értékelés
Multimédia értékelés
 
Multimédia értékelés
Multimédia értékelésMultimédia értékelés
Multimédia értékelés
 

More from Gyula Paksi-Tamás (20)

B11 tomi
B11   tomiB11   tomi
B11 tomi
 
B9 fruzsi
B9 fruzsiB9 fruzsi
B9 fruzsi
 
B6 fruzsi
B6 fruzsiB6 fruzsi
B6 fruzsi
 
B5
B5B5
B5
 
B3 arculat image_pr
B3 arculat image_prB3 arculat image_pr
B3 arculat image_pr
 
B2
B2B2
B2
 
B1 informacios gazdasag_es_piac
B1 informacios gazdasag_es_piacB1 informacios gazdasag_es_piac
B1 informacios gazdasag_es_piac
 
B.14 művészeti.táj
B.14 művészeti.tájB.14 művészeti.táj
B.14 művészeti.táj
 
B.12 term.tud.
B.12 term.tud.B.12 term.tud.
B.12 term.tud.
 
B.8 társ.tud.táj
B.8 társ.tud.tájB.8 társ.tud.táj
B.8 társ.tud.táj
 
B.4 minőségi tartalomszolg.
B.4 minőségi tartalomszolg.B.4 minőségi tartalomszolg.
B.4 minőségi tartalomszolg.
 
A12
A12A12
A12
 
A11
A11A11
A11
 
A8.tétel
A8.tételA8.tétel
A8.tétel
 
A7 fruzsi
A7 fruzsiA7 fruzsi
A7 fruzsi
 
A6 tomi
A6   tomiA6   tomi
A6 tomi
 
A4
A4A4
A4
 
A 3
A 3A 3
A 3
 
A2
A2A2
A2
 
A.10 a szemantikus technológiak brigi
A.10 a szemantikus technológiak brigiA.10 a szemantikus technológiak brigi
A.10 a szemantikus technológiak brigi
 

A.9 tartalmi feltárás

  • 1. A.9 tétel A hagyományos tartalmi feltáró eszközök fejlődési tendenciái, funkciói és egymásra épülése a korszerű információs rendszerekben. Állításait igazolja egy szabadon választott szakirodalmi adatbázis tartalmi feltáró rendszerének bemutatásával. Bevezető, a tartalmi feltárás célja A tartalom fogalma:  Az információközvetítő tevékenység a tudástársadalomban értelmezett ismeretek közvetítését jelenti.  A könyvtár számára a tudás szövegben jelenik meg.  A tartalom a szöveg jelentése.  Azt az üzenetet kell megkeresni és kifejezni, amelynek információs értéke van annak a közösségnek a számára, amelyet az információs rendszer célközönségének, használóinak tekintünk. A feldolgozás célja: - Az állomány reprezentálása, áttekinthetővé tétele formai és tárgyi szempontok szerint, - az információk visszakereshetővé tétele, - valamint törekszik a kompatibilitásra, a szabványosságra. A feltárás két egymástól jól elkülöníthető szempont szerint folyik: - A tartalmi feltárás a dokumentum tárgyát írja le valamely természetes vagy mesterséges nyelvű osztályozási rendszer segítségével  Eredménye a tárgyi katalógus - A formai feltárás magát a dokumentumot írja le a rajta megjelenő adatokkal és fizikai jellemzőkkel  Eredménye a leíró katalógus Eredménye: - Tárgyi katalogizálás: A tudásfeldolgozás azon folyamata, melynek során a dokumentumban tárolt tudás rekonstrukciójával és az Információ Kereső nyelv (IKNY = közös nyelv, a könyvtár és a felhasználó között, amin a kommunikáció megvalósulhat) jelkészletének segítségével történik a reprezentáció. - Két típusuk van: A tárgyszókatalógus, és a szak-vagy szakrendi katalógus. Mindegyiken belül annyi változat alakult ki, ahány tárgyszó- vagy osztályozási rendszer létezik. Maga a tárgyszókatalógus amúgy is gyűjtő megnevezése minden mellérendelő indexelés alapján készített katalógusnak. Tartalmi feltárás - a dokumentum tárgyát írja le valamilyen természetes vagy mesterséges nyelvű osztályozási rendszer segítségével (pl. ETO) - feladata: - A szöveg egyedi információinak elemzése - A tartalom meghatározása - Tartalmi csoportok kialakítása - Hasonló tartalmú információk együtt tartása - Valamennyi tartalmi információ visszakereshetővé tétele
  • 2. - Eredménye a tárgyi katalógus A tartalmi feltárás szintjei - Regisztrációs szint  alapvető adatok: szerző, cím, kiadó, év - Generalizáló osztályozás  Az információk átfogó, generikus tartalmi-tematikus csoportosítása - Egyedi információk tartalmi leírása  Kulcsszó, tárgyszó stb. – a konkrét kérdésre való válaszadást teszi lehetővé - Annotáció  1-2 mondatnyi információ a tartalomról - Referátum  Rövid, lényegre törő tartalmi kivonat, amely összefüggő szövegbe ágyazva tartalmazza az eredeti szöveg lényeges megállapításait  Indikatív referátum – csak jelzi, hogy milyen témákról szól az eredeti szöveg  Informatív referátum – összefoglalja az eredeti mondanivalóját  Minőségi szempontok:  Teljesség: Tartalmazza az eredeti dokumentum minden lényeges tartalmi elemét,  Pontosság: Pontosan tükrözze az eredeti szöveg teljes tartalmát és az abban foglalt véleményt,  Objektivitás: Ne értékeljen,  Rövidség,  Érthetőség  Referátumkészítés: 1. Kihagyás 2. Tömörítés 3. Tisztázás 4. Szövegszervezés 5. Stílus - Tömörítvény  Az eredetit pótló összefoglalás - Analitikus-szintetikus feltárás  Több dokumentum tartalmi szintézise – szemle, trendtanulmány A tartalmi feltárás folyamata: - Fogalmazzuk meg a dokumentum tartalmát egy mondatban (esetleg 2-ben). - Ha nem foglalható egy mondatba, több témáról van szó. - Keressük meg az újdonságot. - Keressük meg a cselekvést. Határozzuk meg fogalmakkal. - Keressük meg a cselekvés tárgyát és végrehajtóját. Határozzuk meg fogalmakkal. - Szükség van-e a téma idő- és hely-viszonyainak kifejezésére? Határozzuk meg. - Szükség van-e a dokumentumtípus kifejezésére? Adjuk meg.
  • 3. A tartalmi feltárás eszközei I. Az információkereső nyelvek rendszere Információkereső nyelv: az a nyelv, amely alkalmas az információk és az információkereső kérdések leírására, azaz a természetes nyelven megfogalmazott kérdések szabályozott nyelvre történő lefordítására. Cél: a kommunikáció az információ forrása és a használója között. IKNY-ek feladatai: - létre kell hozni a feldolgozási egységek vagy dokumentumok tartalmi csoportját - fel kell tárni a feldolgozási egység egyedi tartalmát - szurrogátum együttese létrehozása, amelyekben a hasonlók kerülnek a hasonlókhoz. - Az ismereteket tartalmi – tematikai szerkezetüket tükröző rendszerré kell szervezni IKNY jellemzői: - szókészlet = jelkészlet - szemantika = jelentés - szintaxis = nyelvtan, használati szabályok Az információkereső nyelvek típusai – a 7 szempont: 1. szabályozottság Természetes nyelven alapuló IKNY-ek  Az osztályozási kifejezéseket az eredeti szövegből emeljük ki, Pl. kulcsszó Szabályozott IKNY-ek  Az osztályozási kifejezéseket nyelvi, logikai szabályozásnak vetjük alá, Pl. tárgyszó, ETO jelzet stb. 2. logikai szerkezet Hiererachikus IKNY-ek  Az általánostól az egyedi felé haladó logikai felosztás.  Alá-fölérendeltségi és egész-rész relációk alapján jön létre. Mellérendelő IKNY-ek  Az osztályozó fogalmak egymástól függetlenekű 3. mélység Generalizáló IKNY-ek  Átfogó témák, nagyobb témacsoportok leírására alkalmas osztályozási rendszerek. Individualizáló IKNY-ek  Mély tartalmi feltárást biztosítanak.  Az osztályozás az egyedi információk mélységéig elvégezhető 4. szerkezet Prekoordinált IKNY-ek  osztályozási rendszerekben az osztályok sorrendje, kapcsolatrendszere, az osztályozási fogalom helye eleve meghatározott, így független a dokumentum tartalmától.
  • 4. Posztkoordinált IKNY-ek  osztályozási rendszerekben a lexikai egységek a dokumentum tartalmától függően rendelhetők egymás mellé. A fogalmak sorrendje előzetesen nem szabályozott. 5. tartalom  Általános osztályozási rendszerek: felölelik az emberi tudás egészét, az ismeretek teljes körét. Osztályozásukban a különféle szakterületek fogalmait összehangoltan rendezik el.  Speciális (szakterületi, autonóm) osztályozási rendszerek: egy-egy tudományterület, szűkebb szakterület, ágazat ismereteit foglalják magukba. Figyelemmel vannak az adott szakterületen működő szakemberek, kutatók sajátos igényeire és szokásaira is. 6. automatizáltság  Nem automatikus: az osztályozás munkafolyamataiban nem használnak gépi megoldásokat.  Félautomatikus: a lexikai egységek megállapítása intellektuális úton történik, míg a rendezés és a szelektálás számítógéppel.  Automatikus: mind az osztályozási fogalmak meghatározását, mind csoportosításukat géppel végzik. 7. területiség  Egyetemes: az egész világra kiterjedő  Regionális: egy-egy terület fogalmait rendszerező  Nemzeti: országhoz, nemzethez kötődő II. Tudományfelosztáson alapuló osztályozási rendszerek - A felosztás mögött valamilyen tudományrendszertan áll, amelynek alapja filozófiai vagy "általánosan elfogadott" gyakorlat lehet. - Az ismeretkörökön belül az osztályok, alosztályok stb. kialakítása logikai alapokon történik (alá-fölé rendeltség, egész-rész viszony). - Az osztályozó ismérveket általában kódokkal is megjelölik, ami mutatja a hierarchiában elfoglalt helyet. - Az osztályozás feladata, hogy elhelyezze a témát az ismeretkörök között, illetve megadja a helyét a tudomány(ok) rendszerében PL.: ETO 0 - Általános tartalmú művek 1 – Filozófia, pszichológia 2 - Vallás, teológia 3 - Társadalomtudományok 4 - (1964 óta betöltetlen főosztály, eredetileg Nyelvészet) 5 - Alaptudományok. Matematika. Természettudományok 6 - Alkalmazott tudományok 7 - Szépművészetek. Iparművészetek. Szórakozások, játékok, sport 8 - Nyelvészet. Irodalom 9 - Régészet. Földrajz. Életrajz. Történelem
  • 5. III. Tartalomelemzés - Egy olyan kutatási eljárás, amely az irodalmi szövegeket és a tömegközlés ágait különböző tartalmi és formai elemein keresztül mennyiségi úton, az ún. statisztikai nyomozás eszközeivel vizsgálja. - Elsősorban a kommunikációs funkció elemzéséről van szó, azon belül is a szimbolikus jelentések feltárásáról. - A tartalomelemzés módszerével levont következtetések más célokat szolgálnak, mint az információs célú tartalomelemzés - definíciók:  A tartalomelemzés olyan kutatási technika, amelynek segítségével adatokból a kontextusaikra vonatkozóan megismételhető és érvényes következtetéseket vonhatunk le.  A tartalomelemzés egy kutatási módszer, amely egy sorozat művelet segítségével érvényes következtetéseket von le a szövegből. Ezek a következtetések az üzenet küldőjére, az üzenetre magára, illetve az üzenet befogadójára vonatkoznak. - célja:  A szimbolikus jelentés feltárása  Az adatokat mindig többféle nézőpontból lehet szemügyre venni, különösen akkor, ha szimbolikus jellegűek.  Minden írott közleményben meg lehet számolni a betűket, a szavakat vagy a mondatokat.  Lehet kategorizálni a szókapcsolatokat, leírni a kifejezések logikai szerkezetét, meghatározni az asszociációkat, a konnotációkat, a denotációkat, a szónoki fogásokat, de szó lehet pszichiátriai, szociológiai vagy politikai interpretációkról is.  Mindez egyszerre is érvényes lehet.  Egyvalamely közlés igen sokféle tartalmat hordozhat egy befogadó számára is.  Ilyen körülmények között az a törekvés, amely „a” tartalmat kívánja elemezni a kommunikációban, tudományos szempontból nem állja meg a helyét. - célja könyvtári szempontból:  Ha elfogadjuk Krippendorff érveit, akkor sohasem „a” tartalmat fogjuk közvetíteni, hanem mindig egy aktuális rendszerben – nevezzük ezt információs rendszernek – tartalomnak tekinthető szövegjelentést.  Abban a pillanatban, hogy más információs rendszerbe kerül a szöveg, adott esetben teljesen más is lehet a „tartalom” tartalma.  Ezen a gondolatmeneten tovább haladva kell tehát meggondolni az információs rendszerek közötti adatcserének, egymás elemzései kölcsönös felhasználásának a problematikáját. IV. Természetes nyelven alapú osztályozási és indexelési eljárások - Az ismérvek egyértelmű jelölése a kulcstényező - a nyelvi sokszínűségből eredő bizonytalanságokat ki kell küszöbölni (homonímia, szinonímia stb.). - A téma egyediségének, újdonságának felmutatására lehetőséget ad.
  • 6. - Az ismérvek összefüggéseinek (tematikai, logikai) jelzésére a szótárban kiépített utalórendszer szolgál. - Az indexelés szolgálja az egyedi ismérvek leírását. - A nyelvi alapú osztályozás során a dokumentumok információtartalmát valamely – természetes nyelvhez hasonló – nyelv segítségével írják le. - A nyelvi alapú osztályozási rendszer rendelkezik a nyelvre jellemző kritériumokkal: rendelkeznek a szavaknak, kifejezéseknek, szószerkezeteknek egy halmazával (szókincs- szókészlet), e kifejezésekhez jelentés kötődik (szemantika-jelentés), továbbá e kifejezések használati szabályaival arra vonatkozóan, hogyan lehet ezeket összekötni (szintaxis- nyelvtan, használati szabályok). - A hierarchikus információkereső nyelvek és az ezekre épülő katalógusok bonyolultsága és bizonyos előképzettséget feltételező használata, valamint a specifikusabb kifejezések szerinti keresési igények folytán szükségszerű elvárásként alakult ki a természetes nyelv használata információkereső nyelvként. A nyelvészeti irányzat legelső, legnagyobb hagyományokkal rendelkező osztályozási eljárásai a tárgyszavas rendszerek. - Előnye:  nem igényelnek előzetes felkészülést, vagyis az ilyen nyelvekre épülő katalógusokban vagy gépi rendszerekben „mindenki tud keresni”. - Hátránya:  a természetes nyelv eredeti állapotában nem, vagy kevéssé alkalmas információkeresés céljaira. Ezért szükség volt bizonyos megalkuvásokra, másrészt a természetes nyelvet bizonyos mértékig szabályozó vagy legalábbis kiegészítő megoldásokra. Ennek eredményeként létrejövő információkereső nyelveket mellérendelő nyelveknek, a gyakorlatban pedig tárgyszavas nyelveknek nevezik. Fő sajátosságuk a fogalmak közti értelmi, jelentésbeli összefüggések rögzítése, valamint, hogy ABC sorrendben lehet keresni. Negatív hatás: a nyelv sajátossága (sokszínű, változatos nyelv). Kulcsszó: a cím valamely szava (a névelőt kivéve). Léteznek stop vagy tiltott szavak (például azért, hogy ne lehessen keresni az „és”-re és a „hogy”-ra). - Kulcsszó problémái: (példák) o angol címe van, de magyarul keresek o nem a keresett témáról szól a könyv o csak szám a címben Szövegszó: a teljes szövegből (szöveg testből) származó szó. Kulcsszóból szabályozás útján lesz tárgyszó. Tárgyszó: szabályozott nyelvi eszköz (szabályozott információkereső nyelv). A dokumentum, információ, szöveg lényegének leírására kiválasztott tömör és egyértelmű kifejezés.  Szabályozott: (formailag és tartalmilag)  Formai:  mindig főnév  Ragozatlan főnév  Egyes számú főnév (kivétel gyűjtőnevek)  Tartalmi:  Tárgyszójegyzékbe gyűjtjük a tárgyszavakat  Tárgyszócikként jelennek mega szavak  Tárgyszó és kapcsolataiból áll  Természetes nyelven alapuló
  • 7.  Mellérendelő  Rugalmas, bővíthető  Biztosítja a több szempontú feldolgozás és visszakeresés lehetőségét Elvárások a tárgyszavas osztályozással szemben: - az adott szakterület teljes egészét lefedje a tárgyszókészlet hézagmentesen, de átfedésesen - a jelölt (fogalom vagy valóságos dolog) és a jel (szókép, nyelvi alak) között egyértelmű megfeleltetést kell biztosítania (a megnevezés mindenkinek ugyanazt a fogalmat takarja) A tárgyszavas osztályozás feladatai: - tárgyszavakkal leírja a dokumentumot, objektum lényeges vonásait - tárgyszavak rendje határozza meg a tárolási rendszer szerkezetét - alkalmas a keresőkérdések kifejezésére Szószerkezetek: többletjelentést hordoz az összetétel, mint maguk az elemek. TAUBÉ – UNITERM rendszer: egyszavas tárgyszórendszer: sok rossz összetétel, fölösleges találatok. Szabad tárgyszavazási eljárás: nincs kötött tárgyszójegyzék, 5-6 szóban leírják a tartalmat. Szinonimák esetében egyet kiválasztunk tárgyszónak, a többi nem tárgyszó (a többinél utalunk rá). Egységes szempont alapján döntünk például: hivatalos, többen használják. Kvázi szinonima: a szó nyelvtani értelmében nem szinonima csak hasonló kifejezés (pl.: jogszabály- törvény) Homonima: azonos alakú szavak (pl.: levél). Egy kifejezés hangalakja több jelentést hordoz. Ilyenkor értelmezőt kell használni. (pl.: daru- élőlény, daru- emelőszerkezet) A tárgyszavak közötti lehetséges kapcsolatok: H- helyette L – lásd LM – lásd még Példa Tárgyszó Burgonya H: nem tárgyszó H: krumpli Pityóka Nem tárgyszó Krumpli L: tárgyszó L: burgonya Pityóka Specifikus tárgyszó-elv: azt a kifejezést használjuk, amely az egyedi, specifikus szintet képviseli. A tárgyszó-rendszerekbe hivatkozásokat építenek be, hogy kielégítsék mind az egyedi, mind az átfogóbb témában keresők igényeit. Általában lefelé hivatkoznak, a generikustól a specifikus felé halad (a lásd még utalással, pl.: vallás LM: kereszténység). Specifikustól a generikusig: pl.: pénz LM: fizetőeszköz, pénz LM: hitelügy, pénz LM: hamisítás). A lásd még utalást mindig oda-vissza kell feltűntetni. A tárgyszójegyzék szótári és szakcsoportos részekből áll. A tárgyszójegyzéknek tartalmaznia kell a használati szabályzatot is (gyűjtőkör, felépítés, indexelés, stb.). A tárolási szerkezetét a tárgyszavak sorrendje határozza meg. A dokumentumok a tárgyszavak betűrendjében válnak kereshetővé. A legtöbb tárgyszórendszer igyekszik valamilyen struktúrát is bevinni a tárolási szerkezetébe. A tárgyszókatalógus lehet:  tiszta (mechanikus, betűrendes, klasszikus)
  • 8.  rendszerező (átfogóbb tematikus csoportokból áll)  Bokrosító: a tárgyszavak egy részét felbontja részfogalmakra, alárendelt fogalmakra és ezeket azután ismét formai jegyek alapján betűrendbe rendezi.  Alárendelő: a tárgyszavak elrendezése, tárolása fogalmi szintek kiépítésével történik. A 20. század 50-es éveitől jelentek meg az indexek: számítógéppel előállított tájékoztatási eszközök, valamint az indexművek: a dokumentumok név és tárgymutatóiból fejlődtek ki. A címindexeknél jelent meg először a tisztán természetes nyelvű osztályozás, amit kulcsszavas osztályozásnak nevezzük. Az indexek a dokumentumok tartalmát és egyéb jellemzőit leíró szóláncok- index tételek – rendezett gyűjteményei. Léteznek kulcsszó, ill. tárgyszó-indexek. Kulcsszó származhat a dokumentum címéből (címindex) vagy a dokumentum szövegéből. Utóbbi két legelterjedtebb típusa a KWIC és a KWOC. Kulcsszóindex: a tartalomjegyzékekben szereplő cikk címekből index (a nyomtatott folyóiratok világa) kétféle típusa: 1. KWIC = Key word in context Minden szónál betűrendben lehet keresni. 2. KWOC = Key word out of context Előre ki van emelve a keresett szó. Permutált tárgyi index: a besorolás, elérés kérdését a tárgyszólánc elemeinek ciklikus permutációjával oldják meg. Az első helyen álló tárgyszót mindig követi a tárgyszólánc többi eleme is. Lánceljárásos tárgyi index: a lánc elemei különböző fogalmi szinteken helyezkednek el. A tárgyszavak rendezése a specifikustól a generikus felé haladó sorrendben. Az első helyre kerülő elem után mindig csak az eredetileg is utána következő elemeket adjuk meg. Ma már ritkán alkalmazzák. PRECIS (preserved context indexing system=szövegösszefüggést megtartó indexelési rendszer). D. Austin dolgozta ki. A PRECIS grammatikai szabályok összessége. Első lépésként megalkotják a dokumentum lényegét leíró mondatot. Majd az egyes szavaknak a mondatban betöltött szerepét egy speciális jelrendszer segítségével rögzítjük. Végterméke egy számítógéppel ellátott permutált index. A permutálás során az osztályozási kifejezések sorrendje mindig megtartja a természetes nyelvi mondat szórendjét. V. Szöveges ismertetők, tartalmi összefoglalók (annotáció, kivonat, referátum stb.) 1) Annotáció  Rövid terjedelmű ismertetés, amely a dokumentumot jellemzi, a mű tartalmára, szerzőjére, rendeltetésére, formájára, keletkezési körülményeire, vagy egyéb sajátosságaira vonatkozik.  Általában a bibliográfiai adatok után következik megjegyzés formájában.  Segíti annak eldöntését, hogy az eredeti dokumentum releváns vagy sem.  Ismertető vagy ajánló jellegű lehet, tartalmazhat ítéletet is.  Nem kell megfelelnie a szövegszerűség valamennyi kritériumának. 2) Recenzió  Röviden leírja a szöveg tartalmát, de kifejezi a recenzor véleményét is.
  • 9.  Nem kritériuma az objektivitás.  Fontos eleme az értékelés.  Célja elsősorban a figyelemfelkeltés. 3) Kivonat  Az elsődleges dokumentumból vett részek szó szerinti, átalakítás nélküli kiemelése.  Csak olyan mondatokat, kifejezéseket használ, amelyek az elsődleges dokumentumban is előfordulnak.  Előállítása viszonylag könnyen automatizálható.  Az eredeti dokumentummal megegyező nyelven kell készülnie. 4) Összefoglalás  Nem önálló műfaj  Állhat akár az eredeti szöveg végén, mintegy annak részeként, de más szövegekbe ágyazva is.  Célja nem az, hogy az olvasónak segítsen az eredeti szöveg relevanciájának eldöntésében, sokkal inkább az összefoglalás és a szöveg elhelyezése a kutatási eredmények rendszerében. 5) Témadokumentáció  Egy adott témára vonatkozó dokumentumok kivonatainak gyűjteménye.  Válogat a téma irodalmából, és annak minden fontos elemét feldolgozza.  Nem csak az olvasásra, de a keresésre fordított időt is lerövidíti. 6) Szakirodalmi szemle  Önálló szerkezetben foglalja össze a témára vonatkozó valamennyi lényeges információt, több dokumentum együttes feldolgozásával.  A legmagasabb szintű szolgáltatások egyike. 7) Referátum  A dokumentum (vagy része) tartalmának – a legfontosabb adatokra, tényekre és következtetésekre kiterjedő – olyan rövid ismertetése, amely felhívja a figyelmet az új ismeretekre, és lehetővé teszi annak eldöntését, hogy célszerű-e tanulmányozni a dokumentumot.  A referátum természetes nyelvi, önállóan is megálló szöveg, amely megfelel a szövegszerűség kritériumainak (kohézió, koherencia, szándékoltság, elfogadhatóság, hírérték, helyzetszerűség, intertextualitás)  A referátum írott szöveg, amely különféle hordozókon jelenhet meg.  A referátum másodlagos dokumentum.  A referátum információs célokra létrehozott szöveg. VI. Tezaurusz - A szemantikai információkereső nyelvek lexikai egységeit („tárgyszavait”), vagyis a valamely fogalom leírására, képviseletére kiválasztott szavakat vagy kifejezéseket deszkriptoroknak, szótáraikat pedig tezauruszoknak nevezzük. - Az információs tezaurusz, mélyebb feltárást tesz lehetővé. Mely egy-egy szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható szótára, amely feltünteti a fogalmak közötti legfontosabb logikai kapcsolatokat.
  • 10. - Alapvető követelmény a tezaurusszal szemben, hogy az adott szakterület valamennyi lényeges fogalmát tartalmazza, a szakterület teljes lefedését biztosítsa, és bővíthető is legyen. - A tezaurusz részei: o deszkriptor,(L): A deszkriptor az információk leírására és keresésére közvetlenül alkalmazható. A deszkriptor általában egyes számú főnév, kivéve gyűjtőnevek, illetve többes számú főnév, ha az jelentésében eltér az egyes számú alaktól. A deszkriptor lehet önmagában álló szó, összetett szó, több szóból álló kifejezés.(Kerüljük az invertálást!) o o nemdeszkriptor,(H): A nemdeszkriptor a deszkriptor szinonim kifejezése, mely az információk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe vételével használható. o reláció: A relációk kimunkálása kötelező (ebben különbözik más osztályozási rendszerektől). - A tezaurusz felépítése: o Bevezetés, o Főrész, o Jelentéskörök szerinti rész, o hierarchikus rész, o grafikus rész, o betűrendes mutatókkal kiegészülhet A Bevezetésben feltüntetjük a tezaurusz célját és felhasználási területét. Leírjuk a készítési módját, a mennyiségi jellemzőit és a javításának, módosításának módját. A főrész deszkriptor- és nemdeszkriptorcikkekből áll betűrendes elrendezésben. A deszkriptorcikk a vezérdeszkriptorból és a vele közvetlen kapcsolatban álló deszkriptorokból épül fel, illetve feltünteti a kapcsolat jellegét is. A nemdeszkriptorcikk a nemdeszkriptorból és a helyette álló deszkriptorból áll. A jelentéskörök szerinti rész kidolgozása azt a célt szolgálja, hogy a tartalmilag összetartozó deszkriptorokat egy helyre gyűjtsük össze. Egy-egy átfogó fogalom alatt betűrendben megadjuk a jelentés szerint hozzátartozó deszkriptorokat. A hierarchikus rész célja, hogy a relációtípusokat kiemelve, kiépítse a deszkriptorok közti teljes hierarchiát az általános fogalomból kiindulva a specifikusig. Épülhet fogalmi hierarchiára (alá- fölérendeltség), de létrehozható az egész-rész szerkezeti reláció alapján. (Tranzitív relációk) A grafikus rész a tezauruszban feltárt ismeretág, szakterület legfontosabb fogalmait és azok relációit grafikus ábrákban mutatja be. Nem kötelező A betűrendes mutatót akkor kell alkalmazni, amikor valami kimaradt a főrészből.) Szinonimának tekinthető az a kifejezés, amely maradéktalanul helyettesíti a másikat. Tezauruszban szinonimaként kezeljük az idegen nyelvű kifejezést és a magyar megfelelőjét, a tudományos és köznapi megnevezéseket, a fogalom különböző alakváltozatait, a fogalom rövid és teljes alakját, illetve a kvázi szinonimákat (a szó nyelvtani értelmében nem szinonimák). Szinonimák jelölése: L (lásd), H (helyettesíti) utalókkal. Homonimák: a többjelentésű szavak jelentésbeli megkülönböztetésére értelmezőt használunk: Pl.: TOLL (íróeszköz) TOLL (madártoll)
  • 11. Szócikk: – a szabványok mögött ott áll mindig egy jegyzék (pl.: ETO mögött a táblázatok) – a szó a hozzá kapcsolódó szavakkal jelenik megtárgyszócikk – a szinonimák közül egyet kell kiválasztani tárgyszónak, a többi nem tárgyszó – egységes szempontot kell találni – attól függ, hogy milyen közönség használja – pl.: Burgonya H: krumpli Krumpli L: burgonya TEZAURUSZ-RELÁCIÓK: A RELÁCIÓK MINDIG KÉTIRÁNYÚAK!!! – ALÁ-FÖLÉRENDELTSÉG: Ha A fogalom teljes terjedelmében beletartozik B fogalomba, akkor azt mondjuk, hogy A alárendeltje(a) (faja, speciese) B-nek. Az alárendelt fogalom tartalma gazdagabb, több ismertetőjegyet tartalmaz, mint a fölérendeltje(b), de terjedelme kisebb. Mindig csak a közvetlen alá- ill. fölérendeltet adjuk meg. Egy deszkriptornak lehet több alá- és fölérendeltje különböző szempontok szerint. – EGÉSZ-RÉSZ: Az egész-rész reláció a fogalmakban általánosított tárgyak, objektumok fizikai, szerkezeti kapcsolata. A rész(p) nem rendelkezik azokkal a tartalmi jegyekkel, mint az egész(T), az egész pedig mindig több mint részeinek összessége. Mindig csak a közvetlen részt ill. egészet adjuk meg. Egy deszkriptornak lehet több része és egésze különböző szempontok szerint. – OK-OKOZAT, FELTÉTEL ÉS ELŐFELTÉTEL: Az ok, előfeltétel( E), ezt csak olyankor használjuk, mikor egyértelmű a mi a következmény, okozat( R)=rezultáns – ROKON KAPCSOLATOK (x) Gyűjtőfogalom, több különböző kapcsolattípust foglal magában. Ezek a kapcsolatok lehetnek szimmetrikusak (ellentét, hasonlóság, korreláció, stb.), és asszimetrikusak (rendeltetés, eszköz, produktum, tulajdonság, stb.) Az adatbázisokról – csak segítség, nem kell szó szerint tudni A jó adatbázis hatóköre - Ki kell elégítenie egyéni használó, illetve egy könyvtár vagy intézmény használóinak érdeklődését. Pl.: speciális témák: Climbing Database (hegymászók adatbázisa) és a kiváló Biographies of Women Mathematicians (matematikusnők életrajzai) - El kell róla dönteni, hogy általános vagy sem: Vannak problémák az általános jellegű adatbázisokkal. Mert kiderül, hogy mégsem olyan általános mégsem található benne minden tudomány. - Megfelelő keresési szűrők lehetnek: o Téma/tárgy szerinti keresés, nyelv és dokumentumtípus szerinti feltártság, feltárt időtartományt, címindexek, kulcsszó szerinti keresés o Egyáltalán nem mindegy, hogy egy magát informatikai adatbázisnak definiáló tartalomszolgáltató témáiban, tárgy szavaiban és kulcsszavaiban szerepelnek szakkifejezések vagy csak helyenként, vagy hogy a szakkifejezések elavultak e vagy sem. Ugyancsak figyelni kell az időtartományra, valószínűleg nem lesz kurrens azaz orvostudományi vagy informatikai adatbázis, melyben a publikációk az 1990-es évekből származnak. o Témák keresése esetében nem mindegy, hogy melyik nyelvterületen, melyik szót használjuk. Az amerikai szerzők elsődlegesen a postpartum depression kifejezést
  • 12. használják, európai és brit nemzetközösségből származó szerzők gyakran a puerperal depression kifejezést preferálják. Ebből következően az előbbi kifejezés használata előnyös a MEDLINE számára az EMBASE-zel szemben (amelynek szélesebb az európai forrásbázisa), a második fogalom esetén fordított a helyzet. Az adatbázis dimenziói Méret: A legnagyobb nem egyenlő a legjobbal. Ami számunkra fontos egy példával lehet elmondani: A legnagyobb orvosi adatbázis, amely nem dolgozza fel Kelet-Ázsia folyóiratait a megfelelő mértékben, nem lehet a legjobb annak a számára, aki ennek a régiónak a fejlődéséről vagy klinikai jelentéseiről keres információt. Időbeliség: Retrospektivitás jó lehet annak, aki humántudományokkal esetleg társadalomtudományokkal foglalkozik, rossz egy természettudósnak, orvosnak, informatikusnak, műszaki szakembernek. Mélység: Pusztán az, hogy egyes folyóiratok jelen vannak az adatbázisban, nem garantálja, hogy megfelelő mértékben fel is tárják azokat. Problémák: elkezdik a feltárását a folyóiratnak, de nem fejezik be. A folyóirat közben nevet vált, de az adatbázis készítői nem jelölik az eredeti nevével történő utolsó kiadását. Hozzájutási nehézségekre való hivatkozás: drága a folyóirat, túl messziről érkezik, késve kapják meg. Frissesség: Az adatbázisok frissessége arra utal, hogy a primer dokumentumok megjelenése után milyen gyorsan válik elérhetővé egy rekord CD-ROM vagy online adatbázisban. Azok a webes adatbázisok, amelyeket közvetlenül a fájlok előállítói szolgáltatnak, drámai módon növelik az adatbázisok naprakészségét, mivel a közvetítő, az adatbázis kiadója kiiktatódik. Napilap adatbázisok  teljes szövegű változat valószínűleg közvetlenül bekerül az online szolgáltatásba, mielőtt a nyomtatott változatokat elkezdenék kinyomtatni. Azoknál az adatbázisoknál, amelyek indexkifejezéseket adnak az újságcikkek rekordjaihoz vagy referátumokat szolgáltatnak (mint például a Bell & Howell cég Newspaper Abstracts Daily című szolgáltatása), valószínűleg nagyobb a lemaradás. Frissítések mennyisége Kurrens információ iránti igény Egyéb tényezők Pontosság Az adatbázisból visszakeresett információk pontosságát gyakran természetesnek veszik. A helyesírási hibák és elírások  pontatlanságok legáltalánosabb típusai. Pl.: Szerzői nevek és címjegyzékek
  • 13. A nevek esetében még a kicsit szokatlan név is problémát okozhat: előtagok (pl. von), szokatlan nevek, az előtagok hátravetése szétszórja nevüket az indexben. Teljesség Egy adott adatbázisban szereplő rekordokról kereshető információk mennyire teljesek vagy hiányosak. Bár a sok adatelem szerint lehet keresni, de a nagyméretű kihagyás nem vezet eredményhez. Basch (1990a) állapítja meg, hogy a kihagyások vagy az üresen hagyott mezők gyakran eredményezik azt, hogy a kereső nem jut hozzá releváns rekordokhoz. Pl.: Az ERIC-ben például nincs figyelmeztetés arra, hogy a dokumentumtípus mezőt a rekordok 28%-ában kihagyták, de van egy megjegyzés arról, hogy a nyelvet csak 1979-től adták meg. Nagyon kevés olyan adatbázis van, amely legalább világossá teszi az adatelemek kihagyását a keresési folyamat során. A formátum és a tartalom következetessége - Azért fontos a következetesség, mert ha nem mindig ugyan úgy használjuk a rövidítéseket vagy jelzőket, akkor megnehezíthetjük vele a felhasználó keresését és a releváns találatok száma sem lesz egyértelmű. - Példák o ERIC adatbázis három különböző formát használ U. S. News & World Report hetilapból felvett 37 cikkhez. (& helyett and, feloldja a U.S.-t stb.) - A következetlenségek abból is származhatnak, hogy a különböző primer forrásoknak eltérő a gyakorlatuk - például a szerzők második vagy harmadik keresztnevének rövidítésére. Maguk a szerzők is következetlenül használhatták őket a különböző publikációkban. - A folyóiratcímeket még a szerzői neveknél is következetlenebbül alkalmazzák a változatok sokféle lehetősége miatt. o Pl.: Ezek a következők:  A kiadó testületek rövidítéseinek és teljesen kiírt változatainak használata,  A címben szereplő szavak közül soknak a rövidítése, az alcímek ötletszerű felvétele és kihagyása,  Az and és and of következetlen kihagyása, helyettesítésük az & és a kötőjel (-) karakterekkel, nem említve a kiadás helyével való kiegészítést, hogy megkülönböztessék egymástól az egyébként teljesen azonos folyóiratcímeket A referátumok minősége - A referátum az eredeti cikk rövid (150-250 szavas) összefoglalását jelenti. - A jó referátumok segíthetnek a használóknak annak kiválasztásában, hogy melyik dokumentumot olvassák el a maga teljességében. - 3 típus: csak ismétlés o Indikatív referátum: utalhat a forrásdokumentumok (folyóiratcikkek, szabadalmi leírások, kongresszusi meghallgatások, könyvek, filmek) tartalmára. o Informatív, amely közvetlenül bemutatja a forrás specifikus információinak egy részét, összefoglalja a tartalmat.
  • 14. o Kritikai referátum, amely az összefoglalást a referáló, a szakterület specialistája értékelő és kritikai kommentárjaival egészíti ki. - A jó referátumok kitűnő szűrők lehetnek a keresés folyamatában. A tartalmi reprezentáció eszközeinek vizsgálati szempontjai Mennyiség - a tartalmi feltáró eszközök száma Az ismérvek forrása Jelölés A tartalmi feltáró ismérvek specifikussága Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok Mennyiség - a tartalmi feltáró eszközök száma (A tartalomra utaló információt hordoz- csak magamnak) Az ismérvek lehetnek: - Függetlenek, amelyek önállóan szerepelnek (pl. deszkriptorok, osztályozási jelzetek, tárgyszavak, kiemelt tartalmi jellemzők, dokumentumtípusok) - Függhetnek egy másik ismérvtől - módosítják annak jelentését, illetve további információkat adnak a kontextusra vonatkozóan (pl. súlyozás, minősítők, altárgyszavak). Az ismérvek forrása A tartalmat reprezentáló ismérvek: - dokumentum szövegéből (pl. első bekezdés, kulcsszó) - vagy külső forrásból származhatnak. o Külső forrás lehet: szótárak, tárgyszójegyzékek, tezauruszok, egyéb ellenőrzött listák, referátum Minél specifikusabb egy adatbázis, annál több ellenőrzött listát alkalmaz.  A kemény tudományoknál használják a legtöbb ellenőrzött szótárat. A teljes szövegű adatbázisok is szép számmal alkalmaznak szabályozott jegyzékeket. Jelölés Hogyan jelölik az egyes adatbázisok a tartalmi ismérveket? Kétféle jelölés: - Természetes nyelv közvetlenül informál a témáról - Kód megmutatja az ismérv rendszerben elfoglalt helyét, s közvetlen, szisztematikus keresést tesz lehetővé A tartalmi feltáró ismérvek specifikussága Beszélhetünk generikus (átfogó fogalmi kategóriákat lefedő) és specifikus (a téma egyediségét megadó) eszközökről. A kettő között nehéz meghúzni a határvonalat, csak egy adatbázison belül lehet eldönteni egy-egy ismérvről, hogy generikus-e vagy specifikus.
  • 15. Adatbázisokban a tartalmi ismérvek külön adatmezőkben jelenhetnek meg: - Ilyen kiemelt tartalmi elemek lehetnek például a személynevek, földrajzi nevek, anyagnevek, kémiai elnevezések, speciális jellemzők. A generikus kategóriák származhatnak osztályozásból, vagy lehetnek tárgyszó jellegűek. Specifikus osztályozást csak ritkán alkalmaznak, ilyeneket leginkább a kemény tudományok adatbázisainak némelyikében találni. A kemény tudományok adatbázisaiban a specifikus tárgyszavazás és a kiemelt ismérvek a legjellemzőbbek. A puha tudományoknál a specifikus leírás (deszkriptorok, szabad tárgyszavak) bizonyulnak a leghatékonyabb tartalmi feltáró eszközöknek. Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok Hogyan tükrözi az adatbázisok feltáró rendszere az eredeti szövegbeli kontextust? - A legáltalánosabb a szöveges ismertetők, összefoglalók alkalmazása (pl. referátumok, kivonatok). A téma ismérvei és azok forrásbeli viszonyai természetes nyelvi kontextusban jelennek meg. - Ugyanezen az elven alapul az az eljárás, amelyben kulcsszóként mondatszerű kifejezéseket adnak meg (key phrase). - Egy másik lehetőség, hogy az ismérveket aszerint csoportosítjuk, mennyire meghatározóak, mennyire hangsúlyosak az adott forrásban. Az ismérvek súlyozása nagyon kedvelt a bibliográfiai adatbázisokban (pl. major/minor descriptors). EGY VÁLASZTOTT ADATBÁZIS ELEMZÉSE!!!! Szempontok 1. Milyen témaköröket dolgoz fel az adatbázis? 2. Milyen időhatárok közötti dokumentumok találhatók meg az adatbázisban? 3. Melyek azok az adatmezők, amelyek tartalomra utaló információkat hordoznak? Hogyan lehet ezekben a mezőkben keresni? 4. Jellemezze az egyes tartalmi feltáró eszközöket az IKNY-ek tanult tipológiája szerint. Tartalmi informáci ót hordozó adatmező Szabályo- zottság Osztályozási módszer Mélység szerkezet igen nem hierar- chikus mellé- rendelő individu- alizáló genera- lizáló prekoor -dinált posztkoo r-dinált 5. Értékelje az adatbázis tartalmi feltárását saját keresési tapasztalatai alapján.