Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

HG-1 TREEBANK f-structure

539 views

Published on

http://hungram.unideb.hu

 • Be the first to comment

 • Be the first to like this

HG-1 TREEBANK f-structure

 1. 1. HG-1 Treebank demóA funkcionális szerkezet jellemzői
 2. 2. 1. bevezető megjegyzések általános elméleti keretünk a Lexikai- Funkcionális Grammatika (LFG) alternatív, nemtranszformációs generatív modell minden jólformált mondathoz két párhuzamos szintaktikai reprezentációt rendel (tehát reprezentációs és nem derivációs természetű)  összetevős szerkezetet (ö-szerkezetet, vö. c-structure)  funkcionális szerkezetet (f-szerkezetet, vö. f-structure)
 3. 3. 2. bevezető megjegyzések az összetevős szerkezet a mondat „felszíni”, nyelvspecifikus jellemzőit ábrázolja: pl. a szórendi viszonyokat, a különböző frázisok elhelyezkedését a funkcionális szerkezet a mondat nyelvfüggetlen tulajdonságait ragadja meg: pl. az általános nyelvtani viszonyokat, legfőképpen a grammatikai funkciókat (alany, tárgy stb.) a következő dián egy egyszerű angol-magyar példa szemlélteti, hogy az ö-szerkezetek különbözősége ellenére (ugyanis az angolban elöljárószós, míg a magyarban névutós kifejezés található) a funkcionális jellemzőket ábrázoló f- szerkezet szintjén azonos reprezentáció szerepel
 4. 4. 3. egy elöljárószós/névutós példa PP különböző ö-szerkezetek PPPr NP NP Po Det N Det Nnear the box a doboz mellett PRED ‘near/mellett <(OBJ)>’ OBJ PRED ‘box/doboz’ DEF + PERS 3 azonos f-szerkezet NUM sg
 5. 5. 4. leképezési kapcsolat a két szerkezet között a következő dia az előző magyar példa felhasználásával szemlélteti, hogy az ö-szerkezet és az f-szerkezet közötti megfeleltetési (leképezési) kapcsolatot az ö-szerkezetben található csomópontokhoz társított, legtöbbször egyenlőségekkel kifejezett funkcionális annotációk biztosítják a két alapvetően egyenlőségfajta a következő ↑=↓ -- ez a funkcionális fejet jelöli: azt kódolja, hogy az anya csomópont funkcionális jegyei megegyeznek az adott csomópont jegyeivel (↑GF)=↓ -- ez azt fejezi ki, hogy az anya összetevő funkcionális szerkezetében az adott csomópont milyen grammatikai funkciót tölt be, pl. a következő dián ez szerepel: (↑OBJ)=↓, és azt kódolja, hogy a PP funkcionális szerkezetében az NP tárgyi funkciójú
 6. 6. 5. leképezési kapcsolat a két szerkezet között PP PRED ‘mellett <(OBJ)>’ (↑OBJ)=↓ ↑=↓ OBJ PRED ‘doboz’ NP P PERS 3 (↑PRED) = NUM sg ↑=↓ ↑=↓ ‘mellett <(OBJ)>’ DEF + Det N(↑DEF)=+ (↑PRED)=‘doboz’ (↑PERS)=3 további annotációk: (↑NUM)=sg (↑DEF)=+ a határozottság jegye (↑PRED)= ‘ … ’ a szó jelentése a doboz mellett (↑PERS)=3 a harmadik személy jegye (↑NUM)=sg az egyes szám jegye
 7. 7. 6. leképezési kapcsolat a két szerkezet között az előző diákon bemutatott funkcionális annotációk az LFG elméleti keretében végzett elemzésekben megjelennek egyrészt az ö- szerkezeteket létrehozó (ún. frázisstruktúra-szabályokban, más néven: újraíró szabályokban), másrészt az ö-szerkezeti reprezentációkban az LFG-nek az általunk alkalmazott implementációs platformján, az XLE-ben (Xerox Linguistic Environment = Xerox Nyelvészeti Környezet), az annotációk csak a frázisstruktúra-szabályokban vannak kódolva, és a jobb áttekinthetőség érdekében nincsenek külön feltüntetve az ö-szerkezetben is (ez tehát csupán egy megjelenítésbeli különbség mindenféle lényegi relevancia nélkül)
 8. 8. 7. a funkcionális szerkezet alapvető jellemzőia korábban ismertetetteken kívül az alábbi tulajdonságok a kiemeltenfontosak az f-szerkezeteket mindig szögletes zárójelek között ábrázoljuk ezek a szerkezetek lényegében attribútum—érték párokból álló mátrixok egy-egy ilyen párban mindig a bal oldali elem az attribútum és a jobb oldali az érték mivel az f-szerkezet nyelvtani relációkat kódol attribútum—érték párok mátrixaként, ezeknek a pároknak a sorrendje teljes mértékben tetszőleges: mindegy, hogy melyik van alul vagy felül egy attribútumnak lehet atomi értéke, pl. az 5. dián szereplő NUM, PERS és DEF attribútumoknak atomi értékeik vannak, rendre: sg, 3 és +
 9. 9. 8. a funkcionális szerkezet alapvető jellemzői más attribútumoknak komplex értékük van, ami azt jelenti, hogy adott érték maga egy vagy több újabb, „beágyazott” attribútum— érték pár, pl. az 5. dián ilyen az OBJ attribútum (a tárgyi funkció), amelynek értékében van egy PRED attribútum (értéke: a főnév jelentése), valamint az előző pontban említett három atomi értékű attribútum: NUM, PERS és DEF tekintettel arra, hogy a funkcionális fej jelölésnek (↑=↓) megfelelően az anya csomópontnak és a fej csomópontnak megegyeznek a funkcionális jegyei, a két elem f-szerkezete egybeesik, megegyezik, például az 5. dián az OBJ attribútum értéke (a négy attribútum— érték pár) a főnévi fejhez (N) és a teljes főnévi csoporthoz (NP) is tartozó f-szerkezetrész
 10. 10. 9. a leggyakoribb attribútumokegy predikátum által a vonzataihoz rendelt grammatikaifunkciók, amelyek a predikátum argumentumszerkezetében < és >között vannak megadva: pl. az üt lexikai tétele: (PRED)=‘üt<(SUBJ)(OBJ)>’SUBJ alanyOBJ tárgyOBL határozói vonzatXCOMP jellegzetesen főnévi igenévvel kifejezett propozicionális argumentum funkciójaCOMP beágyazott, ragozott igék tartalmazó tagmondat funkciójaPREDLINK a létige bizonyos, kétargumentumúnak felfogott használatában a második argumentum funkciójaPOSS a főnévi csoporton belül a birtokos összetevő funkciója
 11. 11. 10. a leggyakoribb attribútumoknem vonzatfunkciókADJUNCT adjunktum (=szabad módosító), jellegzetesen ilyen funkciójúak például a hely- és időviszonyokat kifejező összetevők tekintettel arra, hogy ilyen funkciójú összetevőkből elvileg tetszőlegesen sok lehet, az f-szerkezeti reprezentációkban halmazként szokás szerepeltetni őket egymás alatt, kapcsos zárójelek {…} közöttFOCUS* a fókusz diskurzusfunkció új információt hordoz, jellemzően valamilyen elem (kizáró) azonosítását fejezi kiTOPIC* a topik diskurzusfunkció ismert információt hordoz, a mondat „logikai alanyát” fejezi ki, amelyről a mondat állítása szól mivel egynél több topik is lehet egy mondatban, a topikok is kapcsos zárójelek közé kerülnek az f-szerkezetben*megjegyzés: csak olyan összetevő kaphat diskurzusfunkciót, amelynek vanegyéb funkciója is (tehát vonzat vagy adjunktum)
 12. 12. 11. a leggyakoribb attribútumokATTRIB magyarázat ATTRIB magyarázatNUM szám PRT-FORM az igekötő alakjaCASE eset TENSE igeidőPERS személy NSEM a főnév szemantikai jellemzőjePRED jelentés NSYN a főnév szintaktikai jellemzőjeNTYPE főnévtípus TNS-ASP igeidő-aspektusVTYPE igetípus MOOD igemódPRON-TYPE névmástípus CHECK bizonyos jegy meglétének ellenőrzéseADV-TYPE határozószó-típus COORD-FORM mellérendelés esetében a kötőszó alakjaDEF határozottság
 13. 13. 12. általános megjegyzések a 14. dia bemutat egy XLE-s f-szerkezeti reprezentációt, amelyen a felsorolt attribútumok közül számos szerepel, ezen túlmenően az alábbi általános jellemzőket is szemlélteti a szögletes zárójelek előtti számok az adott f-szerkezetnek megfelelő ö-szerkezeti csomópontok számai – ily módon azonosítjuk, hogy mely csomóponthoz/frázishoz mely f- szerkezet(rész) tartozik a predikátumok argumentumszerkezetében a < és > között nem az argumentumok grammatikai funkciója van feltüntetve, hanem az adott argumentum számmal ellátott „feje”, és ugyanez a szám jelenik meg a releváns grammatikai funkció értékét jelölő szögletes zárójel előtt – pl. a 14. dián az iszik ige első argumentuma a 2: varjú, és a SUBJ attribútum értéke előtt ugyanez a szám szerepel, innen tudjuk, hogy a varjú az iszik alanya, ráadásul topik is
 14. 14. 13. általános megjegyzések a 14. dián a SUBJ értékében a CASE nom, DEF +, NUM sg, PERS 3 attribútum—érték párok egy sorban szerepelnek, de ez csupán a reprezentáció helytakarékosságát elősegítő XLE-s ábrázolási konvenció (egyébként az illető párokat egymás alá kellene írni) egy főnév(i csoport) lehet névmás is: ilyenkor a PRED ‘pro’ jelölés használandó a mellérendelt tagmondatokat is halmazként, kapcsos zárójelek között tüntetjük fel a 14. dián a második tagmondat igéjének az ábrázolása: el#repült – itt a # szimbólum azt jelzi, hogy a magyarban az igekötő és az ige a mondatban (ö-szerkezetben) különválhatnak egymástól (vö. a varjú nem repült tegnap el), de az XLE az f-szerkezetben „összefűzi” őket
 15. 15. 14. egy f-szerkezeti minta

×