SlideShare a Scribd company logo
05/2005
Κωνσταντίνος Καληµέρης
ΠΜΣΠΜΣ ““ΤεχνογλωσσίαΤεχνογλωσσία ΙΙΙΙ””
ΜΕΤΑΠΤΥΧΙΑΚΗΜΕΤΑΠΤΥΧΙΑΚΗ ∆ΙΠΛ ΜΑΤΙΚΗ∆ΙΠΛ ΜΑΤΙΚΗ ΕΡΓΑΣΙΑΕΡΓΑΣΙΑ
Μελέτη εξαγωγής φωνολογικής πληροφορίας από τον ΕΘΕΓ
µε σκοπό την παραγωγή Ελαχίστων Ζευγών και
τον υπολογισµό Λειτουργικών Φορτίων
για την Νέα Ελληνική.
ΕπιβλέποντεςΕπιβλέποντες ΚαθηγητέςΚαθηγητές::
Γεώργιος Καραγιάννης (ΕΜΠ, ΙΕΛ)
Γεώργιος Μικρός (ΕΚΠΑ)
05/2005
Κωνσταντίνος Καληµέρης
ΑφορµήΑφορµή γιαγια τηντην εργασίαεργασία
Το κρίσιµο ερώτηµα:
“Ποιοι και πόσοι είναι οι ήχοι που πραγµατικά επιτελούν έργο
διάκρισης µεταξύ σηµασιών στα πλαίσια της Νέας Ελληνικής;”
ή…
“Ποια και πόσα φωνήµατα πρέπει να θέσουµε για την Νέα Ελληνική
ώστε ταυτόχρονα
• να επιτύχουµε την θεωρητικά οικονοµικότερη λύση
• να σεβαστούµε τα δεδοµένα που προκύπτουν από την σύνθεση
και την χρήση του λεξιλογίου της γλώσσας;”
Οι απόψεις διίστανται: τα φωνήµατα της ΝΕ είναι…
30 (Σετάτος), 26 (Householder et al.), 23 (Mackridge / Φιλιππάκη),
20 (Newton / Holton et al.), 20 ή 24 ή 29 (Πετρούνιας)…
05/2005
Κωνσταντίνος Καληµέρης
ΒασικοίΒασικοί στόχοιστόχοι τηςτης εργασίαςεργασίας
Η εξερεύνηση δύο ερωτηµάτων:
1) “Γιατί διαφωνούν οι ερευνητές όσο αφορά το πόσα και ποια είναι τα
φωνήµατα της ΝΕ;”
2) “Θα µπορούσε το γλωσσικό υλικό που περιέχεται στον ΕΘΕΓ να
χρησιµοποιηθεί µελλοντικά για την άρση των σχετικών διαφωνιών
και, αν ναι, µε ποιόν τρόπο;”
Προετοιµασία για σχετική µελλοντική έρευνα:
3) Εξερεύνηση του θεωρητικού πλαισίου & ορισµός βασικών εννοιών.
4) Προεπεξεργασία του γλωσσικού υλικού που περιέχεται στον ΕΘΕΓ.
5) Εύρεση και αξιολόγηση των αυτόµατων εργαλείων εξαγωγής
φωνολογικής πληροφορίας από δεδοµένα γραπτής γλώσσας.
6) Ελάχιστα Ζεύγη & Λειτουργικά Φορτία: σε επόµενο στάδιο.
05/2005
Κωνσταντίνος Καληµέρης
ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (1)(1)
Γλώσσα: συµβολικό σύστηµα µετάδοσης πληροφορίας.
Λέξεις: σύµβολα = αντιστοιχίσεις ηχητικών σηµάτων και σηµασιών.
Σήµατα λέξεων: αλυσίδες στοιχειωδών ήχων.
Επίπεδο της άρθρωσης: αλυσίδες πραγµατικών ήχων (φθόγγων).
[ ᯀ + é + r + i ] = “χέρι”, [ x + a + r + á ] ☺ = “χαρά”
Ελάχιστη διαφορά (µεταξύ σηµάτων): ένας στοιχειώδης ήχος
∆ιαφορετικά σήµατα: [ p í r a ] [ b í r a ] [ f í r a ]
[ l í r a ] [ m í r a ] [ θ í r a ]
∆ιαφορετικές σηµασίες “εµπειρία”, “µπύρα”, “απώλεια βάρους”,
“λύρα”, “πεπρωµένο”, “αυλόπορτα”.
Οµοιότητα (µεταξύ σηµάτων): το φωνητικό πλαίσιο [ _ í r a ]
εναλλαγή φθόγγων αλλαγή σηµασίας
05/2005
Κωνσταντίνος Καληµέρης
ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (2)(2)
Φώνηµα: στοιχειώδης φορέας διαφοράς σηµασίας
Άρα, θέτουµε τα / p , b , f , l , m , θ / ως φωνήµατα της ΝΕ.
Ελάχιστο Ζεύγος: “δύο λέξεις τα σήµατα των οποίων έχουν την ίδια
συλλαβική δοµή, αλλά διαφέρουν κατά έναν ήχο στην ίδια θέση”:
C V΄ C V ΣΥΛΛΑΒΙΚΗ ∆ΟΜΗ
[ ᯀ í r a ] “χήρα”
[ f í r a ] “φύρα”
[ _ í r a ] Φ ΝΗΤΙΚΟ ΠΛΑΙΣΙΟ
Ερώτηµα: “Αφού τα [ᯀ] και [f] είναι φορείς διαφοράς σηµασίας,
εκτός των / p , b , f , l , m , θ /, θέτουµε και φώνηµα /ᯀ /; ”
Επίπεδο άρθρωσης: σήµατα = αλυσίδες πραγµατικών ήχων.
Τα σήµατα [ ᯀ é r i ] και [ x a r á ]: 6 διαφορετικοί φθόγγοι
05/2005
Κωνσταντίνος Καληµέρης
ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (3)(3)
Εγκέφαλος: “περιέχει” αφηρηµένους ήχους (φωνήµατα) και κανόνες.
Επίπεδο αντίληψης: σήµατα = αλυσίδες αφηρηµένων ήχων.
Οι φθόγγοι στο αυτί ερµηνεύονται ως φωνήµατα, βάσει κανόνων
αποκωδικοποίησης.
Τα φωνήµατα παράγονται στο στόµα ως φθόγγοι, βάσει κανόνων
κωδικοποίησης.
Τα σήµατα [ ᯀ é r i ] και [ x a r á ] παράγονται αντίστοιχα από τα
αφηρηµένα σήµατα / x é r i / και / x a r á / (5 διαφορ. φωνήµατα).
Κανόνας παραγωγής:
«Aν /x/ ακολουθείται από /i/ ή /e/, υλοποίησε /x/ ως [C].
Παντού αλλού, υλοποίησε /x/ ως [x]». (ουράνωση)
/ x é r i / [ ᯀ é r i ] , / x a r á / [ x a r á ]
05/2005
Κωνσταντίνος Καληµέρης
ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (4)(4)
• Φθόγγοι: υλοποιηµένα φωνήµατα
• Αλλόφωνα: υλικές παραλλαγές φωνήµατος: /x/ [x] ή [ᯀ]
• Συµπληρωµατική κατανοµή αλλοφώνων: «Που θα βρω το [ᯀ];»
«Εκεί όπου απαγορεύεται να βρω το [x] (πριν από /i/ ή /e/ )»
Τότε, πως είναι δυνατόν να βρίσκουµε ελάχιστα ζεύγη όπως
[ ᯀ ó n i ] ~ [ x ó n i ], [ ٍ a t í ] ~ [ ֙ a t í ], [ ْ ó ‫ׯ‬ o ] ~ [ n ó ‫ׯ‬ o ] ;
[ C V΄ C V ] ΣΥΛΛΑΒΙΚΗ ∆ΟΜΗ / C V V΄ C V /
[ ᯀ ó n i ] “χιόνι” / x i ó n i /
[ x ó n i ] “χώνει” / x ó n i /
/ C V΄ C V /
Τελικά, υποθέτουµε ελάχιστα ζεύγη επιφανείας για να “ανακαλύψουµε”
τα φωνήµατα της ΝΕ,
ή υποθέτουµε υποκείµενες συλλαβικές δοµές για να χαρακτηρίσουµε
ζεύγη φωνητικών λέξεων τύπου [abcd]~[abxd] ως ελάχιστα ή µη;
05/2005
Κωνσταντίνος Καληµέρης
ΒασικέςΒασικές ΑρχέςΑρχές αναπαράστασηςαναπαράστασης καικαι σύγκρισηςσύγκρισης λέξεωνλέξεων
1) Με χρήση των περιγραφικών δυνατοτήτων του IPA, παραγωγή
κατά το δυνατόν απλούστερων (όχι φωνολογικά “βεβαρηµένων”)
φθογγικών αναπαραστάσεων από τα ορθογραφικά δεδοµένα:
“χιόνι” [ᯀóni], και όχι [xióni, xjóni, x‫ܕ‬óni, x’óni, xóni].
2) Πρώτα: εύρεση, καταγραφή και µέτρηση όλων των ζευγών λέξεων
τύπου [abcd]~[abxd].
3) Μόνο τότε: χαρακτηρισµός κάθε ζεύγος τύπου [abcd]~[abxd] ως
“ελάχιστου” ή “µη-ελάχιστου”, κατόπιν σύγκρισής του µε όλα τα
υπόλοιπα ζεύγη του ιδίου τύπου.
Ερώτηµα: «Είναι το [xóni]~[ᯀóni] ελάχιστο ζεύγος;»
Αντερώτηµα: «Τα [x] και [ᯀ] αντιστοιχούν σε δύο διαφορετικά
φωνήµατα ή είναι αλλόφωνα του ίδιου φωνήµατος;»
Η συµβολή της έρευνάς µας:
Πόσα ζεύγη για τις αντιθέσεις [x ~ ?], [ᯀ ~ ?], [x ~ ᯀ];
05/2005
Κωνσταντίνος Καληµέρης
ΗΗ υποστήριξηυποστήριξη ενόςενός καταλόγουκαταλόγου φωνηµάτωνφωνηµάτων γιαγια τηντην ΝΕΝΕ
Απαντήσεις στα ερωτήµατα:
1) Πως κατανέµονται οι διάφοροι φθόγγοι στο σύνολο των λέξεων του
λεξιλογίου της ΝΕ;
2) Ποια είναι τα περιβάλλοντα όπου προκύπτουν οι διάφοροι φθόγγοι
της ΝΕ;
Τι χρειαζόµαστε για να απαντήσουµε;
I. Ένα όσο το δυνατόν µεγαλύτερο και αντιπροσωπευτικότερο δείγµα
του λεξιλογίου της ΝΕ.
II. Την αναπαράσταση της τυπικής εκφοράς κάθε λέξης του δείγµατος
σε φωνητικό αλφάβητο ΙΡΑ.
III. Όλους τους δυνατούς συνδυασµούς των
φωνητικών αναπαραστάσεων [kupí] [pináo] [stílos]
σε “Ελάχιστα” Ζεύγη: [kutí] [ponáo] [stólos]
05/2005
Κωνσταντίνος Καληµέρης
ΙΙ.. ΠρωτογενήΠρωτογενή ∆εδοµένα∆εδοµένα:: ΠηγέςΠηγές && ΦίλτραΦίλτρα
“Εθνικός Θησαυρός της Ελληνικής Γλώσσας” (ΕΘΕΓ)
- Ηλεκτρονικό Σώµα Κειµένων γενικής γλώσσας του Ι.Ε.Λ.
- 34 εκατοµµύρια “λέξεις” (συµβολοσειρές, έξοδος tokenizer).
- 536.000 διαφορετικές “λέξεις” (µοναδικοί τύποι).
Φίλτρο 1: SQL Queries: έξω συµβολοσειρές που περιέχουν
- Λατινικούς χαρακτήρες
- Σηµεία στίξης
- Αριθµητικά
- Ειδικά σύµβολα
- Υπόλοιπο: 393.000 Ελληνικές αλφαβητικές συµβολοσειρές.
Φίλτρο 2: Μορφολογικό Λεξικό του Ι.Ε.Λ και “Συµφωνία ”.
- Ανορθόγραφες, non-words, ΟΚ αλλά µη-καταγεγραµµένες.
- Υπόλοιπο: 212.000 αποδεκτοί κλιτοί τύποι (όχι λήµµατα).
05/2005
Κωνσταντίνος Καληµέρης
ΙΙ.. ΠρωτογενήΠρωτογενή ∆εδοµένα∆εδοµένα:: τοτο προφίλπροφίλ τουτου συνόλουσυνόλου
ΛΙΣΤΑ
ΜΟΝΑ∆ΙΚ Ν
ΤΥΠ Ν
Ν=536.113
ΜΣ=64
ΛΕΞΕΙΣ
ΚΕΙΜΕΝ Ν
ΕΘΕΓ
Ν=34.307.249
•Ελληνικά (προκριθέντα):
212.332 τύποι (39,61%, ΜΣ=141)
• Ελληνικά (απορριφθέντα):
180.707 τύποι (33,71%, ΜΣ=13)
• Λοιπά (απορριφθέντα):
143.074 τύποι (26,68%, ΜΣ=14)
• Ελληνικά (προκριθέντα):
29.965.338 λέξεις (87,34%)
• Ελληνικά (απορριφθέντα):
2.358.871 λέξεις (6,88%)
• Λοιπά (απορριφθέντα):
1.945.648 λέξεις (5,67%)
05/2005
Κωνσταντίνος Καληµέρης
ΙΙ.. ΠρωτογενήΠρωτογενή ∆εδοµένα∆εδοµένα:: τοτο προφίλπροφίλ τωντων ΕλληνικώνΕλληνικών
ΛΙΣΤΑ
ΜΟΝΑ∆ΙΚ Ν
ΤΥΠ Ν
Ν=393.039
ΜΣ=82
ΛΕΞΕΙΣ
ΚΕΙΜΕΝ Ν
ΕΘΕΓ
Ν=32.324.209
•Ελληνικά (προκριθέντα):
212.332 τύποι (54,02%)
• Ελληνικά (απορριφθέντα):
180.707 τύποι (45,98%)
• Ελληνικά (προκριθέντα):
29.965.338 λέξεις (92,7%)
• Ελληνικά (απορριφθέντα):
2.358.871 λέξεις (7,3%)
05/2005
Κωνσταντίνος Καληµέρης
ΙΙΙΙ.. ∆ευτερογενή∆ευτερογενή ∆εδοµένα∆εδοµένα:: φωνητικέςφωνητικές µεταγραφέςµεταγραφές
Το εργαλείο αυτόµατης φωνητικής µεταγραφής του
εκπαιδευτικού CD ROM “Φιλογλωσσία+2 ” (ΙΕΛ)
Εξέλιξη του συστήµατος µεταγραφής PHONEMIA (Bakamidis &
Carayannis 1987).
Το εργαλείο ∆ΕΝ χρησιµοποιεί λεξικό αλλά κανόνες αλλοφωνικής
µεταγραφής ορθογραφικών συµβολοσειρών µικρότερων της λέξης.
Ικανότητα µεταγραφής οποιασδήποτε ορθογραφικής λέξης.
Ικανότητα µεταγραφής τεράστιου όγκου δεδοµένων σε
πραγµατικό χρόνο.
Παρουσία θορύβου στην έξοδο του εργαλείου λόγω ανεπιτυχούς
διαχείρισης των αµφισηµιών στην ορθογραφία της ΝΕ:
<νια> [nia] ή [ْa]: <γαρδένια>: [֙a‫ש‬ᾩéْa] ή *[֙a‫ש‬ᾩénia] ;
<εναγώνια>: *[ena֙óْa] ή [ena֙ónia] ;
05/2005
Κωνσταντίνος Καληµέρης
ΙΙΙΙ.. ΠαραδείγµαταΠαραδείγµατα κανόνωνκανόνων φωνητικήςφωνητικής µεταγραφήςµεταγραφής
πυ | τυ | ου | λετα | γα | µε |
γχω | <µα | γο | βα | πα | τε | { ρ } ι { ά | έ } { δ } [ j ]
ει | αι | ψω | θω | θε | χα
παραδείγµατα: <ξεθωριάζω> [kseθorjázo]
<λογαριάζω> [loγarjázo]
<ανταριάζω> [adarjázo]
αντιπαραδείγµατα: <Αργυριάδης> [arjiriáᾩis]
<Μαριάνθη> [mariánθi]
{ < | χι | πα } { λ } ι { ό } [ Ø ]
παραδείγµατα: <λιόγερµα> [ѭójerma]
<χιλιόµετρο> [xiѭómetro]
<παλιόπαιδο> [paѭópeᾩo]
αντιπαράδειγµα: <Ηλιόπουλος> [iliópulos]
05/2005
Κωνσταντίνος Καληµέρης
ΙΙΙΙ.. ΈλεγχοςΈλεγχος αξιοπιστίαςαξιοπιστίας τουτου εργαλείουεργαλείου µεταγραφήςµεταγραφής
Λήψη τυχαίου και αντιπροσωπευτικού δείγµατος από τα Πρωτογενή
∆εδοµένα (Β. Μασσίνας), αξιολόγηση, µετάβαση στον πληθυσµό.
2000 ορθογραφικές λέξεις επί των προκριθέντων Ελληνικών.
- 356 λέξεις που περιέχουν C i V (17,8%)
- 261 λέξεις που περιέχουν µπ, ντ, γκ, γγ (13%)
Αυτόµατη µεταγραφή δείγµατος.
Κανονικοποίηση εξόδου: αφαίρεση του στοιχείου προερρινοποίησης
από τις µεταγραφές των µπ, ντ, γκ, γγ: [mb] [b], [֊ց] [ց], [֊᭥] [᭥]
Στόχος κανονικοποίησης: διάσωση συνδυαστικής πληροφορίας
Αν <κόµπος> [kómbos] Παράδειγµα: 1 λέξη, Ελάχιστα ζεύγη: 0
Αν <κόµπος> [kóbos] Παράδειγµα: 7 λέξεις, Ελάχιστα ζεύγη: 6/21
[kóbos], [kó‫ש‬os], [kónos], [kómos], [kókos], [kópos], [kólos]
∆ια χειρός έλεγχος & αξιολόγηση µεταγραφών βάσει κριτηρίων.
05/2005
Κωνσταντίνος Καληµέρης
ΙΙΙΙ.. ΑποτελέσµαταΑποτελέσµατα ελέγχουελέγχου αξιοπιστίαςαξιοπιστίας τουτου εργαλείουεργαλείου
ΤΥΧΑΙΟ ∆ΕΙΓΜ Α: 2000 εγγραφ ές (100% )
ΤΙΜ Η «1»: 1845 εγγραφές (92,25% )
Κατηγορία
Λέξης µπ ντ γκ γγ CiV
Συνδυ-
ασµοί
Λοιπά
Π λήθος
Εγγραφ ώ ν 35 130 19 20 186 43 1412
Π οσοστό επί
ΤΙΜ ΗΣ «1»
1,9% 7,05% 1,03% 1,08% 10,08% 2,33% 76,53%
Π οσοστό επί
Συνόλου
Εγγραφ ώ ν
1,75% 6,5% 0,95% 1% 9,3% 2,15% 70,6%
ΤΙΜ Η «0»: 155 εγγραφές (7,75% )
Κατηγορία
Λέξης
µπ ντ γκ γγ CiV
Συνδυ-
ασµοί
Λοιπά
Π λήθος
Εγγραφ ώ ν 4 3 1 1 118 20 8
Π οσοστό επί
ΤΙΜ ΗΣ «0»
2,58% 1,93% 0,64% 0,64% 76,13% 12,9% 5,16%
Π οσοστό επί
Συνόλου
Εγγραφ ώ ν
0,2% 0,15% 0,05% 0,05% 5,9% 1% 0,4%
05/2005
Κωνσταντίνος Καληµέρης
ΙΙΙΙ.. ΒελτίωσηΒελτίωση απόδοσηςαπόδοσης τουτου εργαλείουεργαλείου µεταγραφήςµεταγραφής
Ανάγκη για µεγιστοποίηση του ποσοστού ορθών µεταγραφών:
αποφυγή απώλειας συνδυαστικής πληροφορίας.
Το µεταγραφικό πρόβληµα C i V (σχετικό µε την “Συνίζηση”):
υπεύθυνο για άνω του 76% των εσφαλµένων µεταγραφών.
Απόλυτα επιτυχής αντιµετώπιση: άνω του 98% ορθές µεταγραφές.
Μοντελοποίηση του προβλήµατος C i V: απολύτως απαραίτητη.
Ορισµός ορθογραφικού συµπλέγµατος C i V: Bakamidis & Carayannis 1987
ΘΕΣΗ 1 ( C ): { β, γ, δ, ζ, λ, µ, ν, ρ, θ, κ, ξ, π, σ, τ, φ, χ, ψ } (8+9)
ΘΕΣΗ 2 ( i ): { ι, ει, οι, υι, υ} (5)
ΘΕΣΗ 3 ( V ): { α, ε, αι, ι, ει, οι, υι, υ, ο, ω, ου,
ά, έ, αί, ί, εί, οί, υί, ύ, ό, ώ, ού} (22)
05/2005
Κωνσταντίνος Καληµέρης
ΜίαΜία απόπειρααπόπειρα µοντελοποίησηςµοντελοποίησης τουτου προβλήµατοςπροβλήµατος C i VC i V
Α: λέξεις C i V, όπου i = [i] (ιδιότητα, ποιότητα, αφιέρωσαν)
Β: λέξεις C i V, όπου i = [ٍ] (πόδια, παιδιά)
Γ: λέξεις C i V, όπου i = [ᯀ] (ψευτιά, κούφια, φωτιά)
∆: λέξεις C i V, όπου i = [i] ~ [j] ~ [ٍ] (βιοµηχανικό, διαβατήριο)
Ε: λέξεις C i V, όπου i = [i] ~ [‫گ‬] ~ [ᯀ] (σιωπή, πλουσιότερος,
στρατιωτικός, βοήθεια)
Ζ: λέξεις C i V, όπου ν+i = [ْ], χ+i = [ᯀ],
γ+i = [ٍ], λ+i = [ѭ], κ+i = [c], γκ+i = [᭥], γγ+i = [᭥]
(γαρδένια, χιόνι, γιατρός, λιακάδα, µαγκιά, ουγγιά)
Η: λέξεις που δεν περιέχουν C i V.
Κατάτµηση των ορθογραφικών αναπαραστάσεων του λεξιλογίου της ΝΕ
σε 7 Υποσύνολα:
3:33:2
Ε: “∆ΗΜΟΣΘέΝΗΣ”
Ε: “ΕΚΦ ΝΗΤΗΣ+”
∆: “∆ΗΜΟΣΘέΝΗΣ”
∆: “ΕΚΦ ΝΗΤΗΣ+”
< χiC/χeC >
(ΟΧΙ <CiV>)
< γiC/γeC >
(ΟΧΙ <CiV>)
< CiC >
(ΟΧΙ <CiV>)3 : 3
[i]
[ ‫گ‬ ]
*
<j>
DEFAULT
ΑΝΤΙΣΤΟΙΧΗΣΗ
«Β»
(και µέρος
του «Ζ»)
*
«∆»
[ٍ]
[j]
«Ε»
[ᯀ]
«Γ»
(και µέρος
του «Ζ»)
*
<i>
DEFAULT
ΑΝΤΙΣΤΟΙΧΗΣΗ
«Α»
[ᯀ] [ ‫گ‬ ] [i] [j] [ٍ]
ΠΡΟΤΕΙΝΟΜΕΝΑ ΣΥΜΒΟΛΑ
[ᯀ] [ٍ]
[i]
<ᯀ>
DEFAULT
ΑΝΤΙΣΤΟΙΧΗΣΗ
<ᯀ>
<i>
<j>
<i>
< CiV >
(ΑΗΧΟ C )
*
ΗΧΗΤΙΚΕΣ
ΑΜΦΙΣΗΜΙΕΣ:
ΑΠΩΛΕΙΑ ΖΕΥΓΩΝ:
[ᾩjavazo]
[ᾩiatazo]
< CiV >
(ΗΧΗΡΟ C )
ΕΣΦΑΛΜΕΝΕΣ*
ΑΝΤΙΣΤΟΙΧΙΣΕΙΣ:
Τριεπίπεδη ανάλυση των 7 προτεινόµενων αλλοφώνων του φωνήµατος / i /, ανάλογα
µε τον ενδοσυλλαβικό ρόλο τους και τα αρθρωτικά και ακροατικά τους χαρακτηριστικά.
ΑΚΡΟΑΤΗΣ:
ΑΠΟΚΩ∆ΙΚΟΠΟΙΗΣΗ
ΑΚΡΟΑΤΙΚΟ
(ΑΝΤΙΛΗΠΤΙΚΟ)
ΕΠΙΠΕ∆Ο
ΚΩ∆ΙΚΑΣ
ΕΠΙΚΟΙΝΩΝΙΑΣ
ΣΥΝ∆ΥΑΣΤΙΚΟ-
ΛΕΙΤΟΥΡΓΙΚΟ
ΕΠΙΠΕ∆Ο
ΟΜΙΛΗΤΗΣ:
ΚΩ∆ΙΚΟΠΟΙΗΣΗ
ΑΡΘΡΩΤΙΚΟ
(ΜΗΧΑΝΙΚΟ)
ΕΠΙΠΕ∆Ο
Αρθρωτικώς
ΤΕΤΑΜΕΝΑ
Αλλόφωνα
ΦΩΝΗΕΝΤΙΚΗΣ Φύσεως
(µέρος Συλλαβικού Πυρήνα)
Αλλόφωνα
ΣΥΜΦΩΝΙΚΗΣ Φύσεως
(µέρος Αρχής συλλαβής)
Ακροατικώς
ΚΕΝΤΡΙΚΑ
(Ρόλος “V”)
Ακροατικώς
ΠΕΡΙΦΕΡΕΙΑΚΟ
(Ρόλος “C”)
ΑΛΛΟΦΩΝΑ
του φωνήµατος /i/
Αρθρωτικώς
ΧΑΛΑΡΟ
Αρθρωτικώς
ΧΑΛΑΡΟ
Ακροατικώς
ΠΕΡΙΦΕΡΕΙΑΚΑ
(Ρόλος “C”)
[i] [‫]گ‬ [j] [‫گ‬] [ᯀ] [ٍ]
φω-τιά
κού-φια
παι-διά
πό-δια
[ْ]
Αρθρωτικώς
ΧΑΛΑΡΟ
Αρθρωτικώς
ΤΕΤΑΜΕΝΟ
σπί-τι
πη-λός
ρο-λό-ι
πε-ρι-ω-πής
χάι-δε-ψα
αη-δό-νι
Αϊ-βα-λί
κο-ρόι-δο
δια-φα-νής
σέι-κερ
πλου-σιό-τε-ρος
στρα-τιω-τι-κός
η-λι-θιω-δώς
α-να-µε-τριέ-ται
βο-ή-θεια
ζη-µιά
α-γρί-µια
πε-ρι-ο-δι-κό
δη-λη-τη-ρι-ά-ζω
“∆ΗΜΟΣΘέΝΗΣ” “ΕΚΦ ΝΗΤΗΣ+”
05/2005
Κωνσταντίνος Καληµέρης
ΗΗ έννοιαέννοια τουτου ΛειτουργικούΛειτουργικού ΦορτίουΦορτίου ((FL)FL)
Γλωσσολόγοι: “Σε τι ποσοστό εκµεταλλεύεται το φωνολογικό σύστηµα
της ΝΕ τις ηχητικές αντιθέσεις που έχει στην διάθεσή του;”
Πλήθος ελαχίστων ζευγών για την αντίθεση [x~y]
Συνολικό πλήθος ελαχίστων ζευγών για όλες τις αντιθέσεις
Μηχανικοί: “Για κάθε ελάχιστο ζεύγος λέξεων W1 και W2 , πόσο πιθανό
είναι για τον δέκτη να αποκωδικοποιήσει το µεταδιδόµενο από τον
ποµπό σήµα [W1] ως W2 , και αντιστρόφως;” (συχνότητα εµφάνισης)
Εφαρµογές:
Κατάλογος φωνηµάτων για την ΝΕ
Πρόβλεψη κατεύθυνσης φωνολογικών αλλαγών
Πρόσκτηση φωνολογικού συστήµατος από τα βρέφη
Παθολογία της γλώσσας
Συστήµατα σύνθεσης / αναγνώρισης φωνής: κατάταξη πιθανών
βελτιώσεων σε περισσότερο ή λιγότερο επωφελείς (ή επείγουσες!)
FL[x~y] =
05/2005
Κωνσταντίνος Καληµέρης
ΑπολογισµόςΑπολογισµός
1. Εξαγωγή φωνολογικής πληροφορίας από ΕΘΕΓ: σκόπιµη & εφικτή.
2. Συγκέντρωση και προεπεξεργασία πρωτογενών δεδοµένων.
3. Αυτόµατη µεταγραφή σε IPA: εφικτή, αλλά ανάγκη για βελτίωση του
εργαλείου (C i V).
4. Μία αρχική µοντελοποίηση του προβλήµατος της Συνίζησης / C i V.
5. Μοντελοποίηση συλλαβικού πυρήνα: ενδοσυλλαβικοί ρόλοι V, V’, C
Απλός πυρήνας: Ν = V / V’ : πη-λός, κυ-ρι-εύ-ω
Σύνθετος πυρήνας: Ν= CV / CV’: δια-φά-νει-α ή Ν= VC / V’C: γαϊ-δού-ρι
Ανάθεση αλλοφώνων σε ρόλους: [i, ‫]گ‬ = V / V’ (πυρηνικά, κεντρικά),
[j] = C (πυρηνικό, περιφ.), [‫,گ‬ ᯀ, ٍ, ْ] = C (µη-πυρηνικά, περιφ.)
6. Αλλόφωνα /i/: ανάγκη ανεύρεσης περιβαλλόντων χωρίς επικάλυψη.
7. Ανάγκη εµπλουτισµού συστήµατος αναπαράστασης: [j], [ٍ], [‫,]گ‬ [‫.]گ‬
05/2005
Κωνσταντίνος Καληµέρης
ΤρέχουσεςΤρέχουσες εξελίξειςεξελίξεις && µελλοντικέςµελλοντικές προοπτικέςπροοπτικές
minpair : εργαλείο ανεύρεσης ζεύγη λέξεων τύπου [abcd]~[abxd].
- Εκσφαλµάτωση και κατασκευή διεπαφής λειτουργίας σε Windows.
∆ηµιουργία σωµάτων λέξεων µε C i V (πηγές: ΕΘΕΓ, Μορφολογικό).
- Αυτόµατη φωνητική µεταγραφή των ανωτέρω.
- Αξιολόγηση µεταγραφών: έλεγχος, διόρθωση, κατηγοριοποίηση.
- Εξαγωγή νέων κανόνων µεταγραφής για λέξεις µε C i V.
- Βελτίωση του εργαλείου φωνητικής µεταγραφής.
(Εκ νέου) αυτόµατη φωνητική µεταγραφή ορθογραφικών δεδοµένων.
Εξαγωγή, κατηγοριοποίηση και αξιολόγηση ελαχίστων ζευγών.
Ορισµός µαθηµατικών τύπων για υπολογισµό λειτουργικών φορτίων.
Υπολογισµός λειτουργικών φορτίων.
Ποια η φωνολογική υπόσταση των [b, d, ց, j, ٍ, ْ, ѭ, ᯀ, c, ᭥, ts, dz,
ps, ks]; ∆ικαιολογούνται διφθογγικά φωνήµατα στην ΝΕ;
05/2005
Κωνσταντίνος Καληµέρης
ΕυχαριστίεςΕυχαριστίες

More Related Content

What's hot

Το μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητών
Το μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητώνΤο μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητών
Το μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητών
ΣΟΦΙΑ ΦΕΛΛΑΧΙΔΟΥ
 
Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)
Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)
Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)Αντιγόνη Κριπαροπούλου
 
21704159 αρχικοι-χρονοι
21704159 αρχικοι-χρονοι21704159 αρχικοι-χρονοι
21704159 αρχικοι-χρονοιAlexadro Del Mel
 
Παραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρία
Παραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρίαΠαραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρία
Παραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρίαGeorgia Dimitropoulou
 
αξιολόγηση ιστορικών πηγών
αξιολόγηση ιστορικών πηγώναξιολόγηση ιστορικών πηγών
αξιολόγηση ιστορικών πηγών
Thanos Stavropoulos
 
Loxandra vivlioparousiasi
Loxandra vivlioparousiasiLoxandra vivlioparousiasi
Loxandra vivlioparousiasi
Εirini Panagiotakopoulou
 
Διαφήμιση
ΔιαφήμισηΔιαφήμιση
Διαφήμιση
chavalesnick
 
Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...
Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...
Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...
Τσατσούρης Χρήστος, Γυμνάσιο Μαγούλας Δυτικής Αττικής
 
ρήμα γίγνομαι
ρήμα γίγνομαιρήμα γίγνομαι
ρήμα γίγνομαι
Thanos Stavropoulos
 
Δικαιώματα & Υποχρεώσεις του Πολίτη
Δικαιώματα & Υποχρεώσεις του ΠολίτηΔικαιώματα & Υποχρεώσεις του Πολίτη
Δικαιώματα & Υποχρεώσεις του ΠολίτηJoeRitsi
 
ελενη ή ο κανενας
ελενη ή ο κανεναςελενη ή ο κανενας
ελενη ή ο κανενας
Eleni Papadopoulou
 
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑ
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑ
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑ
Akis Ampelas
 
μεσα μαζικης ενημερωσης Ola
μεσα μαζικης ενημερωσης Olaμεσα μαζικης ενημερωσης Ola
μεσα μαζικης ενημερωσης Olakaradespina
 
Anadiplasiasmos
AnadiplasiasmosAnadiplasiasmos
Anadiplasiasmos
matoula74
 
ΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥ
ΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥ
ΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥGeorgiadou Agathi
 
Τράπεζα Θεμάτων: Νέα Ελληνική Λογοτεχνία
Τράπεζα Θεμάτων: Νέα Ελληνική ΛογοτεχνίαΤράπεζα Θεμάτων: Νέα Ελληνική Λογοτεχνία
Τράπεζα Θεμάτων: Νέα Ελληνική Λογοτεχνία
Katerina Boukorou
 
έκφραση - έκθεση Α' Λυκείου, γλωσσομάθεια
έκφραση - έκθεση Α' Λυκείου, γλωσσομάθειαέκφραση - έκθεση Α' Λυκείου, γλωσσομάθεια
έκφραση - έκθεση Α' Λυκείου, γλωσσομάθεια
gina zaza
 
Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11
Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11
Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11
Thanos Stavropoulos
 
το μοιρολόγι της φώκιας
το μοιρολόγι της φώκιαςτο μοιρολόγι της φώκιας
το μοιρολόγι της φώκιας1lykxanthis
 
Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)
Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)
Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)
d tampouris
 

What's hot (20)

Το μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητών
Το μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητώνΤο μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητών
Το μοιρολόγι της φώκιας Αλέξανδρου Παπαδιαμάντη, Εργασίες μαθητών
 
Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)
Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)
Συναισθήματα και τέχνη ("παιχνίδι" για αναγνώριση και έκφραση συναισθημάτων)
 
21704159 αρχικοι-χρονοι
21704159 αρχικοι-χρονοι21704159 αρχικοι-χρονοι
21704159 αρχικοι-χρονοι
 
Παραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρία
Παραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρίαΠαραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρία
Παραθετικά ομαλών επιθέτων της αρχαίας ελληνικής: θεωρία
 
αξιολόγηση ιστορικών πηγών
αξιολόγηση ιστορικών πηγώναξιολόγηση ιστορικών πηγών
αξιολόγηση ιστορικών πηγών
 
Loxandra vivlioparousiasi
Loxandra vivlioparousiasiLoxandra vivlioparousiasi
Loxandra vivlioparousiasi
 
Διαφήμιση
ΔιαφήμισηΔιαφήμιση
Διαφήμιση
 
Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...
Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...
Πηνελόπη Δέλτα, Πρώτες ενθυμήσεις, Κείμενα Νεοελληνικής Λογοτεχνίας, Γ΄ Γυμνα...
 
ρήμα γίγνομαι
ρήμα γίγνομαιρήμα γίγνομαι
ρήμα γίγνομαι
 
Δικαιώματα & Υποχρεώσεις του Πολίτη
Δικαιώματα & Υποχρεώσεις του ΠολίτηΔικαιώματα & Υποχρεώσεις του Πολίτη
Δικαιώματα & Υποχρεώσεις του Πολίτη
 
ελενη ή ο κανενας
ελενη ή ο κανεναςελενη ή ο κανενας
ελενη ή ο κανενας
 
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑ
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑ
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ Γ΄ ΛΥΚΕΙΟΥ - ΠΑΡΑΛΛΗΛΑ ΚΕΙΜΕΝΑ
 
μεσα μαζικης ενημερωσης Ola
μεσα μαζικης ενημερωσης Olaμεσα μαζικης ενημερωσης Ola
μεσα μαζικης ενημερωσης Ola
 
Anadiplasiasmos
AnadiplasiasmosAnadiplasiasmos
Anadiplasiasmos
 
ΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥ
ΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥ
ΒΙΖΥΗΝΟΥ, ΤΟ ΑΜΑΡΤΗΜΑ ΤΗΣ ΜΗΤΡΟΣ ΜΟΥ
 
Τράπεζα Θεμάτων: Νέα Ελληνική Λογοτεχνία
Τράπεζα Θεμάτων: Νέα Ελληνική ΛογοτεχνίαΤράπεζα Θεμάτων: Νέα Ελληνική Λογοτεχνία
Τράπεζα Θεμάτων: Νέα Ελληνική Λογοτεχνία
 
έκφραση - έκθεση Α' Λυκείου, γλωσσομάθεια
έκφραση - έκθεση Α' Λυκείου, γλωσσομάθειαέκφραση - έκθεση Α' Λυκείου, γλωσσομάθεια
έκφραση - έκθεση Α' Λυκείου, γλωσσομάθεια
 
Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11
Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11
Ξενοφώντας "Κύρου Ανάβασις" Γ'2 §§ 10 - 11
 
το μοιρολόγι της φώκιας
το μοιρολόγι της φώκιαςτο μοιρολόγι της φώκιας
το μοιρολόγι της φώκιας
 
Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)
Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)
Η Φτώχεια : Διδακτικό σενάριο (Αρχικό)
 

Similar to Slideshow_Presentation_Kalimeris_MSc_Thesis_2004

Orthoslogos
OrthoslogosOrthoslogos
Orthoslogosfotoaik
 
Orthoslogos
OrthoslogosOrthoslogos
Orthoslogosfotoaik
 
ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑAnna Boukouvala
 
ΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑAnna Boukouvala
 
Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων
Thanos Stavropoulos
 
Σοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα ΘεμάτωνΣοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα Θεμάτων
Thanos Stavropoulos
 
α.ε. γραμματική
α.ε. γραμματικήα.ε. γραμματική
α.ε. γραμματική
Antonis Stergiou
 
ολα λυσία 9-11
ολα λυσία  9-11ολα λυσία  9-11
ολα λυσία 9-11
Eleni Kots
 
ολα λυσία § 1-3
ολα λυσία § 1-3ολα λυσία § 1-3
ολα λυσία § 1-3
Eleni Kots
 
ολα λυσία § 1-3
ολα λυσία § 1-3ολα λυσία § 1-3
ολα λυσία § 1-3
Eleni Kots
 
σημεία στίξης της νέας ελληνικής γλώσσας
σημεία στίξης της νέας ελληνικής γλώσσαςσημεία στίξης της νέας ελληνικής γλώσσας
σημεία στίξης της νέας ελληνικής γλώσσας
Thanos Stavropoulos
 
Φύλλο Εργασίας Αρχές Φιλοσοφίας 2ο Κεφάλαιο
Φύλλο Εργασίας Αρχές Φιλοσοφίας 2ο ΚεφάλαιοΦύλλο Εργασίας Αρχές Φιλοσοφίας 2ο Κεφάλαιο
Φύλλο Εργασίας Αρχές Φιλοσοφίας 2ο ΚεφάλαιοAkis Ampelas
 
Γραμματική Συντακτικό αρχαίων
Γραμματική   Συντακτικό αρχαίωνΓραμματική   Συντακτικό αρχαίων
Γραμματική Συντακτικό αρχαίων
Theodore Sianos
 
συνταξη ρηματων α. ε. σταυρατη γεωργια
συνταξη ρηματων α. ε. σταυρατη γεωργιασυνταξη ρηματων α. ε. σταυρατη γεωργια
συνταξη ρηματων α. ε. σταυρατη γεωργιαstavratig
 
Σοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα Θεμάτων
Σοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα ΘεμάτωνΣοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα Θεμάτων
Σοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα Θεμάτων
Thanos Stavropoulos
 
φυλλο εργασιας στην αντιγονη
φυλλο εργασιας στην αντιγονηφυλλο εργασιας στην αντιγονη
φυλλο εργασιας στην αντιγονηaxilleas1975
 
Η Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptx
Η Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptxΗ Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptx
Η Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptx
vdavanou
 
61998810 πώς-να-γράφουμε-σωστά-ελληνικά
61998810 πώς-να-γράφουμε-σωστά-ελληνικά61998810 πώς-να-γράφουμε-σωστά-ελληνικά
61998810 πώς-να-γράφουμε-σωστά-ελληνικά
ssuser27e3da
 
χαιδευτου χ. αρχαια ελληνικα β γυμνασιου
χαιδευτου χ. αρχαια ελληνικα β γυμνασιου χαιδευτου χ. αρχαια ελληνικα β γυμνασιου
χαιδευτου χ. αρχαια ελληνικα β γυμνασιου christihai
 

Similar to Slideshow_Presentation_Kalimeris_MSc_Thesis_2004 (20)

Orthoslogos
OrthoslogosOrthoslogos
Orthoslogos
 
Orthoslogos
OrthoslogosOrthoslogos
Orthoslogos
 
ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΓΛΩΣΣΑΣ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
 
ΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
ΔΙΔΑΣΚΟΝΤΑΣ ΓΛΩΣΣΑ ΜΕ ΑΝΟΙΧΤΑ ΔΙΕΡΕΥΝΗΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ
 
Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 635 - 654: Τράπεζα Θεμάτων
 
Σχηματισμός Ευκτικής Ε.Φ. βαρύτονων ρημάτων. Ενότητες 7 και 8 Αρχαίων Β΄ Γυμ...
Σχηματισμός Ευκτικής Ε.Φ. βαρύτονων ρημάτων. Ενότητες  7 και 8 Αρχαίων Β΄ Γυμ...Σχηματισμός Ευκτικής Ε.Φ. βαρύτονων ρημάτων. Ενότητες  7 και 8 Αρχαίων Β΄ Γυμ...
Σχηματισμός Ευκτικής Ε.Φ. βαρύτονων ρημάτων. Ενότητες 7 και 8 Αρχαίων Β΄ Γυμ...
 
Σοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα ΘεμάτωνΣοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα Θεμάτων
Σοφοκλή "Αντιγόνη", στίχοι 710 - 729: Τράπεζα Θεμάτων
 
α.ε. γραμματική
α.ε. γραμματικήα.ε. γραμματική
α.ε. γραμματική
 
ολα λυσία 9-11
ολα λυσία  9-11ολα λυσία  9-11
ολα λυσία 9-11
 
ολα λυσία § 1-3
ολα λυσία § 1-3ολα λυσία § 1-3
ολα λυσία § 1-3
 
ολα λυσία § 1-3
ολα λυσία § 1-3ολα λυσία § 1-3
ολα λυσία § 1-3
 
σημεία στίξης της νέας ελληνικής γλώσσας
σημεία στίξης της νέας ελληνικής γλώσσαςσημεία στίξης της νέας ελληνικής γλώσσας
σημεία στίξης της νέας ελληνικής γλώσσας
 
Φύλλο Εργασίας Αρχές Φιλοσοφίας 2ο Κεφάλαιο
Φύλλο Εργασίας Αρχές Φιλοσοφίας 2ο ΚεφάλαιοΦύλλο Εργασίας Αρχές Φιλοσοφίας 2ο Κεφάλαιο
Φύλλο Εργασίας Αρχές Φιλοσοφίας 2ο Κεφάλαιο
 
Γραμματική Συντακτικό αρχαίων
Γραμματική   Συντακτικό αρχαίωνΓραμματική   Συντακτικό αρχαίων
Γραμματική Συντακτικό αρχαίων
 
συνταξη ρηματων α. ε. σταυρατη γεωργια
συνταξη ρηματων α. ε. σταυρατη γεωργιασυνταξη ρηματων α. ε. σταυρατη γεωργια
συνταξη ρηματων α. ε. σταυρατη γεωργια
 
Σοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα Θεμάτων
Σοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα ΘεμάτωνΣοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα Θεμάτων
Σοφοκλή, "Αντιγόνη", Β' Λυκείου, στίχοι 491 - 507: Τράπεζα Θεμάτων
 
φυλλο εργασιας στην αντιγονη
φυλλο εργασιας στην αντιγονηφυλλο εργασιας στην αντιγονη
φυλλο εργασιας στην αντιγονη
 
Η Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptx
Η Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptxΗ Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptx
Η Ντοπιολαλιά των Πατρινών Το αχαϊκό ιδίωμα .pptx
 
61998810 πώς-να-γράφουμε-σωστά-ελληνικά
61998810 πώς-να-γράφουμε-σωστά-ελληνικά61998810 πώς-να-γράφουμε-σωστά-ελληνικά
61998810 πώς-να-γράφουμε-σωστά-ελληνικά
 
χαιδευτου χ. αρχαια ελληνικα β γυμνασιου
χαιδευτου χ. αρχαια ελληνικα β γυμνασιου χαιδευτου χ. αρχαια ελληνικα β γυμνασιου
χαιδευτου χ. αρχαια ελληνικα β γυμνασιου
 

Slideshow_Presentation_Kalimeris_MSc_Thesis_2004

  • 1. 05/2005 Κωνσταντίνος Καληµέρης ΠΜΣΠΜΣ ““ΤεχνογλωσσίαΤεχνογλωσσία ΙΙΙΙ”” ΜΕΤΑΠΤΥΧΙΑΚΗΜΕΤΑΠΤΥΧΙΑΚΗ ∆ΙΠΛ ΜΑΤΙΚΗ∆ΙΠΛ ΜΑΤΙΚΗ ΕΡΓΑΣΙΑΕΡΓΑΣΙΑ Μελέτη εξαγωγής φωνολογικής πληροφορίας από τον ΕΘΕΓ µε σκοπό την παραγωγή Ελαχίστων Ζευγών και τον υπολογισµό Λειτουργικών Φορτίων για την Νέα Ελληνική. ΕπιβλέποντεςΕπιβλέποντες ΚαθηγητέςΚαθηγητές:: Γεώργιος Καραγιάννης (ΕΜΠ, ΙΕΛ) Γεώργιος Μικρός (ΕΚΠΑ)
  • 2. 05/2005 Κωνσταντίνος Καληµέρης ΑφορµήΑφορµή γιαγια τηντην εργασίαεργασία Το κρίσιµο ερώτηµα: “Ποιοι και πόσοι είναι οι ήχοι που πραγµατικά επιτελούν έργο διάκρισης µεταξύ σηµασιών στα πλαίσια της Νέας Ελληνικής;” ή… “Ποια και πόσα φωνήµατα πρέπει να θέσουµε για την Νέα Ελληνική ώστε ταυτόχρονα • να επιτύχουµε την θεωρητικά οικονοµικότερη λύση • να σεβαστούµε τα δεδοµένα που προκύπτουν από την σύνθεση και την χρήση του λεξιλογίου της γλώσσας;” Οι απόψεις διίστανται: τα φωνήµατα της ΝΕ είναι… 30 (Σετάτος), 26 (Householder et al.), 23 (Mackridge / Φιλιππάκη), 20 (Newton / Holton et al.), 20 ή 24 ή 29 (Πετρούνιας)…
  • 3. 05/2005 Κωνσταντίνος Καληµέρης ΒασικοίΒασικοί στόχοιστόχοι τηςτης εργασίαςεργασίας Η εξερεύνηση δύο ερωτηµάτων: 1) “Γιατί διαφωνούν οι ερευνητές όσο αφορά το πόσα και ποια είναι τα φωνήµατα της ΝΕ;” 2) “Θα µπορούσε το γλωσσικό υλικό που περιέχεται στον ΕΘΕΓ να χρησιµοποιηθεί µελλοντικά για την άρση των σχετικών διαφωνιών και, αν ναι, µε ποιόν τρόπο;” Προετοιµασία για σχετική µελλοντική έρευνα: 3) Εξερεύνηση του θεωρητικού πλαισίου & ορισµός βασικών εννοιών. 4) Προεπεξεργασία του γλωσσικού υλικού που περιέχεται στον ΕΘΕΓ. 5) Εύρεση και αξιολόγηση των αυτόµατων εργαλείων εξαγωγής φωνολογικής πληροφορίας από δεδοµένα γραπτής γλώσσας. 6) Ελάχιστα Ζεύγη & Λειτουργικά Φορτία: σε επόµενο στάδιο.
  • 4. 05/2005 Κωνσταντίνος Καληµέρης ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (1)(1) Γλώσσα: συµβολικό σύστηµα µετάδοσης πληροφορίας. Λέξεις: σύµβολα = αντιστοιχίσεις ηχητικών σηµάτων και σηµασιών. Σήµατα λέξεων: αλυσίδες στοιχειωδών ήχων. Επίπεδο της άρθρωσης: αλυσίδες πραγµατικών ήχων (φθόγγων). [ ᯀ + é + r + i ] = “χέρι”, [ x + a + r + á ] ☺ = “χαρά” Ελάχιστη διαφορά (µεταξύ σηµάτων): ένας στοιχειώδης ήχος ∆ιαφορετικά σήµατα: [ p í r a ] [ b í r a ] [ f í r a ] [ l í r a ] [ m í r a ] [ θ í r a ] ∆ιαφορετικές σηµασίες “εµπειρία”, “µπύρα”, “απώλεια βάρους”, “λύρα”, “πεπρωµένο”, “αυλόπορτα”. Οµοιότητα (µεταξύ σηµάτων): το φωνητικό πλαίσιο [ _ í r a ] εναλλαγή φθόγγων αλλαγή σηµασίας
  • 5. 05/2005 Κωνσταντίνος Καληµέρης ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (2)(2) Φώνηµα: στοιχειώδης φορέας διαφοράς σηµασίας Άρα, θέτουµε τα / p , b , f , l , m , θ / ως φωνήµατα της ΝΕ. Ελάχιστο Ζεύγος: “δύο λέξεις τα σήµατα των οποίων έχουν την ίδια συλλαβική δοµή, αλλά διαφέρουν κατά έναν ήχο στην ίδια θέση”: C V΄ C V ΣΥΛΛΑΒΙΚΗ ∆ΟΜΗ [ ᯀ í r a ] “χήρα” [ f í r a ] “φύρα” [ _ í r a ] Φ ΝΗΤΙΚΟ ΠΛΑΙΣΙΟ Ερώτηµα: “Αφού τα [ᯀ] και [f] είναι φορείς διαφοράς σηµασίας, εκτός των / p , b , f , l , m , θ /, θέτουµε και φώνηµα /ᯀ /; ” Επίπεδο άρθρωσης: σήµατα = αλυσίδες πραγµατικών ήχων. Τα σήµατα [ ᯀ é r i ] και [ x a r á ]: 6 διαφορετικοί φθόγγοι
  • 6. 05/2005 Κωνσταντίνος Καληµέρης ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (3)(3) Εγκέφαλος: “περιέχει” αφηρηµένους ήχους (φωνήµατα) και κανόνες. Επίπεδο αντίληψης: σήµατα = αλυσίδες αφηρηµένων ήχων. Οι φθόγγοι στο αυτί ερµηνεύονται ως φωνήµατα, βάσει κανόνων αποκωδικοποίησης. Τα φωνήµατα παράγονται στο στόµα ως φθόγγοι, βάσει κανόνων κωδικοποίησης. Τα σήµατα [ ᯀ é r i ] και [ x a r á ] παράγονται αντίστοιχα από τα αφηρηµένα σήµατα / x é r i / και / x a r á / (5 διαφορ. φωνήµατα). Κανόνας παραγωγής: «Aν /x/ ακολουθείται από /i/ ή /e/, υλοποίησε /x/ ως [C]. Παντού αλλού, υλοποίησε /x/ ως [x]». (ουράνωση) / x é r i / [ ᯀ é r i ] , / x a r á / [ x a r á ]
  • 7. 05/2005 Κωνσταντίνος Καληµέρης ΜερικέςΜερικές βασικέςβασικές έννοιεςέννοιες && παραδοχέςπαραδοχές (4)(4) • Φθόγγοι: υλοποιηµένα φωνήµατα • Αλλόφωνα: υλικές παραλλαγές φωνήµατος: /x/ [x] ή [ᯀ] • Συµπληρωµατική κατανοµή αλλοφώνων: «Που θα βρω το [ᯀ];» «Εκεί όπου απαγορεύεται να βρω το [x] (πριν από /i/ ή /e/ )» Τότε, πως είναι δυνατόν να βρίσκουµε ελάχιστα ζεύγη όπως [ ᯀ ó n i ] ~ [ x ó n i ], [ ٍ a t í ] ~ [ ֙ a t í ], [ ْ ó ‫ׯ‬ o ] ~ [ n ó ‫ׯ‬ o ] ; [ C V΄ C V ] ΣΥΛΛΑΒΙΚΗ ∆ΟΜΗ / C V V΄ C V / [ ᯀ ó n i ] “χιόνι” / x i ó n i / [ x ó n i ] “χώνει” / x ó n i / / C V΄ C V / Τελικά, υποθέτουµε ελάχιστα ζεύγη επιφανείας για να “ανακαλύψουµε” τα φωνήµατα της ΝΕ, ή υποθέτουµε υποκείµενες συλλαβικές δοµές για να χαρακτηρίσουµε ζεύγη φωνητικών λέξεων τύπου [abcd]~[abxd] ως ελάχιστα ή µη;
  • 8. 05/2005 Κωνσταντίνος Καληµέρης ΒασικέςΒασικές ΑρχέςΑρχές αναπαράστασηςαναπαράστασης καικαι σύγκρισηςσύγκρισης λέξεωνλέξεων 1) Με χρήση των περιγραφικών δυνατοτήτων του IPA, παραγωγή κατά το δυνατόν απλούστερων (όχι φωνολογικά “βεβαρηµένων”) φθογγικών αναπαραστάσεων από τα ορθογραφικά δεδοµένα: “χιόνι” [ᯀóni], και όχι [xióni, xjóni, x‫ܕ‬óni, x’óni, xóni]. 2) Πρώτα: εύρεση, καταγραφή και µέτρηση όλων των ζευγών λέξεων τύπου [abcd]~[abxd]. 3) Μόνο τότε: χαρακτηρισµός κάθε ζεύγος τύπου [abcd]~[abxd] ως “ελάχιστου” ή “µη-ελάχιστου”, κατόπιν σύγκρισής του µε όλα τα υπόλοιπα ζεύγη του ιδίου τύπου. Ερώτηµα: «Είναι το [xóni]~[ᯀóni] ελάχιστο ζεύγος;» Αντερώτηµα: «Τα [x] και [ᯀ] αντιστοιχούν σε δύο διαφορετικά φωνήµατα ή είναι αλλόφωνα του ίδιου φωνήµατος;» Η συµβολή της έρευνάς µας: Πόσα ζεύγη για τις αντιθέσεις [x ~ ?], [ᯀ ~ ?], [x ~ ᯀ];
  • 9. 05/2005 Κωνσταντίνος Καληµέρης ΗΗ υποστήριξηυποστήριξη ενόςενός καταλόγουκαταλόγου φωνηµάτωνφωνηµάτων γιαγια τηντην ΝΕΝΕ Απαντήσεις στα ερωτήµατα: 1) Πως κατανέµονται οι διάφοροι φθόγγοι στο σύνολο των λέξεων του λεξιλογίου της ΝΕ; 2) Ποια είναι τα περιβάλλοντα όπου προκύπτουν οι διάφοροι φθόγγοι της ΝΕ; Τι χρειαζόµαστε για να απαντήσουµε; I. Ένα όσο το δυνατόν µεγαλύτερο και αντιπροσωπευτικότερο δείγµα του λεξιλογίου της ΝΕ. II. Την αναπαράσταση της τυπικής εκφοράς κάθε λέξης του δείγµατος σε φωνητικό αλφάβητο ΙΡΑ. III. Όλους τους δυνατούς συνδυασµούς των φωνητικών αναπαραστάσεων [kupí] [pináo] [stílos] σε “Ελάχιστα” Ζεύγη: [kutí] [ponáo] [stólos]
  • 10. 05/2005 Κωνσταντίνος Καληµέρης ΙΙ.. ΠρωτογενήΠρωτογενή ∆εδοµένα∆εδοµένα:: ΠηγέςΠηγές && ΦίλτραΦίλτρα “Εθνικός Θησαυρός της Ελληνικής Γλώσσας” (ΕΘΕΓ) - Ηλεκτρονικό Σώµα Κειµένων γενικής γλώσσας του Ι.Ε.Λ. - 34 εκατοµµύρια “λέξεις” (συµβολοσειρές, έξοδος tokenizer). - 536.000 διαφορετικές “λέξεις” (µοναδικοί τύποι). Φίλτρο 1: SQL Queries: έξω συµβολοσειρές που περιέχουν - Λατινικούς χαρακτήρες - Σηµεία στίξης - Αριθµητικά - Ειδικά σύµβολα - Υπόλοιπο: 393.000 Ελληνικές αλφαβητικές συµβολοσειρές. Φίλτρο 2: Μορφολογικό Λεξικό του Ι.Ε.Λ και “Συµφωνία ”. - Ανορθόγραφες, non-words, ΟΚ αλλά µη-καταγεγραµµένες. - Υπόλοιπο: 212.000 αποδεκτοί κλιτοί τύποι (όχι λήµµατα).
  • 11. 05/2005 Κωνσταντίνος Καληµέρης ΙΙ.. ΠρωτογενήΠρωτογενή ∆εδοµένα∆εδοµένα:: τοτο προφίλπροφίλ τουτου συνόλουσυνόλου ΛΙΣΤΑ ΜΟΝΑ∆ΙΚ Ν ΤΥΠ Ν Ν=536.113 ΜΣ=64 ΛΕΞΕΙΣ ΚΕΙΜΕΝ Ν ΕΘΕΓ Ν=34.307.249 •Ελληνικά (προκριθέντα): 212.332 τύποι (39,61%, ΜΣ=141) • Ελληνικά (απορριφθέντα): 180.707 τύποι (33,71%, ΜΣ=13) • Λοιπά (απορριφθέντα): 143.074 τύποι (26,68%, ΜΣ=14) • Ελληνικά (προκριθέντα): 29.965.338 λέξεις (87,34%) • Ελληνικά (απορριφθέντα): 2.358.871 λέξεις (6,88%) • Λοιπά (απορριφθέντα): 1.945.648 λέξεις (5,67%)
  • 12. 05/2005 Κωνσταντίνος Καληµέρης ΙΙ.. ΠρωτογενήΠρωτογενή ∆εδοµένα∆εδοµένα:: τοτο προφίλπροφίλ τωντων ΕλληνικώνΕλληνικών ΛΙΣΤΑ ΜΟΝΑ∆ΙΚ Ν ΤΥΠ Ν Ν=393.039 ΜΣ=82 ΛΕΞΕΙΣ ΚΕΙΜΕΝ Ν ΕΘΕΓ Ν=32.324.209 •Ελληνικά (προκριθέντα): 212.332 τύποι (54,02%) • Ελληνικά (απορριφθέντα): 180.707 τύποι (45,98%) • Ελληνικά (προκριθέντα): 29.965.338 λέξεις (92,7%) • Ελληνικά (απορριφθέντα): 2.358.871 λέξεις (7,3%)
  • 13. 05/2005 Κωνσταντίνος Καληµέρης ΙΙΙΙ.. ∆ευτερογενή∆ευτερογενή ∆εδοµένα∆εδοµένα:: φωνητικέςφωνητικές µεταγραφέςµεταγραφές Το εργαλείο αυτόµατης φωνητικής µεταγραφής του εκπαιδευτικού CD ROM “Φιλογλωσσία+2 ” (ΙΕΛ) Εξέλιξη του συστήµατος µεταγραφής PHONEMIA (Bakamidis & Carayannis 1987). Το εργαλείο ∆ΕΝ χρησιµοποιεί λεξικό αλλά κανόνες αλλοφωνικής µεταγραφής ορθογραφικών συµβολοσειρών µικρότερων της λέξης. Ικανότητα µεταγραφής οποιασδήποτε ορθογραφικής λέξης. Ικανότητα µεταγραφής τεράστιου όγκου δεδοµένων σε πραγµατικό χρόνο. Παρουσία θορύβου στην έξοδο του εργαλείου λόγω ανεπιτυχούς διαχείρισης των αµφισηµιών στην ορθογραφία της ΝΕ: <νια> [nia] ή [ْa]: <γαρδένια>: [֙a‫ש‬ᾩéْa] ή *[֙a‫ש‬ᾩénia] ; <εναγώνια>: *[ena֙óْa] ή [ena֙ónia] ;
  • 14. 05/2005 Κωνσταντίνος Καληµέρης ΙΙΙΙ.. ΠαραδείγµαταΠαραδείγµατα κανόνωνκανόνων φωνητικήςφωνητικής µεταγραφήςµεταγραφής πυ | τυ | ου | λετα | γα | µε | γχω | <µα | γο | βα | πα | τε | { ρ } ι { ά | έ } { δ } [ j ] ει | αι | ψω | θω | θε | χα παραδείγµατα: <ξεθωριάζω> [kseθorjázo] <λογαριάζω> [loγarjázo] <ανταριάζω> [adarjázo] αντιπαραδείγµατα: <Αργυριάδης> [arjiriáᾩis] <Μαριάνθη> [mariánθi] { < | χι | πα } { λ } ι { ό } [ Ø ] παραδείγµατα: <λιόγερµα> [ѭójerma] <χιλιόµετρο> [xiѭómetro] <παλιόπαιδο> [paѭópeᾩo] αντιπαράδειγµα: <Ηλιόπουλος> [iliópulos]
  • 15. 05/2005 Κωνσταντίνος Καληµέρης ΙΙΙΙ.. ΈλεγχοςΈλεγχος αξιοπιστίαςαξιοπιστίας τουτου εργαλείουεργαλείου µεταγραφήςµεταγραφής Λήψη τυχαίου και αντιπροσωπευτικού δείγµατος από τα Πρωτογενή ∆εδοµένα (Β. Μασσίνας), αξιολόγηση, µετάβαση στον πληθυσµό. 2000 ορθογραφικές λέξεις επί των προκριθέντων Ελληνικών. - 356 λέξεις που περιέχουν C i V (17,8%) - 261 λέξεις που περιέχουν µπ, ντ, γκ, γγ (13%) Αυτόµατη µεταγραφή δείγµατος. Κανονικοποίηση εξόδου: αφαίρεση του στοιχείου προερρινοποίησης από τις µεταγραφές των µπ, ντ, γκ, γγ: [mb] [b], [֊ց] [ց], [֊᭥] [᭥] Στόχος κανονικοποίησης: διάσωση συνδυαστικής πληροφορίας Αν <κόµπος> [kómbos] Παράδειγµα: 1 λέξη, Ελάχιστα ζεύγη: 0 Αν <κόµπος> [kóbos] Παράδειγµα: 7 λέξεις, Ελάχιστα ζεύγη: 6/21 [kóbos], [kó‫ש‬os], [kónos], [kómos], [kókos], [kópos], [kólos] ∆ια χειρός έλεγχος & αξιολόγηση µεταγραφών βάσει κριτηρίων.
  • 16. 05/2005 Κωνσταντίνος Καληµέρης ΙΙΙΙ.. ΑποτελέσµαταΑποτελέσµατα ελέγχουελέγχου αξιοπιστίαςαξιοπιστίας τουτου εργαλείουεργαλείου ΤΥΧΑΙΟ ∆ΕΙΓΜ Α: 2000 εγγραφ ές (100% ) ΤΙΜ Η «1»: 1845 εγγραφές (92,25% ) Κατηγορία Λέξης µπ ντ γκ γγ CiV Συνδυ- ασµοί Λοιπά Π λήθος Εγγραφ ώ ν 35 130 19 20 186 43 1412 Π οσοστό επί ΤΙΜ ΗΣ «1» 1,9% 7,05% 1,03% 1,08% 10,08% 2,33% 76,53% Π οσοστό επί Συνόλου Εγγραφ ώ ν 1,75% 6,5% 0,95% 1% 9,3% 2,15% 70,6% ΤΙΜ Η «0»: 155 εγγραφές (7,75% ) Κατηγορία Λέξης µπ ντ γκ γγ CiV Συνδυ- ασµοί Λοιπά Π λήθος Εγγραφ ώ ν 4 3 1 1 118 20 8 Π οσοστό επί ΤΙΜ ΗΣ «0» 2,58% 1,93% 0,64% 0,64% 76,13% 12,9% 5,16% Π οσοστό επί Συνόλου Εγγραφ ώ ν 0,2% 0,15% 0,05% 0,05% 5,9% 1% 0,4%
  • 17. 05/2005 Κωνσταντίνος Καληµέρης ΙΙΙΙ.. ΒελτίωσηΒελτίωση απόδοσηςαπόδοσης τουτου εργαλείουεργαλείου µεταγραφήςµεταγραφής Ανάγκη για µεγιστοποίηση του ποσοστού ορθών µεταγραφών: αποφυγή απώλειας συνδυαστικής πληροφορίας. Το µεταγραφικό πρόβληµα C i V (σχετικό µε την “Συνίζηση”): υπεύθυνο για άνω του 76% των εσφαλµένων µεταγραφών. Απόλυτα επιτυχής αντιµετώπιση: άνω του 98% ορθές µεταγραφές. Μοντελοποίηση του προβλήµατος C i V: απολύτως απαραίτητη. Ορισµός ορθογραφικού συµπλέγµατος C i V: Bakamidis & Carayannis 1987 ΘΕΣΗ 1 ( C ): { β, γ, δ, ζ, λ, µ, ν, ρ, θ, κ, ξ, π, σ, τ, φ, χ, ψ } (8+9) ΘΕΣΗ 2 ( i ): { ι, ει, οι, υι, υ} (5) ΘΕΣΗ 3 ( V ): { α, ε, αι, ι, ει, οι, υι, υ, ο, ω, ου, ά, έ, αί, ί, εί, οί, υί, ύ, ό, ώ, ού} (22)
  • 18. 05/2005 Κωνσταντίνος Καληµέρης ΜίαΜία απόπειρααπόπειρα µοντελοποίησηςµοντελοποίησης τουτου προβλήµατοςπροβλήµατος C i VC i V Α: λέξεις C i V, όπου i = [i] (ιδιότητα, ποιότητα, αφιέρωσαν) Β: λέξεις C i V, όπου i = [ٍ] (πόδια, παιδιά) Γ: λέξεις C i V, όπου i = [ᯀ] (ψευτιά, κούφια, φωτιά) ∆: λέξεις C i V, όπου i = [i] ~ [j] ~ [ٍ] (βιοµηχανικό, διαβατήριο) Ε: λέξεις C i V, όπου i = [i] ~ [‫گ‬] ~ [ᯀ] (σιωπή, πλουσιότερος, στρατιωτικός, βοήθεια) Ζ: λέξεις C i V, όπου ν+i = [ْ], χ+i = [ᯀ], γ+i = [ٍ], λ+i = [ѭ], κ+i = [c], γκ+i = [᭥], γγ+i = [᭥] (γαρδένια, χιόνι, γιατρός, λιακάδα, µαγκιά, ουγγιά) Η: λέξεις που δεν περιέχουν C i V. Κατάτµηση των ορθογραφικών αναπαραστάσεων του λεξιλογίου της ΝΕ σε 7 Υποσύνολα: 3:33:2
  • 19. Ε: “∆ΗΜΟΣΘέΝΗΣ” Ε: “ΕΚΦ ΝΗΤΗΣ+” ∆: “∆ΗΜΟΣΘέΝΗΣ” ∆: “ΕΚΦ ΝΗΤΗΣ+” < χiC/χeC > (ΟΧΙ <CiV>) < γiC/γeC > (ΟΧΙ <CiV>) < CiC > (ΟΧΙ <CiV>)3 : 3 [i] [ ‫گ‬ ] * <j> DEFAULT ΑΝΤΙΣΤΟΙΧΗΣΗ «Β» (και µέρος του «Ζ») * «∆» [ٍ] [j] «Ε» [ᯀ] «Γ» (και µέρος του «Ζ») * <i> DEFAULT ΑΝΤΙΣΤΟΙΧΗΣΗ «Α» [ᯀ] [ ‫گ‬ ] [i] [j] [ٍ] ΠΡΟΤΕΙΝΟΜΕΝΑ ΣΥΜΒΟΛΑ [ᯀ] [ٍ] [i] <ᯀ> DEFAULT ΑΝΤΙΣΤΟΙΧΗΣΗ <ᯀ> <i> <j> <i> < CiV > (ΑΗΧΟ C ) * ΗΧΗΤΙΚΕΣ ΑΜΦΙΣΗΜΙΕΣ: ΑΠΩΛΕΙΑ ΖΕΥΓΩΝ: [ᾩjavazo] [ᾩiatazo] < CiV > (ΗΧΗΡΟ C ) ΕΣΦΑΛΜΕΝΕΣ* ΑΝΤΙΣΤΟΙΧΙΣΕΙΣ:
  • 20. Τριεπίπεδη ανάλυση των 7 προτεινόµενων αλλοφώνων του φωνήµατος / i /, ανάλογα µε τον ενδοσυλλαβικό ρόλο τους και τα αρθρωτικά και ακροατικά τους χαρακτηριστικά. ΑΚΡΟΑΤΗΣ: ΑΠΟΚΩ∆ΙΚΟΠΟΙΗΣΗ ΑΚΡΟΑΤΙΚΟ (ΑΝΤΙΛΗΠΤΙΚΟ) ΕΠΙΠΕ∆Ο ΚΩ∆ΙΚΑΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΣΥΝ∆ΥΑΣΤΙΚΟ- ΛΕΙΤΟΥΡΓΙΚΟ ΕΠΙΠΕ∆Ο ΟΜΙΛΗΤΗΣ: ΚΩ∆ΙΚΟΠΟΙΗΣΗ ΑΡΘΡΩΤΙΚΟ (ΜΗΧΑΝΙΚΟ) ΕΠΙΠΕ∆Ο Αρθρωτικώς ΤΕΤΑΜΕΝΑ Αλλόφωνα ΦΩΝΗΕΝΤΙΚΗΣ Φύσεως (µέρος Συλλαβικού Πυρήνα) Αλλόφωνα ΣΥΜΦΩΝΙΚΗΣ Φύσεως (µέρος Αρχής συλλαβής) Ακροατικώς ΚΕΝΤΡΙΚΑ (Ρόλος “V”) Ακροατικώς ΠΕΡΙΦΕΡΕΙΑΚΟ (Ρόλος “C”) ΑΛΛΟΦΩΝΑ του φωνήµατος /i/ Αρθρωτικώς ΧΑΛΑΡΟ Αρθρωτικώς ΧΑΛΑΡΟ Ακροατικώς ΠΕΡΙΦΕΡΕΙΑΚΑ (Ρόλος “C”) [i] [‫]گ‬ [j] [‫گ‬] [ᯀ] [ٍ] φω-τιά κού-φια παι-διά πό-δια [ْ] Αρθρωτικώς ΧΑΛΑΡΟ Αρθρωτικώς ΤΕΤΑΜΕΝΟ σπί-τι πη-λός ρο-λό-ι πε-ρι-ω-πής χάι-δε-ψα αη-δό-νι Αϊ-βα-λί κο-ρόι-δο δια-φα-νής σέι-κερ πλου-σιό-τε-ρος στρα-τιω-τι-κός η-λι-θιω-δώς α-να-µε-τριέ-ται βο-ή-θεια ζη-µιά α-γρί-µια πε-ρι-ο-δι-κό δη-λη-τη-ρι-ά-ζω “∆ΗΜΟΣΘέΝΗΣ” “ΕΚΦ ΝΗΤΗΣ+”
  • 21. 05/2005 Κωνσταντίνος Καληµέρης ΗΗ έννοιαέννοια τουτου ΛειτουργικούΛειτουργικού ΦορτίουΦορτίου ((FL)FL) Γλωσσολόγοι: “Σε τι ποσοστό εκµεταλλεύεται το φωνολογικό σύστηµα της ΝΕ τις ηχητικές αντιθέσεις που έχει στην διάθεσή του;” Πλήθος ελαχίστων ζευγών για την αντίθεση [x~y] Συνολικό πλήθος ελαχίστων ζευγών για όλες τις αντιθέσεις Μηχανικοί: “Για κάθε ελάχιστο ζεύγος λέξεων W1 και W2 , πόσο πιθανό είναι για τον δέκτη να αποκωδικοποιήσει το µεταδιδόµενο από τον ποµπό σήµα [W1] ως W2 , και αντιστρόφως;” (συχνότητα εµφάνισης) Εφαρµογές: Κατάλογος φωνηµάτων για την ΝΕ Πρόβλεψη κατεύθυνσης φωνολογικών αλλαγών Πρόσκτηση φωνολογικού συστήµατος από τα βρέφη Παθολογία της γλώσσας Συστήµατα σύνθεσης / αναγνώρισης φωνής: κατάταξη πιθανών βελτιώσεων σε περισσότερο ή λιγότερο επωφελείς (ή επείγουσες!) FL[x~y] =
  • 22. 05/2005 Κωνσταντίνος Καληµέρης ΑπολογισµόςΑπολογισµός 1. Εξαγωγή φωνολογικής πληροφορίας από ΕΘΕΓ: σκόπιµη & εφικτή. 2. Συγκέντρωση και προεπεξεργασία πρωτογενών δεδοµένων. 3. Αυτόµατη µεταγραφή σε IPA: εφικτή, αλλά ανάγκη για βελτίωση του εργαλείου (C i V). 4. Μία αρχική µοντελοποίηση του προβλήµατος της Συνίζησης / C i V. 5. Μοντελοποίηση συλλαβικού πυρήνα: ενδοσυλλαβικοί ρόλοι V, V’, C Απλός πυρήνας: Ν = V / V’ : πη-λός, κυ-ρι-εύ-ω Σύνθετος πυρήνας: Ν= CV / CV’: δια-φά-νει-α ή Ν= VC / V’C: γαϊ-δού-ρι Ανάθεση αλλοφώνων σε ρόλους: [i, ‫]گ‬ = V / V’ (πυρηνικά, κεντρικά), [j] = C (πυρηνικό, περιφ.), [‫,گ‬ ᯀ, ٍ, ْ] = C (µη-πυρηνικά, περιφ.) 6. Αλλόφωνα /i/: ανάγκη ανεύρεσης περιβαλλόντων χωρίς επικάλυψη. 7. Ανάγκη εµπλουτισµού συστήµατος αναπαράστασης: [j], [ٍ], [‫,]گ‬ [‫.]گ‬
  • 23. 05/2005 Κωνσταντίνος Καληµέρης ΤρέχουσεςΤρέχουσες εξελίξειςεξελίξεις && µελλοντικέςµελλοντικές προοπτικέςπροοπτικές minpair : εργαλείο ανεύρεσης ζεύγη λέξεων τύπου [abcd]~[abxd]. - Εκσφαλµάτωση και κατασκευή διεπαφής λειτουργίας σε Windows. ∆ηµιουργία σωµάτων λέξεων µε C i V (πηγές: ΕΘΕΓ, Μορφολογικό). - Αυτόµατη φωνητική µεταγραφή των ανωτέρω. - Αξιολόγηση µεταγραφών: έλεγχος, διόρθωση, κατηγοριοποίηση. - Εξαγωγή νέων κανόνων µεταγραφής για λέξεις µε C i V. - Βελτίωση του εργαλείου φωνητικής µεταγραφής. (Εκ νέου) αυτόµατη φωνητική µεταγραφή ορθογραφικών δεδοµένων. Εξαγωγή, κατηγοριοποίηση και αξιολόγηση ελαχίστων ζευγών. Ορισµός µαθηµατικών τύπων για υπολογισµό λειτουργικών φορτίων. Υπολογισµός λειτουργικών φορτίων. Ποια η φωνολογική υπόσταση των [b, d, ց, j, ٍ, ْ, ѭ, ᯀ, c, ᭥, ts, dz, ps, ks]; ∆ικαιολογούνται διφθογγικά φωνήµατα στην ΝΕ;