Pranešimas XVII mokslinės kompiuterininkų konferencijos
sekcijoje „K8. Statistiniai metodai, optimizavimas ir prognozavimas“
„Kompiuterininkų dienos – 2015“, Panevėžyje, KTU PTVF 2013-09-19
2. • Vis daugiau dėmesio skiriama kuo
efektyvesniam kompiuterinių programų
panaudojimui kalbos bei šnekos analizei.
• Problema:
negalima tiesiogiai pasinaudoti kitose
šalyse jau sukurta programine įranga
(pavyzdžiui, morfologiniam
daugiareikšmiškumui išspręsti, automatinei
sintaksinei analizei), nes lietuvių kalba yra
gana sudėtinga, pasižymi morfologiniu
daugiareikšmiškumu, dideliu kaitomumu,
laisva žodžių tvarka sakinyje ir pan.
3. • Hipotezė:
Dėl lietuvių kalbos specifiškumo ir
sudėtingumo trigramų statistika pagrįsti
algoritmai nėra tinkami lietuvių kalbos
tyrimams.
• Aktualus uždavinys – sakinio ar teksto
struktūros analizė bei tos struktūros
sudėtingumo įvertinimas.
7. Duomenys
• Lietuvių rašytojų prozos knygos,
• išleistos 1995–2011 m.,
• skirtos vaikams,
• apimtis ne mažesnė kaip 44 psl.,
• saugomos Šiaulių universiteto bibliotekoje.
• 36 autoriai
• po 10 sakinių.