SlideShare a Scribd company logo
1 of 17
Sakinio struktūros analizė
Karolina Piaseckienė (ŠU)
• Vis daugiau dėmesio skiriama kuo
efektyvesniam kompiuterinių programų
panaudojimui kalbos bei šnekos analizei.
• Problema:
negalima tiesiogiai pasinaudoti kitose
šalyse jau sukurta programine įranga
(pavyzdžiui, morfologiniam
daugiareikšmiškumui išspręsti, automatinei
sintaksinei analizei), nes lietuvių kalba yra
gana sudėtinga, pasižymi morfologiniu
daugiareikšmiškumu, dideliu kaitomumu,
laisva žodžių tvarka sakinyje ir pan.
• Hipotezė:
Dėl lietuvių kalbos specifiškumo ir
sudėtingumo trigramų statistika pagrįsti
algoritmai nėra tinkami lietuvių kalbos
tyrimams.
• Aktualus uždavinys – sakinio ar teksto
struktūros analizė bei tos struktūros
sudėtingumo įvertinimas.
Sakinio struktūros sudėtingumas
Sakinio struktūros sudėtingumas
• Į karaliaus ir karalienės sveikatą gėrė.
Sakinio struktūros sudėtingumas
Duomenys
• Lietuvių rašytojų prozos knygos,
• išleistos 1995–2011 m.,
• skirtos vaikams,
• apimtis ne mažesnė kaip 44 psl.,
• saugomos Šiaulių universiteto bibliotekoje.
• 36 autoriai
• po 10 sakinių.
Išplečiančių SD
skaičius
0 1 2 3 4 5 6 7
Veiksnį ISD dažniai 171 78 20 11 8 2 1 2
Tarinį ISD dažniai 44 110 118 89 54 28 15 11
Išplečiančių SD
skaičius
8 9 10 11 12 13 14 15
Veiksnį ISD dažniai 0 1 1 1 0 0 0 0
Tarinį ISD dažniai 4 0 2 1 1 1 1 1
• Regresijos modelis tarinį išplečiančioms
sakinio dalims:
._427,1_364,0788,1_ skTilsakišplSDT ⋅−⋅+=
• Regresijos modelis tarinį išplečiančioms
sakinio dalims:
• Regresijos modelis sakinio ilgiui:
._427,1_364,0788,1_ skTilsakišplSDT ⋅−⋅+=
._98,0__81,1_27,31_ gylisTskšakųTskTilsak ⋅+⋅+⋅+−=
Dėkoju už dėmesį!

More Related Content

Viewers also liked

Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...
Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...
Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...Lietuvos kompiuterininkų sąjunga
 
Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“
Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“
Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“Lietuvos kompiuterininkų sąjunga
 
Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas
Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas
Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas Lietuvos kompiuterininkų sąjunga
 
Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...
Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...
Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...Lietuvos kompiuterininkų sąjunga
 
Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...
Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...
Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...Lietuvos kompiuterininkų sąjunga
 
Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...
Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...
Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...Lietuvos kompiuterininkų sąjunga
 
Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...
Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...
Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...Lietuvos kompiuterininkų sąjunga
 

Viewers also liked (7)

Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...
Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...
Mindaugas BASTYS (LRS IVPK pirmininkas) „Pažangios valstybės kūrimo prielaido...
 
Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“
Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“
Olga KURASOVA „Duomenų analizės įrankio DAMIS panaudojimas“
 
Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas
Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas
Olga KURASOVA, Tomas PETKUS, Ilona CIUNEL. Mokytojų poreikio prognozės tyrimas
 
Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...
Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...
Tomas PRANCKEVIČIUS. Debesų kompiuterijos technologijų lygiagrečių skaičiavim...
 
Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...
Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...
Valentina DAGIENĖ, Tatjana JEVSIKOVA „Visuomenei aktualios programinės įrango...
 
Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...
Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...
Pawel FORCZMANSKI (West Pomeranian University of Technology) "Advanced digita...
 
Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...
Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...
Andrius PLEČKAITIS, Ingrida KUPČIŪNIENĖ. Skaitmeninių technologijų kūryba: mu...
 

More from Lietuvos kompiuterininkų sąjunga

Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizėEimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizėLietuvos kompiuterininkų sąjunga
 
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...Lietuvos kompiuterininkų sąjunga
 
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseD. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseLietuvos kompiuterininkų sąjunga
 
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...Lietuvos kompiuterininkų sąjunga
 
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...Lietuvos kompiuterininkų sąjunga
 
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...Lietuvos kompiuterininkų sąjunga
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Lietuvos kompiuterininkų sąjunga
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Lietuvos kompiuterininkų sąjunga
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Lietuvos kompiuterininkų sąjunga
 
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėGražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėLietuvos kompiuterininkų sąjunga
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Lietuvos kompiuterininkų sąjunga
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 

More from Lietuvos kompiuterininkų sąjunga (20)

LIKS ataskaita 2021-2023
LIKS ataskaita 2021-2023LIKS ataskaita 2021-2023
LIKS ataskaita 2021-2023
 
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizėEimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
 
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
 
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseD. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
 
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
 
G. Mezetis. Skaimenines valstybes link
G. Mezetis. Skaimenines valstybes link G. Mezetis. Skaimenines valstybes link
G. Mezetis. Skaimenines valstybes link
 
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
 
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
 
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
 
Raimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymasRaimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymas
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
 
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotisRima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
 
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėGražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
 
Eugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto keliasEugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto kelias
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
 
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklaiOlga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
 

Karolina PIASECKIENĖ „Sakinio struktūros analizė“

  • 2. • Vis daugiau dėmesio skiriama kuo efektyvesniam kompiuterinių programų panaudojimui kalbos bei šnekos analizei. • Problema: negalima tiesiogiai pasinaudoti kitose šalyse jau sukurta programine įranga (pavyzdžiui, morfologiniam daugiareikšmiškumui išspręsti, automatinei sintaksinei analizei), nes lietuvių kalba yra gana sudėtinga, pasižymi morfologiniu daugiareikšmiškumu, dideliu kaitomumu, laisva žodžių tvarka sakinyje ir pan.
  • 3. • Hipotezė: Dėl lietuvių kalbos specifiškumo ir sudėtingumo trigramų statistika pagrįsti algoritmai nėra tinkami lietuvių kalbos tyrimams. • Aktualus uždavinys – sakinio ar teksto struktūros analizė bei tos struktūros sudėtingumo įvertinimas.
  • 5. Sakinio struktūros sudėtingumas • Į karaliaus ir karalienės sveikatą gėrė.
  • 7. Duomenys • Lietuvių rašytojų prozos knygos, • išleistos 1995–2011 m., • skirtos vaikams, • apimtis ne mažesnė kaip 44 psl., • saugomos Šiaulių universiteto bibliotekoje. • 36 autoriai • po 10 sakinių.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12. Išplečiančių SD skaičius 0 1 2 3 4 5 6 7 Veiksnį ISD dažniai 171 78 20 11 8 2 1 2 Tarinį ISD dažniai 44 110 118 89 54 28 15 11 Išplečiančių SD skaičius 8 9 10 11 12 13 14 15 Veiksnį ISD dažniai 0 1 1 1 0 0 0 0 Tarinį ISD dažniai 4 0 2 1 1 1 1 1
  • 13.
  • 14.
  • 15. • Regresijos modelis tarinį išplečiančioms sakinio dalims: ._427,1_364,0788,1_ skTilsakišplSDT ⋅−⋅+=
  • 16. • Regresijos modelis tarinį išplečiančioms sakinio dalims: • Regresijos modelis sakinio ilgiui: ._427,1_364,0788,1_ skTilsakišplSDT ⋅−⋅+= ._98,0__81,1_27,31_ gylisTskšakųTskTilsak ⋅+⋅+⋅+−=