SlideShare a Scribd company logo
1 of 17
Download to read offline
Prižiūrima aplinkos duomenų
klasifikacija, pagrįsta
erdviniais auto-beta modeliais
„Kompiuterininkų dienos 2021“
Rugsėjo 23-24 d. Klaipėdos universitete ir virtualiai
Eglė Zikarienė, Kęstutis Dučinskas
Nagrinėjamas duomenų modelis
• Atsitiktiniai laukai ir - atitinkamai
požymio reikšmės ir klasių žymės.
• Mokymo aibė - 𝑇 = 𝑍′, 𝑌′ ′
• Sprendžiamas uždavinys – stebinio klasifikavimas naudojant
prižiūrimo klasifikavimo generatyvinius (ang. generative) metodus.
• Nagrinėjama situacija, kai požymio reikšmės patenka į intervalą
ir klasių žymės įgyja dvi reikšmes: 1 arba 2.
• Transformacijos, tam kad duomenų skirstinys būtų normalusis,
• Geriausiai duomenis aprašančio skirstinio parinkimas.
 
 
: p
Z s s D R
   
 
: p
Y s s D R
 
 
0
Z s
 
0,1
Šakotojo Banguolio
duomenys
• Duomenys su pilna informacija (448) su
daline informacija (193).
• Vienas stebėjimo taškas - tai 1 kv. m
sritis, augmenijos padengimas,
vertinamas procentais, požymio
reikšmės Z.
• Klasifikuojamas gruntas, esantis po
augmenija.
• 1 klasė – rieduliai, 2 klasė – ne rieduliai
(žvirgždas, smėlis) - klasių žymės Y.
Auto-Beta modelis erdviniams duomenims
• Beta modelis su transformacija:
• Sąlyginis beta skirstinys:
čia
• Natūralieji parametrai:
• koordinatės:
• Parametras - apibrėžia priklausomybę tarp požymio reikšmių taške
• Pilnai sąlyginė tankio funkcija (Hardouin, Yao, 2008):
 
0 0 0 0
, ~ ,
l l
Z T t Y l Beta a b
 
0 01 0 02
1, 1, 1,2.
l l
l l
a A b A l
    
 0 , j
s s
     
0
0
1
1
0 0 0 0 0 0 0 0 0 0
, ; , 1 ;
l
l
b
a
l l l l l
f f z t y l a b z z B a b



   
 
 
1 0.5 /
org
z z n n
  
 
0
01 1 1 2 2
, 0
ln 1
l
j
l l l
j
z NN j
A x x z
  
 
   
  
0
02 3 1 4 2
0
ln
l
j
l l l
j
z NN j
A x x z
  
 
   
1 2
, .
x x
0
s
Auto-Beta modelio klasifikavimo funkcijos
• Sąlyginė Bajeso diskriminantinė funkcija:
• Sąlyginė tiesinė diskriminantinė funkcija:
           
1
1 2 1 2
0 01
0 01 01 0 01 02 0 0
2
0 01
; ln ln ln 1 ,
f
W z A A z A A z
f



 

        
 
 
     
 
0 0
0 1 02 02 1 01 02
ln , , ,
B a b B a b
  
  
 
 
  
1 2
0 0 0 1 2
0 0 0
0 2 0 2
1 01 2 02
2
ˆ
, ,
z
L z
 
  
   
 
   

  0
0 0 0
0 0
, ,
l l
l l
a
E Z T t y l
a b
    

 
   
2 0 0
0 0 0 2
0 0 0 0
var , .
1
l l
l
l l l l
a b
Z T t y l
a b a b
    
  
0
1
0
2
ln ,



 
  
 
0
apriorinės tikimybės.
l
 
Klasifikavimo klaidos tikimybė
• Tikroji klaidos tikimybė (ang. actual error rate, AER) (Dučinskas, 2009):
čia t. y.
čia - Heaviside step funkcija.
• Apriorinės tikimybės:
• vertinamos atsižvelgiant į turimų klasių imties dydžius:
• vertinamos atsižvelgiant į turimą informaciją:
  0
ˆ ˆ
l l
l
P P

  
   
 
0
ˆ ˆ
1,2, 1 , 0
l
l lZ Z
l P P W z
    
 
 
 
   
1
1 01 01
, 0
0
ˆ ˆ
,
Z
Z
W t
P f t dt H W t f t dt
 
   
   
 
 
   
1
2 02 02
, 0
0
ˆ ˆ
,
Z
Z
W t
P f t dt H W t f t dt
 
  
 
 
.
H
0
l l
N N
 
0
0
0
0 0
1 1
l
l
j NN
j NN j j
d d



  
Artimiausių kaimynų sritys
Vidutiniai tikrųjų klasifikavimo klaidų įverčiai
Vidutinių tikrųjų klasifikavimo klaidų santykis
Šakotojo Banguolio duomenų tyrimas
• Mokymo aibė:
• 113 – nenulinės reikšmės; 335 – nulinės reikšmės.
• Testavimo aibė:
• 49– nenulinės reikšmės; 144– nulinės reikšmės.
• Beta modelis su transformacija:
• Perteklinių nulių auto-Beta modelis (ang. zero inflated auto-Beta
model)
1 2
448, 354, 94.
n n n
  
1 2
193, 149, 44.
m m m
  
 
   
1 0.5 /
org
z z n m n m
    
Perteklinių nulių auto-Beta modelis
erdviniams duomenims
• Sąlyginis skirstinys:
čia
• Parametras - apibrėžia priklausomybę tarp požymio reikšmių taške
• Parametras - mišinio parametras, nulinės reikšmės tikimybė.
• Sąlyginė tankio funkcija:
 0 , j
s s
 
0 0 0 0 0
, ~ , ,
l l l
Z T t Y l BEZI a b c
 
         
0 0 0 0 0 0 0 0 0 0 0 0 0
, , 0 1 0 ,
l l l l l l l l l
g z a b c c I z c I z f z a b
    
0
0 1
l
c
 
 
0
0 1 1 2 2
, 0
ln 1 1
l
j
l l
l j
z NN j
a x x z
  
 
 
    
 
 
 
  
0
0 3 1 4 2
0
ln 1
l
j
l l
l j
z NN j
b x x z
  
 
 
   
 
 
 

   
0 0
0
, 0 , 0
exp 0 1 exp 0
l l
j j
l l l l
l j j
z NN j z NN j
c I z I z
   
   
 
   
   
 
     
   
 
   
   
 
 
Šakotojo Banguolio modeliai
• Šakotojo Banguolio padengimo modeliai:
• Apriorinės tikimybės:
• vertinamos atsižvelgiant į turimų klasių imties dydžius:
• vertinamos atsižvelgiant į turimą informaciją:
 
0 0 0
, ~ ,
l l
Z T t Y l Beta a b
 
 
0
0 1 1 2 2
, 0
ln 1 1
l
j
l l
l j
z NN j
a x x z
  
 
 
    
 
 
 
  
0
0 3 1 4 2
0
ln 1
l
j
l l
l j
z NN j
b x x z
  
 
 
   
 
 
 

0 0
1 2
1 2
,
N N
N N
 
 
1
0
0
0
1
0 0
1 1
j NN
j NN j j
d d



  
 
0 0 0 0
, ~ , ,
l l l
Z T t Y l BEZI a b c
 
   
0 0
0
, 0 , 0
exp 0 1 exp 0
l l
j j
l l l l
l j j
z NN j z NN j
c I z I z
   
   
 
   
   
 
     
   
 
   
   
 
 
BEZI modelio klasifikavimo funkcijos
• Sąlyginė Bajeso diskriminantinė funkcija:
• Tikrosios klasifikavimo tikimybės vertinimas Hold out metodu:
• Apriorinės tikimybės:
0
apriorinės tikimybės,
l
 
     
 
 
 
1 1
01
0 01 0 01 01
0 0 0
2 2
02 02 02
0 02 0
1
; ln ln ln 0 1 0 ln ln
1
c
g c f
W Z I z I z
c c f
g
 
 
 
 

       
        
 
 
       
 
 

   
     
 
0 pilnai sąlyginė beta skirtinio tankio funkcija.
l
f 
 
   
 
 
1
1
1 2
1 1
ˆ ˆ
; ;
m m
j j
j j m
H W Z H W Z
HOR
m
  
   

 
0
l l
N N
 
0
0
0
0 0
1 1
l
l
j NN
j NN j j
d d



  
Artimiausių kaimynų sritys
Klasifikavimo klaidos įverčiai, naudojant Hold
out metodą.
Prior probability Nearest neighbour areas
1 km 3 km 7 km ~30 km
BETA BEZI BETA BEZI BETA BEZI BETA BEZI
Sample size 0,3550 0,2435 0,3783 0,2642 0,3377 0,2487 0,3837 0,2435
Inv. dist. max min dist. 0,3550 0,2021 0,3783 0,2383 0,3377 0,2228 0,3837 0,2176
Inv. dist. all training sample 0,3550 0,2228 0,3783 0,2487 0,3377 0,2435 0,3837 0,2383
Inv. dist. 4 NN 0,3550 0,2073 0,3783 0,2280 0,3377 0,2124 0,3837 0,2021
Išvados
• Pasiūlytos klasifikavimo taisyklės erdviniams auto beta modeliams, pagrįstos
klasifikuojamo stebinio sąlyginiais tankiais. Palyginimas atliktas sprendžiant dugno
tipo nustatymo uždavinį Baltijos jūros priekrantės zonoje.
• BDF klasifikavimo taisyklė palyginta su modifikuota LDF klasifikavimo taisykle.
Palyginimas atliktas skaičiuojant vidutines tikrosios klaidos tikimybes. BDF
didesnis pranašumas pastebėtas, kai į apriorinių tikimybių skaičiavimą įtraukiama
erdvinė informacija.
• Požymio reikšmių modeliavimui pasirinkti auto-beta ir BEZI modeliai. Pritaikyta
BDF klasifikavimo taisyklė, palyginimas atliktas skaičiuojant empirinę tikrosios
klaidos tikimybę. BEZI modelio pranašumas, klaidų įverčiai gauti mažiausi, kai į
apriorinių tikimybių skaičiavimą įtraukiama erdvinė informacija.
Ačiū.

More Related Content

More from Lietuvos kompiuterininkų sąjunga

D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseD. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseLietuvos kompiuterininkų sąjunga
 
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...Lietuvos kompiuterininkų sąjunga
 
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...Lietuvos kompiuterininkų sąjunga
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Lietuvos kompiuterininkų sąjunga
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Lietuvos kompiuterininkų sąjunga
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Lietuvos kompiuterininkų sąjunga
 
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėGražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėLietuvos kompiuterininkų sąjunga
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Lietuvos kompiuterininkų sąjunga
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Lietuvos kompiuterininkų sąjunga
 
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...Lietuvos kompiuterininkų sąjunga
 
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...Lietuvos kompiuterininkų sąjunga
 
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitisAndrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitisLietuvos kompiuterininkų sąjunga
 

More from Lietuvos kompiuterininkų sąjunga (20)

D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseD. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
 
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
 
G. Mezetis. Skaimenines valstybes link
G. Mezetis. Skaimenines valstybes link G. Mezetis. Skaimenines valstybes link
G. Mezetis. Skaimenines valstybes link
 
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
 
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
 
Raimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymasRaimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymas
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
 
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotisRima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
 
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėGražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
 
Eugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto keliasEugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto kelias
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
 
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklaiOlga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
 
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
 
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
 
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
 
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitisAndrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
 

Recently uploaded

Pigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food ManufacturingPigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food ManufacturingPigging Solutions
 
SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024Scott Keck-Warren
 
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Alan Dix
 
Key Features Of Token Development (1).pptx
Key  Features Of Token  Development (1).pptxKey  Features Of Token  Development (1).pptx
Key Features Of Token Development (1).pptxLBM Solutions
 
The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024Rafal Los
 
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024BookNet Canada
 
How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?XfilesPro
 
Presentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreterPresentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreternaman860154
 
Handwritten Text Recognition for manuscripts and early printed texts
Handwritten Text Recognition for manuscripts and early printed textsHandwritten Text Recognition for manuscripts and early printed texts
Handwritten Text Recognition for manuscripts and early printed textsMaria Levchenko
 
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Patryk Bandurski
 
Breaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path MountBreaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path MountPuma Security, LLC
 
Unblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen FramesUnblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen FramesSinan KOZAK
 
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024BookNet Canada
 
AI as an Interface for Commercial Buildings
AI as an Interface for Commercial BuildingsAI as an Interface for Commercial Buildings
AI as an Interface for Commercial BuildingsMemoori
 
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | DelhiFULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhisoniya singh
 
Factors to Consider When Choosing Accounts Payable Services Providers.pptx
Factors to Consider When Choosing Accounts Payable Services Providers.pptxFactors to Consider When Choosing Accounts Payable Services Providers.pptx
Factors to Consider When Choosing Accounts Payable Services Providers.pptxKatpro Technologies
 
08448380779 Call Girls In Civil Lines Women Seeking Men
08448380779 Call Girls In Civil Lines Women Seeking Men08448380779 Call Girls In Civil Lines Women Seeking Men
08448380779 Call Girls In Civil Lines Women Seeking MenDelhi Call girls
 
The Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxThe Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxMalak Abu Hammad
 
Install Stable Diffusion in windows machine
Install Stable Diffusion in windows machineInstall Stable Diffusion in windows machine
Install Stable Diffusion in windows machinePadma Pradeep
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationSafe Software
 

Recently uploaded (20)

Pigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food ManufacturingPigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food Manufacturing
 
SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024
 
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
 
Key Features Of Token Development (1).pptx
Key  Features Of Token  Development (1).pptxKey  Features Of Token  Development (1).pptx
Key Features Of Token Development (1).pptx
 
The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024
 
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
 
How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?
 
Presentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreterPresentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreter
 
Handwritten Text Recognition for manuscripts and early printed texts
Handwritten Text Recognition for manuscripts and early printed textsHandwritten Text Recognition for manuscripts and early printed texts
Handwritten Text Recognition for manuscripts and early printed texts
 
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
 
Breaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path MountBreaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path Mount
 
Unblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen FramesUnblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen Frames
 
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
 
AI as an Interface for Commercial Buildings
AI as an Interface for Commercial BuildingsAI as an Interface for Commercial Buildings
AI as an Interface for Commercial Buildings
 
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | DelhiFULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
 
Factors to Consider When Choosing Accounts Payable Services Providers.pptx
Factors to Consider When Choosing Accounts Payable Services Providers.pptxFactors to Consider When Choosing Accounts Payable Services Providers.pptx
Factors to Consider When Choosing Accounts Payable Services Providers.pptx
 
08448380779 Call Girls In Civil Lines Women Seeking Men
08448380779 Call Girls In Civil Lines Women Seeking Men08448380779 Call Girls In Civil Lines Women Seeking Men
08448380779 Call Girls In Civil Lines Women Seeking Men
 
The Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxThe Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptx
 
Install Stable Diffusion in windows machine
Install Stable Diffusion in windows machineInstall Stable Diffusion in windows machine
Install Stable Diffusion in windows machine
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
 

Prižiūrima aplinkos duomenų klasifikacija erdviniais modeliais

  • 1. Prižiūrima aplinkos duomenų klasifikacija, pagrįsta erdviniais auto-beta modeliais „Kompiuterininkų dienos 2021“ Rugsėjo 23-24 d. Klaipėdos universitete ir virtualiai Eglė Zikarienė, Kęstutis Dučinskas
  • 2. Nagrinėjamas duomenų modelis • Atsitiktiniai laukai ir - atitinkamai požymio reikšmės ir klasių žymės. • Mokymo aibė - 𝑇 = 𝑍′, 𝑌′ ′ • Sprendžiamas uždavinys – stebinio klasifikavimas naudojant prižiūrimo klasifikavimo generatyvinius (ang. generative) metodus. • Nagrinėjama situacija, kai požymio reikšmės patenka į intervalą ir klasių žymės įgyja dvi reikšmes: 1 arba 2. • Transformacijos, tam kad duomenų skirstinys būtų normalusis, • Geriausiai duomenis aprašančio skirstinio parinkimas.     : p Z s s D R       : p Y s s D R     0 Z s   0,1
  • 3. Šakotojo Banguolio duomenys • Duomenys su pilna informacija (448) su daline informacija (193). • Vienas stebėjimo taškas - tai 1 kv. m sritis, augmenijos padengimas, vertinamas procentais, požymio reikšmės Z. • Klasifikuojamas gruntas, esantis po augmenija. • 1 klasė – rieduliai, 2 klasė – ne rieduliai (žvirgždas, smėlis) - klasių žymės Y.
  • 4. Auto-Beta modelis erdviniams duomenims • Beta modelis su transformacija: • Sąlyginis beta skirstinys: čia • Natūralieji parametrai: • koordinatės: • Parametras - apibrėžia priklausomybę tarp požymio reikšmių taške • Pilnai sąlyginė tankio funkcija (Hardouin, Yao, 2008):   0 0 0 0 , ~ , l l Z T t Y l Beta a b   0 01 0 02 1, 1, 1,2. l l l l a A b A l       0 , j s s       0 0 1 1 0 0 0 0 0 0 0 0 0 0 , ; , 1 ; l l b a l l l l l f f z t y l a b z z B a b            1 0.5 / org z z n n      0 01 1 1 2 2 , 0 ln 1 l j l l l j z NN j A x x z             0 02 3 1 4 2 0 ln l j l l l j z NN j A x x z          1 2 , . x x 0 s
  • 5. Auto-Beta modelio klasifikavimo funkcijos • Sąlyginė Bajeso diskriminantinė funkcija: • Sąlyginė tiesinė diskriminantinė funkcija:             1 1 2 1 2 0 01 0 01 01 0 01 02 0 0 2 0 01 ; ln ln ln 1 , f W z A A z A A z f                            0 0 0 1 02 02 1 01 02 ln , , , B a b B a b              1 2 0 0 0 1 2 0 0 0 0 2 0 2 1 01 2 02 2 ˆ , , z L z                   0 0 0 0 0 0 , , l l l l a E Z T t y l a b             2 0 0 0 0 0 2 0 0 0 0 var , . 1 l l l l l l l a b Z T t y l a b a b         0 1 0 2 ln ,           0 apriorinės tikimybės. l  
  • 6. Klasifikavimo klaidos tikimybė • Tikroji klaidos tikimybė (ang. actual error rate, AER) (Dučinskas, 2009): čia t. y. čia - Heaviside step funkcija. • Apriorinės tikimybės: • vertinamos atsižvelgiant į turimų klasių imties dydžius: • vertinamos atsižvelgiant į turimą informaciją:   0 ˆ ˆ l l l P P           0 ˆ ˆ 1,2, 1 , 0 l l lZ Z l P P W z                1 1 01 01 , 0 0 ˆ ˆ , Z Z W t P f t dt H W t f t dt                   1 2 02 02 , 0 0 ˆ ˆ , Z Z W t P f t dt H W t f t dt          . H 0 l l N N   0 0 0 0 0 1 1 l l j NN j NN j j d d      
  • 10. Šakotojo Banguolio duomenų tyrimas • Mokymo aibė: • 113 – nenulinės reikšmės; 335 – nulinės reikšmės. • Testavimo aibė: • 49– nenulinės reikšmės; 144– nulinės reikšmės. • Beta modelis su transformacija: • Perteklinių nulių auto-Beta modelis (ang. zero inflated auto-Beta model) 1 2 448, 354, 94. n n n    1 2 193, 149, 44. m m m          1 0.5 / org z z n m n m     
  • 11. Perteklinių nulių auto-Beta modelis erdviniams duomenims • Sąlyginis skirstinys: čia • Parametras - apibrėžia priklausomybę tarp požymio reikšmių taške • Parametras - mišinio parametras, nulinės reikšmės tikimybė. • Sąlyginė tankio funkcija:  0 , j s s   0 0 0 0 0 , ~ , , l l l Z T t Y l BEZI a b c             0 0 0 0 0 0 0 0 0 0 0 0 0 , , 0 1 0 , l l l l l l l l l g z a b c c I z c I z f z a b      0 0 1 l c     0 0 1 1 2 2 , 0 ln 1 1 l j l l l j z NN j a x x z                      0 0 3 1 4 2 0 ln 1 l j l l l j z NN j b x x z                       0 0 0 , 0 , 0 exp 0 1 exp 0 l l j j l l l l l j j z NN j z NN j c I z I z                                            
  • 12. Šakotojo Banguolio modeliai • Šakotojo Banguolio padengimo modeliai: • Apriorinės tikimybės: • vertinamos atsižvelgiant į turimų klasių imties dydžius: • vertinamos atsižvelgiant į turimą informaciją:   0 0 0 , ~ , l l Z T t Y l Beta a b     0 0 1 1 2 2 , 0 ln 1 1 l j l l l j z NN j a x x z                      0 0 3 1 4 2 0 ln 1 l j l l l j z NN j b x x z                   0 0 1 2 1 2 , N N N N     1 0 0 0 1 0 0 1 1 j NN j NN j j d d         0 0 0 0 , ~ , , l l l Z T t Y l BEZI a b c       0 0 0 , 0 , 0 exp 0 1 exp 0 l l j j l l l l l j j z NN j z NN j c I z I z                                            
  • 13. BEZI modelio klasifikavimo funkcijos • Sąlyginė Bajeso diskriminantinė funkcija: • Tikrosios klasifikavimo tikimybės vertinimas Hold out metodu: • Apriorinės tikimybės: 0 apriorinės tikimybės, l               1 1 01 0 01 0 01 01 0 0 0 2 2 02 02 02 0 02 0 1 ; ln ln ln 0 1 0 ln ln 1 c g c f W Z I z I z c c f g                                                        0 pilnai sąlyginė beta skirtinio tankio funkcija. l f            1 1 1 2 1 1 ˆ ˆ ; ; m m j j j j m H W Z H W Z HOR m           0 l l N N   0 0 0 0 0 1 1 l l j NN j NN j j d d      
  • 15. Klasifikavimo klaidos įverčiai, naudojant Hold out metodą. Prior probability Nearest neighbour areas 1 km 3 km 7 km ~30 km BETA BEZI BETA BEZI BETA BEZI BETA BEZI Sample size 0,3550 0,2435 0,3783 0,2642 0,3377 0,2487 0,3837 0,2435 Inv. dist. max min dist. 0,3550 0,2021 0,3783 0,2383 0,3377 0,2228 0,3837 0,2176 Inv. dist. all training sample 0,3550 0,2228 0,3783 0,2487 0,3377 0,2435 0,3837 0,2383 Inv. dist. 4 NN 0,3550 0,2073 0,3783 0,2280 0,3377 0,2124 0,3837 0,2021
  • 16. Išvados • Pasiūlytos klasifikavimo taisyklės erdviniams auto beta modeliams, pagrįstos klasifikuojamo stebinio sąlyginiais tankiais. Palyginimas atliktas sprendžiant dugno tipo nustatymo uždavinį Baltijos jūros priekrantės zonoje. • BDF klasifikavimo taisyklė palyginta su modifikuota LDF klasifikavimo taisykle. Palyginimas atliktas skaičiuojant vidutines tikrosios klaidos tikimybes. BDF didesnis pranašumas pastebėtas, kai į apriorinių tikimybių skaičiavimą įtraukiama erdvinė informacija. • Požymio reikšmių modeliavimui pasirinkti auto-beta ir BEZI modeliai. Pritaikyta BDF klasifikavimo taisyklė, palyginimas atliktas skaičiuojant empirinę tikrosios klaidos tikimybę. BEZI modelio pranašumas, klaidų įverčiai gauti mažiausi, kai į apriorinių tikimybių skaičiavimą įtraukiama erdvinė informacija.