7.11 ๋ฐฐ๊น…๊ณผ ๊ธฐํƒ€ ์•™์ƒ๋ธ” ํ•™์Šต๋ฒ•
(๋‹ค์Œ์žฅ์˜ ๋“œ๋ž์•„์›ƒ ๊ณต๋ถ€์— ๋ฐฐ๊น…์˜ ๊ฐœ๋…์ด ํ•„์š”)
๋ฐฐ๊น…(Bootstrap Aggregating) :
์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ๊ฒฐํ•ฉ -> ์ผ๋ฐ˜ํ™” ์˜ค์ฐจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Œ
์—ฌ๋Ÿฌ ๋ชจ๋ธ๋“ค์˜ ์˜ˆ์ธก์„ ๋™์‹œ์— ๊ณ ๋ คํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜ํ™”์— ์ข‹์€ ์ด์œ 
๏ƒž ๊ฐ ๋ชจ๋ธ๋“ค์— ์˜ํ•œ ์˜ˆ์ธก์ด ์„œ๋กœ ๋‹ค๋ฅธ ์˜ค์ฐจ๋ฅผ ๊ฐ–๊ธฐ ๋•Œ๋ฌธ.
๋ฐฐ๊น…๊ณผ ๊ฐ™์€ ์•™์ƒ๋ธ” ๊ธฐ๋ฒ•์€ ๊ฑฐ์˜ ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ์ผ๋ฐ˜ํ™” ์˜ค์ฐจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ๋Š” ๊ฐ•๋ ฅํ•˜๊ณ  ๋ฏฟ์„ ๋งŒํ•œ ๋ฐฉ๋ฒ•
7.12 Dropout
Dropout์ด๋ž€?
- ํ•˜๋‚˜์˜ ์ƒ˜ํ”Œ์„ ํ›ˆ๋ จํ•  ๋•Œ๋งˆ๋‹ค ๊ฐ๊ฐ์˜ ๋…ธ๋“œ๋ฅผ ํ™•๋ฅ ์ ์œผ๋กœ ์‚ญ์ œํ•˜๋Š” ๊ฒƒ. (์ถœ๋ ฅ์œ ๋‹›์€ ์‚ญ์ œx)
- ํฐ ๋ชจ๋ธ์˜ ์ •์น™ํ™”๋ฅผ ์œ„ํ•œ ๊ฐ•๋ ฅํ•˜๊ณ  ๊ณ„์‚ฐ๋น„์šฉ์ด ๋‚ฎ์€ ๋ฐฉ๋ฒ•.
- ๋งŽ์€ ๋‰ด๋Ÿฐ๋“ค๋กœ ๊ตฌ์„ฑ๋œ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ์˜ ๋‚ด๋ถ€์—์„œ ๋ฐฐ๊น…๊ณผ ์œ ์‚ฌํ•œ ํšจ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๊ฒŒ ํ•จ.
7.12 Dropout
์‹ ๊ฒฝ๋ง์—์„œ ์œ ๋‹›์„ ์‚ญ์ œํ•˜์—ฌ ์–ป์„ ์ˆ˜ ์žˆ๋Š”
๋ชจ๋“  ๋ถ€๋ถ„๋ง์„ ํ•™์Šตํ•˜๊ณ , ์‹ค์ „์—์„œ๋Š” ๋ชจ๋“ 
๋ถ€๋ถ„๋ง์„ ๋™์‹œ์— ์‚ฌ์šฉํ•จ. -> ๋ฐฐ๊น…๊ณผ ์œ ์‚ฌ.
But ์‹ ๊ฒฝ๋ง์ด ์ปค์งˆ์ˆ˜๋ก ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ๋Š” ๋ถ€
๋ถ„๋ง์˜ ๊ฐ€์ง“์ˆ˜๋Š” ์ง€์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜์—ฌ ํ˜„์‹ค
์ ์œผ๋กœ ๋ชจ๋“  ๋ถ€๋ถ„๋ง์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์€ ๋ถˆ๊ฐ€
๋Šฅ.
๋ฐฐ๊น…๊ณผ ๋‹ฌ๋ฆฌ, ๋“œ๋กญ์•„์›ƒ์—์„œ๋Š” ๋ชจ๋ธ๋“ค์ด ๋งค
๊ฐœ๋ณ€์ˆ˜(w, b)๋ฅผ ๊ณต์œ 
=> ๊ทนํžˆ ์ผ๋ถ€์˜ ๋ถ€๋ถ„๋ง๋“ค์— ๋Œ€ํ•œ ํ•™์Šต๋งŒ์œผ
๋กœ ๋‹ค๋ฅธ ๋ถ€๋ถ„๋ง๋“ค๋„ ์ ์ ˆํ•œ ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ฐ’์„
๊ฐ–๊ฒŒ ๋จ.
7.12 Dropout
๊ทธ๋Ÿผ ๋“œ๋กญ์•„์›ƒ์ด ๊ฐ€์ ธ์˜ค๋Š” ๊ตฌ์ฒด์ ์ธ ํšจ๊ณผ๋ฅผ ์•Œ์•„๋ณด์ž.
์ด๋ฅผ ๋ช…ํ™•ํ•˜๊ฒŒ ์•Œ๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์€ ํ™•๋ฅ ๋ถ„ํฌ ๐‘ ๐‘ฆ ๐’™ ๋ฅผ ์ถœ๋ ฅ ํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•ด๋ณด๋ฉด..
๋ฐฐ๊น…
๊ฐ ๋ชจ๋ธ ๐‘–๊ฐ€ ๐‘ ๐‘–
๐‘ฆ ๐’™ ๋ฅผ ์ถœ๋ ฅ.
์ „์ฒด๋ชจ๋ธ์˜ ์ถœ๋ ฅ:
๐‘ ๐‘ฆ ๐’™ =
1
๐‘˜
๐‘–=1
๐‘˜
๐‘ ๐‘– (๐‘ฆ|๐’™)
๋“œ๋กญ์•„์›ƒ
๊ฐ ๋ถ€๋ถ„๋ง์€ ๐‘ ๐‘ฆ ๐’™, ๐ ๋ฅผ ์ถœ๋ ฅ.
์ „์ฒด๋ชจ๋ธ์˜ ์ถœ๋ ฅ:
๐‘ ๐‘ฆ ๐’™ =
๐
๐‘(๐)๐‘(๐‘ฆ|๐’™, ๐)
๐ : 2์ง„ ๋งˆ์Šคํฌ ๋ฒกํ„ฐ.
๊ฐ ์œ ๋‹›๋“ค์— ๋Œ€ํ•ด ํ™•๋ฅ ์ ์œผ๋กœ ๋ถ€์—ฌํ•œ ์ด์ง„์ˆ˜๋ฅผ ์ €์žฅ.
0์ด๋ฉด ํ•ด๋‹น ์œ ๋‹› ์‚ญ์ œ
- ๊ฐ ๋งˆ์Šคํฌ๊ฐ€ ํ•˜๋‚˜์˜ ๋ถ€๋ถ„๋ง์„ ํ‘œํ˜„
- ์ „์ฒด๋ชจ๋ธ์˜ ์ถœ๋ ฅ์€ ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ๋งˆ์Šคํฌ์— ๋Œ€ํ•ด ๊ฐ ๋งˆ
์Šคํฌ๊ฐ€ ๋งŒ๋“ค์–ด์งˆ ํ™•๋ฅ ๊ณผ, ๊ทธ๋•Œ์˜ ๋ถ€๋ถ„๋ง์˜ ์ถœ๋ ฅ๊ฐ’์„
๊ณฑํ•˜์—ฌ ๋ชจ๋‘ ๋”ํ•œ ๊ฒƒ.
- ์ง€์ˆ˜์ ์œผ๋กœ ๋งŽ์€ ํ•ญ์ด ํฌํ•จ๋˜์ง€๋งŒ 10~20๊ฐœ์ •๋„์˜ ๋งˆ
์Šคํฌ๋งŒ์„ ์‚ฌ์šฉํ•ด์„œ ์ด์— ๊ทผ์‚ฌํ•˜๋Š” ๊ณ„์‚ฐ๊ฐ’์„ ์–ป์Œ.
7.12 Dropout
์ฆ‰, ๊ฐ ๊ฐœ๋ณ„ ์œ ๋‹›์˜ ๊ด€์ ์—์„œ ๋ณผ ๋•Œ,
๋“œ๋กญ์•„์›ƒ์€ ๋ชจ๋“  ์œ ๋‹›์„ ํฌํ•จํ•˜๋ฉด์„œ ๊ฐ ์œ ๋‹› i์—์„œ ๋‚˜๊ฐ€๋Š” ๋ฐฉํ–ฅ์˜ ๊ฐ€์ค‘์น˜๋“ค์—
์œ ๋‹› i๊ฐ€ ํฌํ•จ๋  ํ™•๋ฅ ์„ ๊ณฑํ•œ ํ•˜๋‚˜์˜ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ๊ฐ’ ๐‘ ๐‘ฆ ๐’™ ๋ฅผ ๊ณ„์‚ฐํ•จ์œผ๋กœ์จ ์•™
์ƒ๋ธ”์— ๊ทผ์‚ฌํ•˜๋Š” ํšจ๊ณผ๋ฅผ ๋‚ด๋Š” ๊ฒƒ. (๊ฐ€์ค‘์น˜ ๋น„๋ก€ ์ถ”๋ก  ๊ทœ์น™)
i
๐‘ค๐‘– โˆ— ๐‘(ํฌํ•จ)
7.12 Dropout
๊ฐ ๋…ธ๋“œ๊ฐ€ ์†ํ•  ํ™•๋ฅ ์„ 0.5๋กœ ํ•˜์—ฌ ๋“œ๋กญ์•„์›ƒ์„ ์ ์šฉ ํ•  ์‹ ๊ฒฝ๋ง์— ๋น„์„ ํ˜•์„ฑ์ด ์—†๋Š” ๊ฒฝ
์šฐ, ๋“œ๋กญ์•„์›ƒ ์ ์šฉํ•˜์ง€ ์•Š๊ณ  ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚จ ๋’ค ๋ชจ๋“  ๊ฐ€์ค‘์น˜์— 0.5๋ฅผ ๊ณฑํ•˜๋ฉด ์ •ํ™•ํžˆ ๊ฐ™
์€ ํšจ๊ณผ๊ฐ€ ๋ฐœ์ƒ.
๋น„์„ ํ˜•์„ฑ์ด ์กด์žฌํ•  ๊ฒฝ์šฐ, ๊ฐ€์ค‘์น˜ ๋น„๋ก€ ์ถ”๋ก  ๊ทœ์น™์— ๊ทผ์‚ฌํ•˜๋Š” ํšจ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Œ.
(์ด๋ก ์  ์ฆ๋ช… ์•„์ง ์—†์Œ)
i
๐‘ค๐‘– โˆ— ๐‘(ํฌํ•จ)
7.12 Dropout
๋“œ๋กญ์•„์›ƒ์˜ ์žฅ์ 
1. ๊ณ„์‚ฐ ๋น„์šฉ์ด ์•„์ฃผ ๋‚ฎ์Œ
2. ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์ด๋‚˜ ํ›ˆ๋ จ์ ˆ์ฐจ์— ๋ณ„๋‹ค๋ฅธ ์ œํ•œ์ด ์—†์Œ
๊ทธ ์™ธ
1. ์„ ํ˜•์‹ ๊ฒฝ๋ง์—์„œ ๋“œ๋กญ์•„์›ƒ์€ ๊ฐ๊ฐ ๋‹ค๋ฅธ ฮป๋ฅผ ๊ฐ–๋Š” L2๊ฐ€์ค‘์น˜ ๊ฐ์‡„์™€ ๋™์ผํ•˜๋‹ค.
2. ์ด์ง„ ๋งˆ์Šคํฌ๊ฐ€ ์•„๋‹Œ ์‹ค์ˆ˜๊ฐ’์„ ๊ฐ–๋Š” ๋งˆ์Šคํฌ๋ฅผ ๊ฐ€์ค‘์น˜๋“ค์— ๊ณฑํ–ˆ์„ ๋•Œ ๋” ๋‚˜์€ ์„ฑ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜๋„ ์žˆ๋‹ค.
7.12 Dropout
๋“œ๋กญ์•„์›ƒ์˜ ์ง๊ด€์  ์ดํ•ด
๋ ˆ์ด์–ด2์˜ ํ•œ ๋…ธ๋“œ๊ฐ€ ์ฝ”๋ฅผ ํƒ์ง€ํ•จ
๊ทธ ๋…ธ๋“œ๋ฅผ ์‚ญ์ œํ•˜๊ณ  ๋‹ค๋ฅธ ๋…ธ๋“œ๋“ค์„ ํ›ˆ๋ จ์‹œํ‚จ๋‹ค๋Š” ๊ฒƒ์€?
์ฝ”์— ์™„์ „ํžˆ ์˜์กดํ•˜์ง€ ์•Š๊ณ  ๋‹ค๋ฅธ ํŠน์ง•๋“ค์„ ํ†ตํ•ด์„œ๋„
์–ผ๊ตด์„ ํƒ์ง€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ๊ฒƒ.
7.13 ๋Œ€๋ฆฝ ํ›ˆ๋ จ
๋Œ€๋ฆฝ ๊ฒฌ๋ณธ: ์›๋ณธ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌ(์‚ฌ๋žŒ
์ด ๋ณด๊ธฐ์—)ํ•˜์ง€๋งŒ ๋ชจ๋ธ์—์„œ ์ „ํ˜€ ๋‹ค
๋ฅธ ์•„์›ƒํ’‹์ด ์ถœ๋ ฅ๋˜๋Š” ๋ฐ์ดํ„ฐ.
๋Œ€๋ฆฝ ํ›ˆ๋ จ: ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์— ์ธ์œ„์ ์œผ
๋กœ ๋…ธ์ด์ฆˆ๋ฅผ ๊ฐ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•˜
์—ฌ ์‹ ๊ฒฝ๋ง์„ ํ›ˆ๋ จํ•˜๋Š” ๊ฒƒ.
๋Œ€๋ฆฝํ›ˆ๋ จ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด
์„œ๋กœ ๋‹ค๋ฅธ ํด๋ž˜์Šค๋“ค์€ ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ์—ฐ๊ฒฐ๋˜์ง€ ์•Š์€ manifold์ƒ์— ๋†“
์—ฌ์žˆ์œผ๋ฉฐ, ์ž‘์€ ๋ณ€ํ™”๋ฅผ ์ค€๋‹ค๊ณ  ํ•ด์„œ ๋‹ค๋ฅธ ํด๋ž˜์Šค์˜ manifold๋กœ ๋ณ€ํ™”๋˜
์ง€ ๋ชปํ•  ๊ฒƒ์ด๋‹ค.
7.14 Tangent Distance, Tangent Prop, and Manifold Tangent Classifier
Manifold:
ํ•œ ์œ„์น˜์—์„œ ๊ทธ์— ์ด์›ƒํ•œ ์œ„์น˜๋กœ ์ด๋™ํ•˜๋Š” ๋ณ€ํ™˜์ด ์‹ค์ œ๋กœ ์กด์žฌํ•˜๋Š” ์˜์—ญ
๊ฐ™์€ ํด๋ž˜์Šค๋Š” ๊ฐ™์€ manifold ์ƒ์— ์กด์žฌํ•  ๊ฒƒ.
Manifold์˜ ์ ‘์„ ๋ฒกํ„ฐ๋ฅผ ์‚ฌ์ „์— ์ •์˜ํ•˜์—ฌ manifold์—์„œ ๋ฒ—์–ด๋‚  ์ˆ˜๋ก ์ถœ๋ ฅ๊ฐ’์ด ๋‹ฌ๋ผ์ง€๊ณ ,
Manifold์ƒ์—์„œ ์›€์ง์ผ ๋• ์ถœ๋ ฅ๊ฐ’์ด ๋‹ฌ๋ผ์ง€์ง€ ์•Š๋Š” ๋ฒŒ์ ํ•ญ์„ ๋ชจ๋ธ์— ๋ถ€์—ฌ

Chapter 7 Regularization for deep learning - 3

  • 1.
    7.11 ๋ฐฐ๊น…๊ณผ ๊ธฐํƒ€์•™์ƒ๋ธ” ํ•™์Šต๋ฒ• (๋‹ค์Œ์žฅ์˜ ๋“œ๋ž์•„์›ƒ ๊ณต๋ถ€์— ๋ฐฐ๊น…์˜ ๊ฐœ๋…์ด ํ•„์š”) ๋ฐฐ๊น…(Bootstrap Aggregating) : ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ๊ฒฐํ•ฉ -> ์ผ๋ฐ˜ํ™” ์˜ค์ฐจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Œ ์—ฌ๋Ÿฌ ๋ชจ๋ธ๋“ค์˜ ์˜ˆ์ธก์„ ๋™์‹œ์— ๊ณ ๋ คํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜ํ™”์— ์ข‹์€ ์ด์œ  ๏ƒž ๊ฐ ๋ชจ๋ธ๋“ค์— ์˜ํ•œ ์˜ˆ์ธก์ด ์„œ๋กœ ๋‹ค๋ฅธ ์˜ค์ฐจ๋ฅผ ๊ฐ–๊ธฐ ๋•Œ๋ฌธ. ๋ฐฐ๊น…๊ณผ ๊ฐ™์€ ์•™์ƒ๋ธ” ๊ธฐ๋ฒ•์€ ๊ฑฐ์˜ ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ์ผ๋ฐ˜ํ™” ์˜ค์ฐจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ๋Š” ๊ฐ•๋ ฅํ•˜๊ณ  ๋ฏฟ์„ ๋งŒํ•œ ๋ฐฉ๋ฒ•
  • 2.
    7.12 Dropout Dropout์ด๋ž€? - ํ•˜๋‚˜์˜์ƒ˜ํ”Œ์„ ํ›ˆ๋ จํ•  ๋•Œ๋งˆ๋‹ค ๊ฐ๊ฐ์˜ ๋…ธ๋“œ๋ฅผ ํ™•๋ฅ ์ ์œผ๋กœ ์‚ญ์ œํ•˜๋Š” ๊ฒƒ. (์ถœ๋ ฅ์œ ๋‹›์€ ์‚ญ์ œx) - ํฐ ๋ชจ๋ธ์˜ ์ •์น™ํ™”๋ฅผ ์œ„ํ•œ ๊ฐ•๋ ฅํ•˜๊ณ  ๊ณ„์‚ฐ๋น„์šฉ์ด ๋‚ฎ์€ ๋ฐฉ๋ฒ•. - ๋งŽ์€ ๋‰ด๋Ÿฐ๋“ค๋กœ ๊ตฌ์„ฑ๋œ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ์˜ ๋‚ด๋ถ€์—์„œ ๋ฐฐ๊น…๊ณผ ์œ ์‚ฌํ•œ ํšจ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๊ฒŒ ํ•จ.
  • 3.
    7.12 Dropout ์‹ ๊ฒฝ๋ง์—์„œ ์œ ๋‹›์„์‚ญ์ œํ•˜์—ฌ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ๋ถ€๋ถ„๋ง์„ ํ•™์Šตํ•˜๊ณ , ์‹ค์ „์—์„œ๋Š” ๋ชจ๋“  ๋ถ€๋ถ„๋ง์„ ๋™์‹œ์— ์‚ฌ์šฉํ•จ. -> ๋ฐฐ๊น…๊ณผ ์œ ์‚ฌ. But ์‹ ๊ฒฝ๋ง์ด ์ปค์งˆ์ˆ˜๋ก ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ๋Š” ๋ถ€ ๋ถ„๋ง์˜ ๊ฐ€์ง“์ˆ˜๋Š” ์ง€์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜์—ฌ ํ˜„์‹ค ์ ์œผ๋กœ ๋ชจ๋“  ๋ถ€๋ถ„๋ง์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์€ ๋ถˆ๊ฐ€ ๋Šฅ. ๋ฐฐ๊น…๊ณผ ๋‹ฌ๋ฆฌ, ๋“œ๋กญ์•„์›ƒ์—์„œ๋Š” ๋ชจ๋ธ๋“ค์ด ๋งค ๊ฐœ๋ณ€์ˆ˜(w, b)๋ฅผ ๊ณต์œ  => ๊ทนํžˆ ์ผ๋ถ€์˜ ๋ถ€๋ถ„๋ง๋“ค์— ๋Œ€ํ•œ ํ•™์Šต๋งŒ์œผ ๋กœ ๋‹ค๋ฅธ ๋ถ€๋ถ„๋ง๋“ค๋„ ์ ์ ˆํ•œ ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ฐ’์„ ๊ฐ–๊ฒŒ ๋จ.
  • 4.
    7.12 Dropout ๊ทธ๋Ÿผ ๋“œ๋กญ์•„์›ƒ์ด๊ฐ€์ ธ์˜ค๋Š” ๊ตฌ์ฒด์ ์ธ ํšจ๊ณผ๋ฅผ ์•Œ์•„๋ณด์ž. ์ด๋ฅผ ๋ช…ํ™•ํ•˜๊ฒŒ ์•Œ๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์€ ํ™•๋ฅ ๋ถ„ํฌ ๐‘ ๐‘ฆ ๐’™ ๋ฅผ ์ถœ๋ ฅ ํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•ด๋ณด๋ฉด.. ๋ฐฐ๊น… ๊ฐ ๋ชจ๋ธ ๐‘–๊ฐ€ ๐‘ ๐‘– ๐‘ฆ ๐’™ ๋ฅผ ์ถœ๋ ฅ. ์ „์ฒด๋ชจ๋ธ์˜ ์ถœ๋ ฅ: ๐‘ ๐‘ฆ ๐’™ = 1 ๐‘˜ ๐‘–=1 ๐‘˜ ๐‘ ๐‘– (๐‘ฆ|๐’™) ๋“œ๋กญ์•„์›ƒ ๊ฐ ๋ถ€๋ถ„๋ง์€ ๐‘ ๐‘ฆ ๐’™, ๐ ๋ฅผ ์ถœ๋ ฅ. ์ „์ฒด๋ชจ๋ธ์˜ ์ถœ๋ ฅ: ๐‘ ๐‘ฆ ๐’™ = ๐ ๐‘(๐)๐‘(๐‘ฆ|๐’™, ๐) ๐ : 2์ง„ ๋งˆ์Šคํฌ ๋ฒกํ„ฐ. ๊ฐ ์œ ๋‹›๋“ค์— ๋Œ€ํ•ด ํ™•๋ฅ ์ ์œผ๋กœ ๋ถ€์—ฌํ•œ ์ด์ง„์ˆ˜๋ฅผ ์ €์žฅ. 0์ด๋ฉด ํ•ด๋‹น ์œ ๋‹› ์‚ญ์ œ - ๊ฐ ๋งˆ์Šคํฌ๊ฐ€ ํ•˜๋‚˜์˜ ๋ถ€๋ถ„๋ง์„ ํ‘œํ˜„ - ์ „์ฒด๋ชจ๋ธ์˜ ์ถœ๋ ฅ์€ ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ๋งˆ์Šคํฌ์— ๋Œ€ํ•ด ๊ฐ ๋งˆ ์Šคํฌ๊ฐ€ ๋งŒ๋“ค์–ด์งˆ ํ™•๋ฅ ๊ณผ, ๊ทธ๋•Œ์˜ ๋ถ€๋ถ„๋ง์˜ ์ถœ๋ ฅ๊ฐ’์„ ๊ณฑํ•˜์—ฌ ๋ชจ๋‘ ๋”ํ•œ ๊ฒƒ. - ์ง€์ˆ˜์ ์œผ๋กœ ๋งŽ์€ ํ•ญ์ด ํฌํ•จ๋˜์ง€๋งŒ 10~20๊ฐœ์ •๋„์˜ ๋งˆ ์Šคํฌ๋งŒ์„ ์‚ฌ์šฉํ•ด์„œ ์ด์— ๊ทผ์‚ฌํ•˜๋Š” ๊ณ„์‚ฐ๊ฐ’์„ ์–ป์Œ.
  • 5.
    7.12 Dropout ์ฆ‰, ๊ฐ๊ฐœ๋ณ„ ์œ ๋‹›์˜ ๊ด€์ ์—์„œ ๋ณผ ๋•Œ, ๋“œ๋กญ์•„์›ƒ์€ ๋ชจ๋“  ์œ ๋‹›์„ ํฌํ•จํ•˜๋ฉด์„œ ๊ฐ ์œ ๋‹› i์—์„œ ๋‚˜๊ฐ€๋Š” ๋ฐฉํ–ฅ์˜ ๊ฐ€์ค‘์น˜๋“ค์— ์œ ๋‹› i๊ฐ€ ํฌํ•จ๋  ํ™•๋ฅ ์„ ๊ณฑํ•œ ํ•˜๋‚˜์˜ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ๊ฐ’ ๐‘ ๐‘ฆ ๐’™ ๋ฅผ ๊ณ„์‚ฐํ•จ์œผ๋กœ์จ ์•™ ์ƒ๋ธ”์— ๊ทผ์‚ฌํ•˜๋Š” ํšจ๊ณผ๋ฅผ ๋‚ด๋Š” ๊ฒƒ. (๊ฐ€์ค‘์น˜ ๋น„๋ก€ ์ถ”๋ก  ๊ทœ์น™) i ๐‘ค๐‘– โˆ— ๐‘(ํฌํ•จ)
  • 6.
    7.12 Dropout ๊ฐ ๋…ธ๋“œ๊ฐ€์†ํ•  ํ™•๋ฅ ์„ 0.5๋กœ ํ•˜์—ฌ ๋“œ๋กญ์•„์›ƒ์„ ์ ์šฉ ํ•  ์‹ ๊ฒฝ๋ง์— ๋น„์„ ํ˜•์„ฑ์ด ์—†๋Š” ๊ฒฝ ์šฐ, ๋“œ๋กญ์•„์›ƒ ์ ์šฉํ•˜์ง€ ์•Š๊ณ  ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚จ ๋’ค ๋ชจ๋“  ๊ฐ€์ค‘์น˜์— 0.5๋ฅผ ๊ณฑํ•˜๋ฉด ์ •ํ™•ํžˆ ๊ฐ™ ์€ ํšจ๊ณผ๊ฐ€ ๋ฐœ์ƒ. ๋น„์„ ํ˜•์„ฑ์ด ์กด์žฌํ•  ๊ฒฝ์šฐ, ๊ฐ€์ค‘์น˜ ๋น„๋ก€ ์ถ”๋ก  ๊ทœ์น™์— ๊ทผ์‚ฌํ•˜๋Š” ํšจ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Œ. (์ด๋ก ์  ์ฆ๋ช… ์•„์ง ์—†์Œ) i ๐‘ค๐‘– โˆ— ๐‘(ํฌํ•จ)
  • 7.
    7.12 Dropout ๋“œ๋กญ์•„์›ƒ์˜ ์žฅ์  1.๊ณ„์‚ฐ ๋น„์šฉ์ด ์•„์ฃผ ๋‚ฎ์Œ 2. ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์ด๋‚˜ ํ›ˆ๋ จ์ ˆ์ฐจ์— ๋ณ„๋‹ค๋ฅธ ์ œํ•œ์ด ์—†์Œ ๊ทธ ์™ธ 1. ์„ ํ˜•์‹ ๊ฒฝ๋ง์—์„œ ๋“œ๋กญ์•„์›ƒ์€ ๊ฐ๊ฐ ๋‹ค๋ฅธ ฮป๋ฅผ ๊ฐ–๋Š” L2๊ฐ€์ค‘์น˜ ๊ฐ์‡„์™€ ๋™์ผํ•˜๋‹ค. 2. ์ด์ง„ ๋งˆ์Šคํฌ๊ฐ€ ์•„๋‹Œ ์‹ค์ˆ˜๊ฐ’์„ ๊ฐ–๋Š” ๋งˆ์Šคํฌ๋ฅผ ๊ฐ€์ค‘์น˜๋“ค์— ๊ณฑํ–ˆ์„ ๋•Œ ๋” ๋‚˜์€ ์„ฑ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜๋„ ์žˆ๋‹ค.
  • 8.
    7.12 Dropout ๋“œ๋กญ์•„์›ƒ์˜ ์ง๊ด€์ ์ดํ•ด ๋ ˆ์ด์–ด2์˜ ํ•œ ๋…ธ๋“œ๊ฐ€ ์ฝ”๋ฅผ ํƒ์ง€ํ•จ ๊ทธ ๋…ธ๋“œ๋ฅผ ์‚ญ์ œํ•˜๊ณ  ๋‹ค๋ฅธ ๋…ธ๋“œ๋“ค์„ ํ›ˆ๋ จ์‹œํ‚จ๋‹ค๋Š” ๊ฒƒ์€? ์ฝ”์— ์™„์ „ํžˆ ์˜์กดํ•˜์ง€ ์•Š๊ณ  ๋‹ค๋ฅธ ํŠน์ง•๋“ค์„ ํ†ตํ•ด์„œ๋„ ์–ผ๊ตด์„ ํƒ์ง€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ๊ฒƒ.
  • 9.
    7.13 ๋Œ€๋ฆฝ ํ›ˆ๋ จ ๋Œ€๋ฆฝ๊ฒฌ๋ณธ: ์›๋ณธ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌ(์‚ฌ๋žŒ ์ด ๋ณด๊ธฐ์—)ํ•˜์ง€๋งŒ ๋ชจ๋ธ์—์„œ ์ „ํ˜€ ๋‹ค ๋ฅธ ์•„์›ƒํ’‹์ด ์ถœ๋ ฅ๋˜๋Š” ๋ฐ์ดํ„ฐ. ๋Œ€๋ฆฝ ํ›ˆ๋ จ: ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์— ์ธ์œ„์ ์œผ ๋กœ ๋…ธ์ด์ฆˆ๋ฅผ ๊ฐ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•˜ ์—ฌ ์‹ ๊ฒฝ๋ง์„ ํ›ˆ๋ จํ•˜๋Š” ๊ฒƒ. ๋Œ€๋ฆฝํ›ˆ๋ จ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด ์„œ๋กœ ๋‹ค๋ฅธ ํด๋ž˜์Šค๋“ค์€ ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ์—ฐ๊ฒฐ๋˜์ง€ ์•Š์€ manifold์ƒ์— ๋†“ ์—ฌ์žˆ์œผ๋ฉฐ, ์ž‘์€ ๋ณ€ํ™”๋ฅผ ์ค€๋‹ค๊ณ  ํ•ด์„œ ๋‹ค๋ฅธ ํด๋ž˜์Šค์˜ manifold๋กœ ๋ณ€ํ™”๋˜ ์ง€ ๋ชปํ•  ๊ฒƒ์ด๋‹ค.
  • 10.
    7.14 Tangent Distance,Tangent Prop, and Manifold Tangent Classifier Manifold: ํ•œ ์œ„์น˜์—์„œ ๊ทธ์— ์ด์›ƒํ•œ ์œ„์น˜๋กœ ์ด๋™ํ•˜๋Š” ๋ณ€ํ™˜์ด ์‹ค์ œ๋กœ ์กด์žฌํ•˜๋Š” ์˜์—ญ ๊ฐ™์€ ํด๋ž˜์Šค๋Š” ๊ฐ™์€ manifold ์ƒ์— ์กด์žฌํ•  ๊ฒƒ. Manifold์˜ ์ ‘์„ ๋ฒกํ„ฐ๋ฅผ ์‚ฌ์ „์— ์ •์˜ํ•˜์—ฌ manifold์—์„œ ๋ฒ—์–ด๋‚  ์ˆ˜๋ก ์ถœ๋ ฅ๊ฐ’์ด ๋‹ฌ๋ผ์ง€๊ณ , Manifold์ƒ์—์„œ ์›€์ง์ผ ๋• ์ถœ๋ ฅ๊ฐ’์ด ๋‹ฌ๋ผ์ง€์ง€ ์•Š๋Š” ๋ฒŒ์ ํ•ญ์„ ๋ชจ๋ธ์— ๋ถ€์—ฌ