SlideShare a Scribd company logo
유제환 2022년 스터디
머신 러닝을 해보자
2장 수치 미분
미분의 정의
평균 변화율의 정의
직선의 기울기
y
O x
평균 변화율
(x1, y1)
(x2, y2)
△ y
△ x
=
y2 − y1
x2 − x1
y = f(x)
y = f(x) 에서 x 가 x1 에서 x2 까지 변할 때
라 하고 이 값을 평균변화율 또는 직선의 기울기라고 한다.
함수의 극한 정의
한 없이 한 점에 가까워질때
y
O x
a
lim
x→a
f(x) = p
y = f(x) f(x)
라고 하고
x 가 a 에 한 없이 가까워지면
좌극한
우극한
는 한 없이 p 에 가까워진다를
lim
x→a−0
f(x) = lim
x→a+0
f(x) = lim
x→a
f(x) = f(a) = p 일 때
함수는 연속이다.
y
O x
미분 계수의 정의
평균 변화율의 극한 = 순간 변화율
f′

(a) = lim
b→a
f(b) − f(a)
b − a
b − a = h 라 하면
평균 변화율
a
b → a
y = f(x)
b
순간 변화율
b = a + h 가 되고
b → a 일 때 h → 0 이므로 다음과 같이 표현 가능하다.
f′

(a) = lim
h→0
f(a + h) − f(a)
h
f′

(a) 를 미분 계수라 하고
x = a 에서의 접선의 기울기이다.
도함수 정의
미분 계수 값을 치역으로 하는 함수
(xn
)′

= nxn−1
(f(x)g(x))′

= f′

(x)g(x) + f(x)g′

(x)
(g(f(x))′

= g′

(f(x))f′

(x)
(
f(x)
g(x)
)′

=
f′

(x)g(x) − f(x)g′

(x)
(g(x))2
•

•

•
도함수를 나타내는 여러 가지 방법
y = x2
⇒ y′

= 2x
뉴턴 표기법
라이프니치 표기법
f′

(x) = lim
h→0
Δy
Δx
=
dy
dx
=
δy
δx
라이프니치 표기법의 의의
분수는 아니지만, 분수처럼 계산해도 문제 없다! ☞ Chain Rule
체인 룰 (미분의 연쇄 법칙)
y = e3x2
t = 3x2
= et
δy
δx
=
δy
δt
⋅
δt
δx
= (et
) ⋅ (6x) = (e3x2
) ⋅ (6x)
합성 함수의 미분
z = f(x, y) = x2
+ xy + y2
편미분 정의
이변 함수의 미분
δz
δx
=
δf(x, y)
δx
= 2x + y
δz
δy
=
δf(x, y)
δy
= x + 2y
변수가 2개 이상일 때는 한 변을 제외하고 나머지 변을 상수 취급한 뒤 미분을 한다.
δz
δx
(1,2) = 4
δz
δy
(1,2) = 5
δz
δx
(1,1) = 3 은 y = 1 일 때 곡면의 절단면에서 접선의 기울기
수치 미분 (Numerical Differentiation)
근사치를 이용하여 미분을 계산한다
• 필요성

• 사람이 손으로 미분하기 어려울 경우

• 컴퓨터를 이용하여 미분을 할 경우

• 예측치(오차 허용)를 계산할 경우
중심 차분의 정의
두 직선의 기울기의 평균
y
O x
x0 x0 + h
x0 − h
전향 차분
y
O x
x0 x0 + h
x0 − h
전향 차분과 후향 차분의 평균
후향 차분
f(a + h) − f(a − h)
2h
중심 차분의 극한 => 에서의 미분 계수
수치 미분의 오차를 줄인다
y
O x
x0 x0 + h
x0 − h
lim
h→0
f(a + h) − f(a)
h
= lim
h→0
f(a + h) − f(a − h)
2h
수치 미분에서 오차가 발생할 수 밖에 없는데,

중심 차분을 이용하면 오차가 더 적다는 것이

알려져있다.
x = x0
수치 미분 코드
간단한 수치 미분
f(x) = x2
⇒ f′

(3) (δ = 10−5
)
편미분 수치 계산
f(x, y) = x2
+ xy + y2
⇒ f′

(1, 2) (δ = 10−5
)
결과가 2차원 벡터 값

(4, 5)

More Related Content

What's hot

Flow based generative models
Flow based generative modelsFlow based generative models
Flow based generative models
수철 박
 
2012-12-25 사조사2급실기-공식
2012-12-25 사조사2급실기-공식2012-12-25 사조사2급실기-공식
2012-12-25 사조사2급실기-공식
Seok-kyu Kong 공석규
 
밑바닥부터시작하는딥러닝 Ch05
밑바닥부터시작하는딥러닝 Ch05밑바닥부터시작하는딥러닝 Ch05
밑바닥부터시작하는딥러닝 Ch05
HyeonSeok Choi
 
차원축소 훑어보기 (PCA, SVD, NMF)
차원축소 훑어보기 (PCA, SVD, NMF)차원축소 훑어보기 (PCA, SVD, NMF)
차원축소 훑어보기 (PCA, SVD, NMF)
beom kyun choi
 
[기초수학] 미분 적분학
[기초수학] 미분 적분학[기초수학] 미분 적분학
[기초수학] 미분 적분학KyeongWon Koo
 
딥러닝 제대로시작하기 Ch04
딥러닝 제대로시작하기 Ch04딥러닝 제대로시작하기 Ch04
딥러닝 제대로시작하기 Ch04
HyeonSeok Choi
 
Code 13장 그렇다면 뺄셈은 어떨까요-
Code 13장   그렇다면 뺄셈은 어떨까요-Code 13장   그렇다면 뺄셈은 어떨까요-
Code 13장 그렇다면 뺄셈은 어떨까요-종중 권
 
[신경망기초] 소프트맥스회귀분석
[신경망기초] 소프트맥스회귀분석[신경망기초] 소프트맥스회귀분석
[신경망기초] 소프트맥스회귀분석
jaypi Ko
 
[신경망기초] 오류역전파알고리즘
[신경망기초] 오류역전파알고리즘[신경망기초] 오류역전파알고리즘
[신경망기초] 오류역전파알고리즘
jaypi Ko
 
01 deep learningstart_perceptron
01 deep learningstart_perceptron01 deep learningstart_perceptron
01 deep learningstart_perceptron
BeomJinPark1
 
[신경망기초] 멀티레이어퍼셉트론
[신경망기초] 멀티레이어퍼셉트론[신경망기초] 멀티레이어퍼셉트론
[신경망기초] 멀티레이어퍼셉트론
jaypi Ko
 
제4강 명제와 논리-정보
제4강 명제와 논리-정보제4강 명제와 논리-정보
제4강 명제와 논리-정보csungwoo
 
7조 발표자료
7조 발표자료7조 발표자료
7조 발표자료진환 김
 
부울 대수와 컴퓨터 논리
부울 대수와 컴퓨터 논리부울 대수와 컴퓨터 논리
부울 대수와 컴퓨터 논리suitzero
 
하스켈 성능 튜닝
하스켈 성능 튜닝하스켈 성능 튜닝
하스켈 성능 튜닝
민석 이
 
Example
ExampleExample
Example
유석 남
 

What's hot (17)

Flow based generative models
Flow based generative modelsFlow based generative models
Flow based generative models
 
2012-12-25 사조사2급실기-공식
2012-12-25 사조사2급실기-공식2012-12-25 사조사2급실기-공식
2012-12-25 사조사2급실기-공식
 
밑바닥부터시작하는딥러닝 Ch05
밑바닥부터시작하는딥러닝 Ch05밑바닥부터시작하는딥러닝 Ch05
밑바닥부터시작하는딥러닝 Ch05
 
차원축소 훑어보기 (PCA, SVD, NMF)
차원축소 훑어보기 (PCA, SVD, NMF)차원축소 훑어보기 (PCA, SVD, NMF)
차원축소 훑어보기 (PCA, SVD, NMF)
 
[기초수학] 미분 적분학
[기초수학] 미분 적분학[기초수학] 미분 적분학
[기초수학] 미분 적분학
 
딥러닝 제대로시작하기 Ch04
딥러닝 제대로시작하기 Ch04딥러닝 제대로시작하기 Ch04
딥러닝 제대로시작하기 Ch04
 
Code 13장 그렇다면 뺄셈은 어떨까요-
Code 13장   그렇다면 뺄셈은 어떨까요-Code 13장   그렇다면 뺄셈은 어떨까요-
Code 13장 그렇다면 뺄셈은 어떨까요-
 
[신경망기초] 소프트맥스회귀분석
[신경망기초] 소프트맥스회귀분석[신경망기초] 소프트맥스회귀분석
[신경망기초] 소프트맥스회귀분석
 
[신경망기초] 오류역전파알고리즘
[신경망기초] 오류역전파알고리즘[신경망기초] 오류역전파알고리즘
[신경망기초] 오류역전파알고리즘
 
01 deep learningstart_perceptron
01 deep learningstart_perceptron01 deep learningstart_perceptron
01 deep learningstart_perceptron
 
[신경망기초] 멀티레이어퍼셉트론
[신경망기초] 멀티레이어퍼셉트론[신경망기초] 멀티레이어퍼셉트론
[신경망기초] 멀티레이어퍼셉트론
 
제4강 명제와 논리-정보
제4강 명제와 논리-정보제4강 명제와 논리-정보
제4강 명제와 논리-정보
 
7조 발표자료
7조 발표자료7조 발표자료
7조 발표자료
 
부울 대수와 컴퓨터 논리
부울 대수와 컴퓨터 논리부울 대수와 컴퓨터 논리
부울 대수와 컴퓨터 논리
 
이산수학04
이산수학04이산수학04
이산수학04
 
하스켈 성능 튜닝
하스켈 성능 튜닝하스켈 성능 튜닝
하스켈 성능 튜닝
 
Example
ExampleExample
Example
 

머신 러닝을 해보자 2장 (2022년 스터디)

  • 1. 유제환 2022년 스터디 머신 러닝을 해보자 2장 수치 미분
  • 3. 평균 변화율의 정의 직선의 기울기 y O x 평균 변화율 (x1, y1) (x2, y2) △ y △ x = y2 − y1 x2 − x1 y = f(x) y = f(x) 에서 x 가 x1 에서 x2 까지 변할 때 라 하고 이 값을 평균변화율 또는 직선의 기울기라고 한다.
  • 4. 함수의 극한 정의 한 없이 한 점에 가까워질때 y O x a lim x→a f(x) = p y = f(x) f(x) 라고 하고 x 가 a 에 한 없이 가까워지면 좌극한 우극한 는 한 없이 p 에 가까워진다를 lim x→a−0 f(x) = lim x→a+0 f(x) = lim x→a f(x) = f(a) = p 일 때 함수는 연속이다.
  • 5. y O x 미분 계수의 정의 평균 변화율의 극한 = 순간 변화율 f′  (a) = lim b→a f(b) − f(a) b − a b − a = h 라 하면 평균 변화율 a b → a y = f(x) b 순간 변화율 b = a + h 가 되고 b → a 일 때 h → 0 이므로 다음과 같이 표현 가능하다. f′  (a) = lim h→0 f(a + h) − f(a) h f′  (a) 를 미분 계수라 하고 x = a 에서의 접선의 기울기이다.
  • 6. 도함수 정의 미분 계수 값을 치역으로 하는 함수 (xn )′  = nxn−1 (f(x)g(x))′  = f′  (x)g(x) + f(x)g′  (x) (g(f(x))′  = g′  (f(x))f′  (x) ( f(x) g(x) )′  = f′  (x)g(x) − f(x)g′  (x) (g(x))2 • • •
  • 7. 도함수를 나타내는 여러 가지 방법 y = x2 ⇒ y′  = 2x 뉴턴 표기법 라이프니치 표기법 f′  (x) = lim h→0 Δy Δx = dy dx = δy δx 라이프니치 표기법의 의의 분수는 아니지만, 분수처럼 계산해도 문제 없다! ☞ Chain Rule
  • 8. 체인 룰 (미분의 연쇄 법칙) y = e3x2 t = 3x2 = et δy δx = δy δt ⋅ δt δx = (et ) ⋅ (6x) = (e3x2 ) ⋅ (6x) 합성 함수의 미분
  • 9. z = f(x, y) = x2 + xy + y2 편미분 정의 이변 함수의 미분 δz δx = δf(x, y) δx = 2x + y δz δy = δf(x, y) δy = x + 2y 변수가 2개 이상일 때는 한 변을 제외하고 나머지 변을 상수 취급한 뒤 미분을 한다. δz δx (1,2) = 4 δz δy (1,2) = 5 δz δx (1,1) = 3 은 y = 1 일 때 곡면의 절단면에서 접선의 기울기
  • 10. 수치 미분 (Numerical Differentiation) 근사치를 이용하여 미분을 계산한다 • 필요성 • 사람이 손으로 미분하기 어려울 경우 • 컴퓨터를 이용하여 미분을 할 경우 • 예측치(오차 허용)를 계산할 경우
  • 11. 중심 차분의 정의 두 직선의 기울기의 평균 y O x x0 x0 + h x0 − h 전향 차분 y O x x0 x0 + h x0 − h 전향 차분과 후향 차분의 평균 후향 차분 f(a + h) − f(a − h) 2h
  • 12. 중심 차분의 극한 => 에서의 미분 계수 수치 미분의 오차를 줄인다 y O x x0 x0 + h x0 − h lim h→0 f(a + h) − f(a) h = lim h→0 f(a + h) − f(a − h) 2h 수치 미분에서 오차가 발생할 수 밖에 없는데, 중심 차분을 이용하면 오차가 더 적다는 것이 알려져있다. x = x0
  • 14. 간단한 수치 미분 f(x) = x2 ⇒ f′  (3) (δ = 10−5 )
  • 15. 편미분 수치 계산 f(x, y) = x2 + xy + y2 ⇒ f′  (1, 2) (δ = 10−5 ) 결과가 2차원 벡터 값 (4, 5)