딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016Taehoon Kim
발표 영상 : https://goo.gl/jrKrvf
데모 영상 : https://youtu.be/exXD6wJLJ6s
Deep Q-Network, Double Q-learning, Dueling Network 등의 기술을 소개하며, hyperparameter, debugging, ensemble 등의 엔지니어링으로 성능을 끌어 올린 과정을 공유합니다.
안녕하세요. 이동민입니다. :)
2018. 8. 9일에 한국항공우주연구원에서 발표한 "Safe Reinforcement Learning" 발표 자료입니다.
목차는 다음과 같습니다.
1. Reinforcement Learning
2. Safe Reinforcement Learning
3. Optimization Criterion
4. Exploration Process
강화학습 계속 공부하면서 실제로 많은 분들이 쓸 수 있게 하려면 더 안전하고 빨라야한다는 생각이 들었습니다. 그래서 이에 관련하여 논문과 각종 자료들로 공부하여 발표하였습니다.
많은 분들께 도움이 되었으면 좋겠습니다. 감사합니다!
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016Taehoon Kim
발표 영상 : https://goo.gl/jrKrvf
데모 영상 : https://youtu.be/exXD6wJLJ6s
Deep Q-Network, Double Q-learning, Dueling Network 등의 기술을 소개하며, hyperparameter, debugging, ensemble 등의 엔지니어링으로 성능을 끌어 올린 과정을 공유합니다.
안녕하세요. 이동민입니다. :)
2018. 8. 9일에 한국항공우주연구원에서 발표한 "Safe Reinforcement Learning" 발표 자료입니다.
목차는 다음과 같습니다.
1. Reinforcement Learning
2. Safe Reinforcement Learning
3. Optimization Criterion
4. Exploration Process
강화학습 계속 공부하면서 실제로 많은 분들이 쓸 수 있게 하려면 더 안전하고 빨라야한다는 생각이 들었습니다. 그래서 이에 관련하여 논문과 각종 자료들로 공부하여 발표하였습니다.
많은 분들께 도움이 되었으면 좋겠습니다. 감사합니다!
사내 스터디용으로 공부하며 만든 발표 자료입니다. 부족한 부분이 있을 수도 있으니 알려주시면 정정하도록 하겠습니다.
*슬라이드 6에 나오는 classical CNN architecture(뒤에도 계속 나옴)에서 ReLU - Pool - ReLu에서 뒤에 나오는 ReLU는 잘못된 표현입니다. ReLU - Pool에서 ReLU 계산을 또 하는 건 redundant 하기 때문입니다(Kyung Mo Kweon 피드백 감사합니다)
Tales from the Optimization Trenches - Unite Copenhagen 2019Unity Technologies
In this talk, you'll learn about the tools and techniques that Unity's Consulting and Development team uses to identify and fix performance issues. The team travels the world visiting customers and conducting Project Reviews, in-depth engagements to locate and resolve performance bottlenecks. This session is designed to help you apply their knowledge to your Unity projects, so you'll see examples of real-life performance problems, their solutions, and receive up-to-date best practice advice.
Speaker: Ignacio Liverotti – Unity
Watch the session on YouTube: https://youtu.be/GuODu4-cXXQ
안녕하세요.
이번에 '1st 함께하는 딥러닝 컨퍼런스'에서 "안.전.제.일. 강화학습"이란 주제로 발표한 이동민이라고 합니다.
컨퍼런스 관련 링크는 다음과 같습니다.
https://tykimos.github.io/2018/06/28/ISS_1st_Deep_Learning_Conference_All_Together/
그리고 대략적인 개요는 다음과 같습니다.
1. What is Artificial Intelligence?
2. What is Reinforcement Learning?
3. What is Artificial General Intelligence?
4. Planning and Learning
5. Safe Reinforcement Learning
또한 이 자료에는 "Imagination-Augmented Agents for Deep Reinforcement Learning"이라는 논문을 자세히 설명하였습니다.
많은 분들이 보시고 도움이 되셨으면 좋겠습니다~!
빅데이터, 클라우드, IoT, 머신러닝. 왜 이렇게 많은 것들이 나타날까?Yongho Ha
클라우드라는 말이 들리더니, 어느새 빅데이터가 유행했습니다. 데이터가 중요하다는 것을 겨우 받아들일까 하는 판국에, 이제는 IoT라던가 머신러닝이 중요하다고 합니다. 이 많은 유행들은 그냥 일시적인 걸까요? 아니면 동시에 나타나게된 이유가 있는 걸까요? 이것들 뒤에 큰 흐름이 있지는 않을까요? 있다면 그것은 어디에서 시작되고 있을까요? numberworks.io
Built for performance: the UIElements Renderer – Unite Copenhagen 2019Unity Technologies
In this technical talk, we will describe the science behind the UIElements rendering system, built from the ground up for retained-mode UI. It uses every CPU/GPU trick in the book to render thousands of different elements onscreen in a fraction of a millisecond, all on one thread. This powerful UI performance and optimization tool also supports complex features like clipping and vector graphics, even on low-end devices.
Speaker: Wessam Bahnassi – Unity
Watch the session on YouTube: https://youtu.be/zeCdVmfGUN0
DetectoRS for Object Detection/Segmentation
On COCO test-dev, DetectoRS achieves state-of-the art 55.7% box AP for object detection, 48.5% mask AP for instance segmentation, and 50.0% PQ for panoptic segmentation.
(2020.07)
사내 스터디용으로 공부하며 만든 발표 자료입니다. 부족한 부분이 있을 수도 있으니 알려주시면 정정하도록 하겠습니다.
*슬라이드 6에 나오는 classical CNN architecture(뒤에도 계속 나옴)에서 ReLU - Pool - ReLu에서 뒤에 나오는 ReLU는 잘못된 표현입니다. ReLU - Pool에서 ReLU 계산을 또 하는 건 redundant 하기 때문입니다(Kyung Mo Kweon 피드백 감사합니다)
Tales from the Optimization Trenches - Unite Copenhagen 2019Unity Technologies
In this talk, you'll learn about the tools and techniques that Unity's Consulting and Development team uses to identify and fix performance issues. The team travels the world visiting customers and conducting Project Reviews, in-depth engagements to locate and resolve performance bottlenecks. This session is designed to help you apply their knowledge to your Unity projects, so you'll see examples of real-life performance problems, their solutions, and receive up-to-date best practice advice.
Speaker: Ignacio Liverotti – Unity
Watch the session on YouTube: https://youtu.be/GuODu4-cXXQ
안녕하세요.
이번에 '1st 함께하는 딥러닝 컨퍼런스'에서 "안.전.제.일. 강화학습"이란 주제로 발표한 이동민이라고 합니다.
컨퍼런스 관련 링크는 다음과 같습니다.
https://tykimos.github.io/2018/06/28/ISS_1st_Deep_Learning_Conference_All_Together/
그리고 대략적인 개요는 다음과 같습니다.
1. What is Artificial Intelligence?
2. What is Reinforcement Learning?
3. What is Artificial General Intelligence?
4. Planning and Learning
5. Safe Reinforcement Learning
또한 이 자료에는 "Imagination-Augmented Agents for Deep Reinforcement Learning"이라는 논문을 자세히 설명하였습니다.
많은 분들이 보시고 도움이 되셨으면 좋겠습니다~!
빅데이터, 클라우드, IoT, 머신러닝. 왜 이렇게 많은 것들이 나타날까?Yongho Ha
클라우드라는 말이 들리더니, 어느새 빅데이터가 유행했습니다. 데이터가 중요하다는 것을 겨우 받아들일까 하는 판국에, 이제는 IoT라던가 머신러닝이 중요하다고 합니다. 이 많은 유행들은 그냥 일시적인 걸까요? 아니면 동시에 나타나게된 이유가 있는 걸까요? 이것들 뒤에 큰 흐름이 있지는 않을까요? 있다면 그것은 어디에서 시작되고 있을까요? numberworks.io
Built for performance: the UIElements Renderer – Unite Copenhagen 2019Unity Technologies
In this technical talk, we will describe the science behind the UIElements rendering system, built from the ground up for retained-mode UI. It uses every CPU/GPU trick in the book to render thousands of different elements onscreen in a fraction of a millisecond, all on one thread. This powerful UI performance and optimization tool also supports complex features like clipping and vector graphics, even on low-end devices.
Speaker: Wessam Bahnassi – Unity
Watch the session on YouTube: https://youtu.be/zeCdVmfGUN0
DetectoRS for Object Detection/Segmentation
On COCO test-dev, DetectoRS achieves state-of-the art 55.7% box AP for object detection, 48.5% mask AP for instance segmentation, and 50.0% PQ for panoptic segmentation.
(2020.07)
2. 강의 순서
1. 사랑은 기술인가?
2. 왜 사랑해야 하는가?
3. 사랑이란 무엇인가?
4. 사랑의 대상
5. 현대사회에서 사랑의 붕괴
6. 사랑의 실천
3. 1. 사랑은 기술인가?
1) 백마탄 왕자님이 언젠간 나타나겠지
2) 멋진 사람만 나타난다면 나도 언젠간?
3) 사랑은 ‘빠지는’ 것인가?
“누구나 다 아는 내용이지만, 누구나 다 모르는 일반적인,
사랑에 대한 착각”
4. 백마탄 왕자님이 언젠가는 나타나겠지
사랑이란?
우연한 기회에 ‘백마탄 왕자’님이 나타나는, 행운만 있으면 누구나 ‘겪게
되는’ 즐거운 감정인가?
사람들은 얼마나 사랑을 중요하게 여기는가?
5. 멋진 사람만 나타난다면 나도 언젠간?
대부분의 사람들은 사랑의 문제를 ‘사랑하는’ 것이 아니라 ‘멋진 대상에게’ ‘사랑받는’ 것으로 생각
대부분의 사람들은 사랑하는 ‘능력’ 이 아니라 사랑하는 ‘대상’의 문제라고 생각
’사랑하는’건 쉽고, 사랑할 또는 사랑받을 올바른 대상을 발견하기가 어려울 뿐이라고
생각함. 그러면 어떤 대상?
사랑이란, ‘멋진 남녀가’ 서로의 ‘매력’을 교환하는 게임인가?
남성 : 사회적 지위를 강화하고 권력을 장악하고 돈을 모음
여성 : 몸을 가꾸고 치장을 함
둘다 : 유쾌한 태도, 흥미있는 대화술, 유능하고 겸손하고 둥글둥글하게 처신
6. 사랑은 ‘빠지는’ 것인가?
대부분의 사람들은 사랑을 ‘하게 되는’ 최초의 경험과 사랑하고 ‘있는’ 지속적 상태를 혼동함
-’유혹’은 오래 지속될 수 없음
-강렬한 열정? 그들이 서로 만나기 전에 얼마나 외로웠는가를 입증할 뿐
사랑처럼 엄청난 희망과 기대 속에서 시작되었다가 반드시 실패로
끝나고 마는 활동이나 사업은 찾아보기 어려울 것
7. 2. 왜 사랑해야 하는가?
1) 실존적 고민 ‘나 자신은 무엇인가’에 대한 해답
왜 사람은, 사랑해야만 하는가?
8. ‘실존적 고민’ 나 자신은 무엇인가?에 대한 해답
인정하라. 당신은 남들과 별로 다르지 않으며, 따라서 당신의 삶이 대부분 재미 없다고.
일상적인 노동 : 내가 하는 일은 남들도 다 함. 아무리 멋진 일도 지루한 잡무가 대부분임. 지시된 일을 지시된 속도로 지시된 방
식에 따라 지시된 감정으로 수행
일상적인 오락 : 내가 하는 오락도 남들도 다 함. 베스트셀러를 보고, 흥행성 있는 영화를 보고 (남들 다 보는 영화 보고), 똑같
은 광고. 남들도 다 가는 클럽, 파티
남들도 다 입는 옷을 입고, 남들도 다 먹는 것을 먹음.
여기서 과연 유니크한 “나” 가 있는가?
과연 나는 단 한 번의 생을 부여받은, 고유한 나 자신인가?
내가 일상생활에서 느끼는 감정은 나만의 것인가?
➔ 실존적 고민 ➔ 완전한 해답은 다른 사람과의 융합, 즉 ‘사랑’이다
9. 3. 사랑이란 무엇인가?
1) 완전한 사랑이란? 리바이스. ‘난 나야’
2) 사랑은 감정이 아니라, 주는 활동이다.
3) 무엇을 주어야 하는가?
4) 사랑은 또한 보호, 책임, 존경, 이해이다.
대체 사랑이란 무엇인가?
10. 완전한 사랑이란? 리바이스. ‘나는 나야’
‘공서적 합일’의 불완전한 사랑의 형태
-생물학적 : 어머니와 태아
-수동적 : Masochism / 우상 숭배 : 내가 복종하는 자의 일부가 됨으로써 외로움에서 도피
-능동적 : Sadism : 나를 복종하는 자를 흡수하여 자신을 팽창시키고 강화
완전한 ‘사랑’이란? = 개성을 유지하는 상태에서의 합일
‘나는 나고, 너는 너이다. 이를 인정하고,
이해한다. 그 안에서 우리는 사랑한다.’
다른 사람을 바꾸지도, 네 자신을 억지로 바꾸려 하지도 마라!
11. 사랑은 감정이 아니라, 주는 활동이다
명심하라! 사랑은 ‘수동적 감정’ 이 아니라, ‘활동’이다.
내가 스스로 나 자신일 때는 언제인가? : 능동적으로 내가 스스로 결정을 내리고, 내가 결정한 길을 걷고 그 때 나만의 감정을 느
낄 때!
사랑은 본래 ‘주는 것’이지 받는 것이 아님
‘주는 것’ =/ 포기하는 것, 빼앗기는 것, 희생하는 것
비생산적인 성격의 사람들은 주는 것을 가난해지는 것으로 생각, 주려고 하지 않음
생산적인 성격의 사람들은 준다는 행위 자체에서 나의 힘, 부, 능력을 경험. 즐겁게 느낌
성의 영역에 가장 기본적인 예가 있음
남성 : 자기 자신을, 자신의 성기를 여자에 줌. 오르가슴의 순간에 정액을 여자에게 줌. 능력이 있는 한 정액을 주지 않고는 견디지 못하며, ’줄 수 없다면 그는
성적불구’
여성 : 자기 자신을 줌. 여성으로서의 중심을 향해 문을 열어 줌. 받기만 한다면 그녀는 불감증.
물질적 : 많이 주는 자가 부자이다.
12. 무엇을 주어야 하는가?
가장 중요한 ‘줌’은, 바로 가장 소중한 것, 생명을 주는 것이다.
나 자신 속에 살아있는 것, ex : 기쁨, 관심, 이해, 지식, 유머, 슬픔, 꿈 ...
“자아 개방”
줌으로써 다른 사람의 생명에 무언가를 야기하고, 그것은 나에게 또한 돌아옴
13. 사랑은 또한 보호, 책임, 존경, 이해이다
그밖의 사랑의 중요한 활동
보호, 책임, 존경, 이해
ex : 꽃을 사랑한다고 말하면서도 꽃에 물을 주는 것을 잊어버린다? ➔ 사랑X
책임이란? : ‘응답할 준비가 되어있다’
존경이 없다면? : 지배와 소유로 타락함.
존경이란? (respicere=바라보다) 있는 그대로 바라보고 독특한 개성을 아는 능력
‘내’가 독립을 성취할 때에만, 존경이 가능하다는 것은 분명함.
즉 올바로 사랑하려면, ‘네가 없으면 죽을 것 같다’ 라고 느껴지면 안 됨.
각자 독립적인 자신이, 있는 그대로의 그/그녀와 일체가 되는 것.
존경하려면 ‘지식’이 있어야 함. 이는 즉 ‘이해’
나 자신에 대해 객관적으로 알고, 다른 사람에 대해 알아야 함 ➔ 이러한 이해은 다른 사람을 그의 관점에서 볼 때 가능해짐
사랑이란, 대상과의 합일을 위해 대담하게 뛰어드는 행위
ex : ‘종교’를 생각해보라! 얼마나 대담하게 나 자신을 바치는가? 그런 것이 사랑.
14. 4. 사랑의 대상
1) 사랑은 관계가 아니라 태도이다
주변 모든 것을 사랑하라. 그래야만 올바로 그/그녀를 사랑할 수 있으리라.
15. 사랑은 ‘관계’가 아니라, ‘태도’이다
사랑은 활동임을 깨닫지 못하기 때문에 올바른 대상을 찾아내는 것만이 필요하다면?
like 그림을 그리고 싶어하는데 기술은 배우지 않고, 뭘 그릴 지만 줄창 찾는 것
사랑은 한 사람과, 사랑의 한 ‘대상’과의 관계가 아니라
세계 전체와의 관계를 결정하는 ‘태도’임!
➔어떤 사람이 다른 한 사람만을 사랑하고 나머지 친구들에는 무관심하다? 이는 애착이거나 이기주
의. 온전한 사랑이 아님
형제애 / 모성애 / 성애 / 자기애 / 신에 대한 사랑
책임, 보호, 존경, 다른 사람에 대한 지식, 동정 ... 모두 동등하게 사랑해야 한다!
자신과 맞닿는 모든 것들을 ‘사랑’(태도) 하라. 그래야만 올바르게 그/그녀를 사랑할 수 있다.
16. 5. 현대 사회에서 사랑의 붕괴
1) 사랑은 매력의 교환과정? 게임? 팀?
2) 오늘을 살지 못하는 사람들
3) 너를 개조하겠어
4) 성격 차이 때문에 자주 싸워서...
현대 사회에서 ‘사랑’ 이 무너지고 있다.
17. 사랑은 매력의 교환과정? 게임? 팀?
시장자본주의의 시대 : 사랑도 시장원리/소유구조에 의해?
사랑은 매력의 교환과정인가?
현대 사회, 차가운 도시남녀들은 자기 자신에 대해 소외됨.
상품으로 변하고, 톱니바퀴로 변하고, ... 나 자신을 ‘투자의 대상’ 이라 생각
노동의 규격화, 오락의 규격화, ...
사람들은 여기서 피할 수 없는 강한 고독감을 가짐.
행복한 결혼이란 무엇인가? 원활한 기능을 가진 ‘팀’ 인가?
남편은 아내의 새 옷이나 맛있는 요리를 칭찬하고, 아내는 남편이 지쳐서 시무룩해 집으로 돌아왔을 때 이해해줘야 하고, 남편이 사업상의 난점에 말할
때 주의깊게 귀 기울여야 하고, 남편이 아내의 생일을 잊었을 때도 화내지 말고 이해해야...
➔‘핵심적 관계’에 도달하지 못하고, 서로 예의바르게 대우하고 더욱 호의를 가지려고 노력하는 .. 비즈니스적 “제휴” 관계
이러한 현상 ➔ 올바른 ‘성적 적응’을 이루지 못하는 현상 ➔ ‘성적 기교’ 에 대한 가르침과 조언? (X. 성적 행복은 사랑의 결과일 뿐.
여자의 불감증과 남자의 불능증은 사랑을 불가능하게 만드는 억압에 있음)
18. 오늘을 살지 못하는 사람들
사이비 사랑의 한 가지 형태 : ‘감상적 사랑’
사랑은 로맨틱코미디, 연애소설, 사랑노래 등으로 대표되는 환상 속에서만 경험될 뿐, 실재하는 이 사
람과 맺고 있는 관계에서는 경험되지 않음
스크린 속 남녀의 행복한/불행한 사랑의 이야기에 참여할 때 감동을 받고 눈물
을 흘리지만, 실제 커플은 그런 사랑을 주고 받지 못함
현대인의 일반적 태도 때문 : 과거나 미래에 살지 오늘을 살지 못함.
➔ 개인의 현실적 고통과 고독과 분리감을 회피하고 이를 도피하기 위한 마취
제로서 사랑의 경험을 과거/미래 혹은 다른 사람의 환상 속으로 대체함
19. 너를 개조하겠어
사이비 사랑의 다른 형태 : ‘투사적 메커니즘’ (집단, 민족, 종교적 행동)
다른 사람의 사소한 결점까지도 낱낱이 비판하고, 자기 자신의 결점을 천연
덕스레 무시함. 다른 사람을 비난하고 개조하기에 바쁨
➔이는 자식에 대한 소망과 관련하여 자주 일어남
➔자신의 내면에 있어서나 자식에 있어서나 반드시 실패
실존의 문제는 스스로의 힘으로서만 해결될 수 있고 남이 대신 해결해줄 수 없기
때문.
➔개조하려고 하지 말고, 해답을 찾을 수 있도록 ‘인도’ ‘독려’해주어야
20. 성격 차이 때문에 자주 싸워서...
또 하나의 오류 : 사랑은 갈등이 전혀 없는 상태를 의미한다고 보는 환상
그러나 대부분의 사람들이 말하는 ‘갈등’은 ‘진짜 갈등’을 회피하려는 노력에서
생김
사랑이란,
조화가 있든 갈등이 있든 기쁨이 있든 슬픔이 있든 두 사람이 그들의 실존의 본질로부
터 그들 자신을 경험하고 그들 자신과 하나가 됨으로써 서로 일체가 된다는 것
21. 6. 사랑의 실천
1) 사랑은 기술이다. ‘훈련’해야만 한다
2) 기술습득을 위한 마음자세
3) 모든 것들을 여유롭게 사랑하라
사랑은 기술이다. 기술은 배울 뿐만 아니라, 훈련하고 실천하여 다듬어야만
한다.
22. 사랑은 기술이다. 훈련해야만 한다
인정하라! 사랑은 기술이다.
기술의 실용에는 ‘훈련’이 요구된다. (매일 일정한 시간 동안 연습하는 것을 말함)
그러나 문제는, 현대인은 일을 떠나서는 자기훈련을 하지 않으려 한다.
일하지 않을 때에는 게을리 지내거나, 빈둥거리거나, ‘긴장을 풀고’ 싶어함.
➔이는 생활의 규격화에 대한 반발 때문임
훈련에서 중요한 것은? ‘정신 집중’
현대인은 너무 많은 것들을 한꺼번에 해내려 함. 조용히 앉아 있는 것이 힘듬
또 중요한 것은? ‘인내’
현대인은 항상 신속성을 위해 살아가고 있음. 신속하지 못할 때에는 ‘시간을 잃고 있다’ 라고 생각
가장 중요한 것은? ‘기술 습득에 대한 관심과 동기부여’
그 기술이 최고로 중요하지 않다면? 견습생은 그 기술을 배우려 하지 않을 것임.
23. 기술습득을 위한 마음자세
다시 한번 기술을 배우는 것에 대해 생각해보자.
일반적으로 기술을 배우기 위해서는 습득을 위한 잡다한 (관계없는 듯한) 많은 것들을 배워야 함
ex : 소림사에서 물 긷는 일을 2년 해야... / 피아노를 배우려면 악보를 봐야... / 활을 쏘려면 호흡부터 시작해야...
어떤 기술을 숙달하려면 삶 전체를 이 기술에 바치거나 이 기술과 관련시켜야 함.
기술을 숙달하기 위해 나 자신을 정갈히 하라.
일정한 시간에 일어나는 것 / 하루의 일정한 시간을 명상, 독서, 음악 감상, 산책에 할당하는 것 / 하고 싶은 취미를 일정 시
간 하는 것 / 탐정소설, 영화, 게임 등과 같은 도피주의적 활동에 탐닉하지 않는 것 / 과식, 과음하지 않는 것.
이러한 훈련을 즐겁게 생각하고, 이러한 훈련을 그만두면 실패할 것이라 생각하라. 자신에게 맞는 훈련법을 집중해서 생각해
보라.
24. 모든 것들을 여유롭게 사랑하라
사랑은 ‘활동’이다.
내가 사랑하고 있다면, 그나 그녀 뿐만 아니라 나와 관계하는 모든 것들에
대해 끊임없고 부지런한 관심을 가져야 한다. 내가 게으르다면 사랑받는
사람과 능동적으로 관계할 수 없기 때문
나 자신에 대한 사랑과 타인에 대한 사랑을 나누지 마라! 이는 필요 불가
분의 조건