[논문리뷰] Data Augmentation for 1D 시계열 데이터Donghyeon Kim
* 1D 시계열 신호에 Data Augmentation 을 진행한 연구논문을 간단하게 리뷰합니다.
* 웨어러블 가속도 신호와 뇌전도 신호에 대한 논문 3편을 준비했습니다.
* 광주과학기술원 인공지능 스터디 A-GIST 모임에서 발표했습니다.
* 발표 영상 (한국어, 유튜브): https://youtu.be/NpUMFKaDCU4
이 논문은 데이터셋 디스틸레이션에 대한 새로운 접근법을 제안합니다. 데이터셋 디스틸레이션은 전체 데이터셋에서 학습된 모델의 테스트 정확도를 일치시킬 수 있는 작은 데이터셋을 합성하는 작업입니다. 제안된 방법은 디스틸레이션 데이터를 최적화하여 실제 데이터로 학습된 네트워크와 유사한 상태로 이끌어냅니다. 이 방법은 기존 방법들을 능가하며, 더 높은 해상도의 시각 데이터를 디스틸레이션할 수 있게 합니다. 데이터셋 디스틸레이션은 지속적인 학습, 신경 아키텍처 검색, 개인정보 보호 ML 등 다양한 응용 분야가 있습니다.
[논문리뷰] Data Augmentation for 1D 시계열 데이터Donghyeon Kim
* 1D 시계열 신호에 Data Augmentation 을 진행한 연구논문을 간단하게 리뷰합니다.
* 웨어러블 가속도 신호와 뇌전도 신호에 대한 논문 3편을 준비했습니다.
* 광주과학기술원 인공지능 스터디 A-GIST 모임에서 발표했습니다.
* 발표 영상 (한국어, 유튜브): https://youtu.be/NpUMFKaDCU4
이 논문은 데이터셋 디스틸레이션에 대한 새로운 접근법을 제안합니다. 데이터셋 디스틸레이션은 전체 데이터셋에서 학습된 모델의 테스트 정확도를 일치시킬 수 있는 작은 데이터셋을 합성하는 작업입니다. 제안된 방법은 디스틸레이션 데이터를 최적화하여 실제 데이터로 학습된 네트워크와 유사한 상태로 이끌어냅니다. 이 방법은 기존 방법들을 능가하며, 더 높은 해상도의 시각 데이터를 디스틸레이션할 수 있게 합니다. 데이터셋 디스틸레이션은 지속적인 학습, 신경 아키텍처 검색, 개인정보 보호 ML 등 다양한 응용 분야가 있습니다.
우리는 지금 무엇을 하고있는지를 고민하나요? 아니면 무엇이 되어가고 있는지를 고민하나요? 네 맞습니다. 우리는 매년 무엇을 할지 고민합니다. 그런데 중요한것은 방향 즉 어디를 가고 있는지 입니다.
그래서 넷플릭스의 추천 시스템이 어디를 향해 가고 있는지를 살펴보고 추천시스템의 향해 가야할 Goal에 대하여 같이 이야기를 해보고자 합니다
PR-207: YOLOv3: An Incremental ImprovementJinwon Lee
TensorFlow Korea 논문읽기모임 PR12 207번째 논문 review입니다
이번 논문은 YOLO v3입니다.
매우 유명한 논문이라서 크게 부연설명이 필요없을 것 같은데요, Object Detection algorithm들 중에 YOLO는 굉장히 특색있는 one-stage algorithm입니다. 이 논문에서는 YOLO v2(YOLO9000) 이후에 성능 향상을 위하여 어떤 것들을 적용하였는지 하나씩 설명해주고 있습니다. 또한 MS COCO의 metric인 average mAP에 대해서 비판하면서 mAP를 평가하는 방법에 대해서도 얘기를 하고 있는데요, 자세한 내용은 영상을 참고해주세요~
논문링크: https://arxiv.org/abs/1804.02767
영상링크: https://youtu.be/HMgcvgRrDcA
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축BOAZ Bigdata
데이터 분석 프로젝트를 진행한 Hands-on 팀에서는 아래와 같은 프로젝트를 진행했습니다.
'수어 번역 프로젝트'는 재난 상황 속 소외되는 농인들에게 소통의 문을 열어주자는 목표를 가지고 시작되었습니다. Hands-on팀의 수어 번역 모델을 통해 농인들은 위험 상황 속에서 도움을 요청하는 등 소통의 한계를 극복할 수 있습니다.
16기 곽민지 (동덕여자대학교 정보통계학과)
16기 김영민 (인천대학교 경제학/컴퓨터공학)
16기 김영은 (건국대학교 응용통계학과)
16기 이다인 (이화여자대학교 휴먼기계바이오공학)
Object detection is a central problem in computer vision and underpins many applications from medical image analysis to autonomous driving. In this talk, we will review the basics of object detection from fundamental concepts to practical techniques. Then, we will dive into cutting-edge methods that use transformers to drastically simplify the object detection pipeline while maintaining predictive performance. Finally, we will show how to train these models at scale using Determined’s integrated deep learning platform and then serve the models using MLflow.
What you will learn:
Basics of object detection including main concepts and techniques
Main ideas from the DETR and Deformable DETR approaches to object detection
Overview of the core capabilities of Determined’s deep learning platform, with a focus on its support for effortless distributed training
How to serve models trained in Determined using MLflow
出典:Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko
Facebook AI
公開URL : https://arxiv.org/abs/2005.12872
概要:Detection Transformer(DETRという)という新しいフレームワークによって,non-maximum-supressionやアンカー生成のような人手で設計する必要なく、End-to-Endで画像からぶった検出を行う手法を提案しています。物体検出を直接集合予測問題として解くためのtransformerアーキテクチャとハンガリアン法を用いて二部マッチングを行い正解と予測の組み合わせを探索しています。Attentionを物体検出に応用しただけでなく、競合手法であるFaster R-CNNと同等の精度を達成しています。
발표자: 이활석(NAVER)
발표일: 2017.11.
최근 딥러닝 연구는 지도학습에서 비지도학습으로 급격히 무게 중심이 옮겨 지고 있습니다. 본 과정에서는 비지도학습의 가장 대표적인 방법인 오토인코더의 모든 것에 대해서 살펴보고자 합니다. 차원 축소관점에서 가장 많이 사용되는Autoencoder와 (AE) 그 변형 들인 Denoising AE, Contractive AE에 대해서 공부할 것이며, 데이터 생성 관점에서 최근 각광 받는 Variational AE와 (VAE) 그 변형 들인 Conditional VAE, Adversarial AE에 대해서 공부할 것입니다. 또한, 오토인코더의 다양한 활용 예시를 살펴봄으로써 현업과의 접점을 찾아보도록 노력할 것입니다.
1. Revisit Deep Neural Networks
2. Manifold Learning
3. Autoencoders
4. Variational Autoencoders
5. Applications
발표자: 최윤제(고려대 석사과정)
최윤제 (Yunjey Choi)는 고려대학교에서 컴퓨터공학을 전공하였으며, 현재는 석사과정으로 Machine Learning을 공부하고 있는 학생이다. 코딩을 좋아하며 이해한 것을 다른 사람들에게 공유하는 것을 좋아한다. 1년 간 TensorFlow를 사용하여 Deep Learning을 공부하였고 현재는 PyTorch를 사용하여 Generative Adversarial Network를 공부하고 있다. TensorFlow로 여러 논문들을 구현, PyTorch Tutorial을 만들어 Github에 공개한 이력을 갖고 있다.
개요:
Generative Adversarial Network(GAN)은 2014년 Ian Goodfellow에 의해 처음으로 제안되었으며, 적대적 학습을 통해 실제 데이터의 분포를 추정하는 생성 모델입니다. 최근 들어 GAN은 가장 인기있는 연구 분야로 떠오르고 있고 하루에도 수 많은 관련 논문들이 쏟아져 나오고 있습니다.
수 없이 쏟아져 나오고 있는 GAN 논문들을 다 읽기가 힘드신가요? 괜찮습니다. 기본적인 GAN만 완벽하게 이해한다면 새로 나오는 논문들도 쉽게 이해할 수 있습니다.
이번 발표를 통해 제가 GAN에 대해 알고 있는 모든 것들을 전달해드리고자 합니다. GAN을 아예 모르시는 분들, GAN에 대한 이론적인 내용이 궁금하셨던 분들, GAN을 어떻게 활용할 수 있을지 궁금하셨던 분들이 발표를 들으면 좋을 것 같습니다.
발표영상: https://youtu.be/odpjk7_tGY0
우리는 지금 무엇을 하고있는지를 고민하나요? 아니면 무엇이 되어가고 있는지를 고민하나요? 네 맞습니다. 우리는 매년 무엇을 할지 고민합니다. 그런데 중요한것은 방향 즉 어디를 가고 있는지 입니다.
그래서 넷플릭스의 추천 시스템이 어디를 향해 가고 있는지를 살펴보고 추천시스템의 향해 가야할 Goal에 대하여 같이 이야기를 해보고자 합니다
PR-207: YOLOv3: An Incremental ImprovementJinwon Lee
TensorFlow Korea 논문읽기모임 PR12 207번째 논문 review입니다
이번 논문은 YOLO v3입니다.
매우 유명한 논문이라서 크게 부연설명이 필요없을 것 같은데요, Object Detection algorithm들 중에 YOLO는 굉장히 특색있는 one-stage algorithm입니다. 이 논문에서는 YOLO v2(YOLO9000) 이후에 성능 향상을 위하여 어떤 것들을 적용하였는지 하나씩 설명해주고 있습니다. 또한 MS COCO의 metric인 average mAP에 대해서 비판하면서 mAP를 평가하는 방법에 대해서도 얘기를 하고 있는데요, 자세한 내용은 영상을 참고해주세요~
논문링크: https://arxiv.org/abs/1804.02767
영상링크: https://youtu.be/HMgcvgRrDcA
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축BOAZ Bigdata
데이터 분석 프로젝트를 진행한 Hands-on 팀에서는 아래와 같은 프로젝트를 진행했습니다.
'수어 번역 프로젝트'는 재난 상황 속 소외되는 농인들에게 소통의 문을 열어주자는 목표를 가지고 시작되었습니다. Hands-on팀의 수어 번역 모델을 통해 농인들은 위험 상황 속에서 도움을 요청하는 등 소통의 한계를 극복할 수 있습니다.
16기 곽민지 (동덕여자대학교 정보통계학과)
16기 김영민 (인천대학교 경제학/컴퓨터공학)
16기 김영은 (건국대학교 응용통계학과)
16기 이다인 (이화여자대학교 휴먼기계바이오공학)
Object detection is a central problem in computer vision and underpins many applications from medical image analysis to autonomous driving. In this talk, we will review the basics of object detection from fundamental concepts to practical techniques. Then, we will dive into cutting-edge methods that use transformers to drastically simplify the object detection pipeline while maintaining predictive performance. Finally, we will show how to train these models at scale using Determined’s integrated deep learning platform and then serve the models using MLflow.
What you will learn:
Basics of object detection including main concepts and techniques
Main ideas from the DETR and Deformable DETR approaches to object detection
Overview of the core capabilities of Determined’s deep learning platform, with a focus on its support for effortless distributed training
How to serve models trained in Determined using MLflow
出典:Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko
Facebook AI
公開URL : https://arxiv.org/abs/2005.12872
概要:Detection Transformer(DETRという)という新しいフレームワークによって,non-maximum-supressionやアンカー生成のような人手で設計する必要なく、End-to-Endで画像からぶった検出を行う手法を提案しています。物体検出を直接集合予測問題として解くためのtransformerアーキテクチャとハンガリアン法を用いて二部マッチングを行い正解と予測の組み合わせを探索しています。Attentionを物体検出に応用しただけでなく、競合手法であるFaster R-CNNと同等の精度を達成しています。
발표자: 이활석(NAVER)
발표일: 2017.11.
최근 딥러닝 연구는 지도학습에서 비지도학습으로 급격히 무게 중심이 옮겨 지고 있습니다. 본 과정에서는 비지도학습의 가장 대표적인 방법인 오토인코더의 모든 것에 대해서 살펴보고자 합니다. 차원 축소관점에서 가장 많이 사용되는Autoencoder와 (AE) 그 변형 들인 Denoising AE, Contractive AE에 대해서 공부할 것이며, 데이터 생성 관점에서 최근 각광 받는 Variational AE와 (VAE) 그 변형 들인 Conditional VAE, Adversarial AE에 대해서 공부할 것입니다. 또한, 오토인코더의 다양한 활용 예시를 살펴봄으로써 현업과의 접점을 찾아보도록 노력할 것입니다.
1. Revisit Deep Neural Networks
2. Manifold Learning
3. Autoencoders
4. Variational Autoencoders
5. Applications
발표자: 최윤제(고려대 석사과정)
최윤제 (Yunjey Choi)는 고려대학교에서 컴퓨터공학을 전공하였으며, 현재는 석사과정으로 Machine Learning을 공부하고 있는 학생이다. 코딩을 좋아하며 이해한 것을 다른 사람들에게 공유하는 것을 좋아한다. 1년 간 TensorFlow를 사용하여 Deep Learning을 공부하였고 현재는 PyTorch를 사용하여 Generative Adversarial Network를 공부하고 있다. TensorFlow로 여러 논문들을 구현, PyTorch Tutorial을 만들어 Github에 공개한 이력을 갖고 있다.
개요:
Generative Adversarial Network(GAN)은 2014년 Ian Goodfellow에 의해 처음으로 제안되었으며, 적대적 학습을 통해 실제 데이터의 분포를 추정하는 생성 모델입니다. 최근 들어 GAN은 가장 인기있는 연구 분야로 떠오르고 있고 하루에도 수 많은 관련 논문들이 쏟아져 나오고 있습니다.
수 없이 쏟아져 나오고 있는 GAN 논문들을 다 읽기가 힘드신가요? 괜찮습니다. 기본적인 GAN만 완벽하게 이해한다면 새로 나오는 논문들도 쉽게 이해할 수 있습니다.
이번 발표를 통해 제가 GAN에 대해 알고 있는 모든 것들을 전달해드리고자 합니다. GAN을 아예 모르시는 분들, GAN에 대한 이론적인 내용이 궁금하셨던 분들, GAN을 어떻게 활용할 수 있을지 궁금하셨던 분들이 발표를 들으면 좋을 것 같습니다.
발표영상: https://youtu.be/odpjk7_tGY0
Talk about Google and Yahoo! , Microsoft. also Search Engine.
This Materials For Study meeting series of our department is latter part. (First Part is the " Revolutions".)
Our GOAL
해외에는 이런 데이터 경쟁 플랫폼이 있습니다. 한국에는 없죠. 국내 공공기관 또는 개별 기업들이 스팟성으로 불투명한 대회를 벗어나 지속적으로 대회를 운영하는 플랫폼이 있으면 좋겠다고 생각했습니다. 우리는 지금 Fintech 기업들과 함께 금융 데이터와 상금을 제공하며, 데이터 과학자 와 데이터 엔지니어링을 포함하는 데이터 대회를 운영합니다.
There are these data competition platforms overseas, but in Korea, Domestic public organizations or individual companies are out of the opaque temporary contest I wanted to have a platform that consistently runs the competition. We now provide financial data and cash prizes with Fintech companies, we run the Data Competition included in Data Engineer and Data Scientists.
Epistemic Interaction - tuning interfaces to provide information for AI supportAlan Dix
Paper presented at SYNERGY workshop at AVI 2024, Genoa, Italy. 3rd June 2024
https://alandix.com/academic/papers/synergy2024-epistemic/
As machine learning integrates deeper into human-computer interactions, the concept of epistemic interaction emerges, aiming to refine these interactions to enhance system adaptability. This approach encourages minor, intentional adjustments in user behaviour to enrich the data available for system learning. This paper introduces epistemic interaction within the context of human-system communication, illustrating how deliberate interaction design can improve system understanding and adaptation. Through concrete examples, we demonstrate the potential of epistemic interaction to significantly advance human-computer interaction by leveraging intuitive human communication strategies to inform system design and functionality, offering a novel pathway for enriching user-system engagements.
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...DanBrown980551
Do you want to learn how to model and simulate an electrical network from scratch in under an hour?
Then welcome to this PowSyBl workshop, hosted by Rte, the French Transmission System Operator (TSO)!
During the webinar, you will discover the PowSyBl ecosystem as well as handle and study an electrical network through an interactive Python notebook.
PowSyBl is an open source project hosted by LF Energy, which offers a comprehensive set of features for electrical grid modelling and simulation. Among other advanced features, PowSyBl provides:
- A fully editable and extendable library for grid component modelling;
- Visualization tools to display your network;
- Grid simulation tools, such as power flows, security analyses (with or without remedial actions) and sensitivity analyses;
The framework is mostly written in Java, with a Python binding so that Python developers can access PowSyBl functionalities as well.
What you will learn during the webinar:
- For beginners: discover PowSyBl's functionalities through a quick general presentation and the notebook, without needing any expert coding skills;
- For advanced developers: master the skills to efficiently apply PowSyBl functionalities to your real-world scenarios.
Essentials of Automations: Optimizing FME Workflows with ParametersSafe Software
Are you looking to streamline your workflows and boost your projects’ efficiency? Do you find yourself searching for ways to add flexibility and control over your FME workflows? If so, you’re in the right place.
Join us for an insightful dive into the world of FME parameters, a critical element in optimizing workflow efficiency. This webinar marks the beginning of our three-part “Essentials of Automation” series. This first webinar is designed to equip you with the knowledge and skills to utilize parameters effectively: enhancing the flexibility, maintainability, and user control of your FME projects.
Here’s what you’ll gain:
- Essentials of FME Parameters: Understand the pivotal role of parameters, including Reader/Writer, Transformer, User, and FME Flow categories. Discover how they are the key to unlocking automation and optimization within your workflows.
- Practical Applications in FME Form: Delve into key user parameter types including choice, connections, and file URLs. Allow users to control how a workflow runs, making your workflows more reusable. Learn to import values and deliver the best user experience for your workflows while enhancing accuracy.
- Optimization Strategies in FME Flow: Explore the creation and strategic deployment of parameters in FME Flow, including the use of deployment and geometry parameters, to maximize workflow efficiency.
- Pro Tips for Success: Gain insights on parameterizing connections and leveraging new features like Conditional Visibility for clarity and simplicity.
We’ll wrap up with a glimpse into future webinars, followed by a Q&A session to address your specific questions surrounding this topic.
Don’t miss this opportunity to elevate your FME expertise and drive your projects to new heights of efficiency.
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...Jeffrey Haguewood
Sidekick Solutions uses Bonterra Impact Management (fka Social Solutions Apricot) and automation solutions to integrate data for business workflows.
We believe integration and automation are essential to user experience and the promise of efficient work through technology. Automation is the critical ingredient to realizing that full vision. We develop integration products and services for Bonterra Case Management software to support the deployment of automations for a variety of use cases.
This video focuses on the notifications, alerts, and approval requests using Slack for Bonterra Impact Management. The solutions covered in this webinar can also be deployed for Microsoft Teams.
Interested in deploying notification automations for Bonterra Impact Management? Contact us at sales@sidekicksolutionsllc.com to discuss next steps.
DevOps and Testing slides at DASA ConnectKari Kakkonen
My and Rik Marselis slides at 30.5.2024 DASA Connect conference. We discuss about what is testing, then what is agile testing and finally what is Testing in DevOps. Finally we had lovely workshop with the participants trying to find out different ways to think about quality and testing in different parts of the DevOps infinity loop.
GraphRAG is All You need? LLM & Knowledge GraphGuy Korland
Guy Korland, CEO and Co-founder of FalkorDB, will review two articles on the integration of language models with knowledge graphs.
1. Unifying Large Language Models and Knowledge Graphs: A Roadmap.
https://arxiv.org/abs/2306.08302
2. Microsoft Research's GraphRAG paper and a review paper on various uses of knowledge graphs:
https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/
UiPath Test Automation using UiPath Test Suite series, part 3DianaGray10
Welcome to UiPath Test Automation using UiPath Test Suite series part 3. In this session, we will cover desktop automation along with UI automation.
Topics covered:
UI automation Introduction,
UI automation Sample
Desktop automation flow
Pradeep Chinnala, Senior Consultant Automation Developer @WonderBotz and UiPath MVP
Deepak Rai, Automation Practice Lead, Boundaryless Group and UiPath MVP
Generating a custom Ruby SDK for your web service or Rails API using Smithyg2nightmarescribd
Have you ever wanted a Ruby client API to communicate with your web service? Smithy is a protocol-agnostic language for defining services and SDKs. Smithy Ruby is an implementation of Smithy that generates a Ruby SDK using a Smithy model. In this talk, we will explore Smithy and Smithy Ruby to learn how to generate custom feature-rich SDKs that can communicate with any web service, such as a Rails JSON API.
Connector Corner: Automate dynamic content and events by pushing a buttonDianaGray10
Here is something new! In our next Connector Corner webinar, we will demonstrate how you can use a single workflow to:
Create a campaign using Mailchimp with merge tags/fields
Send an interactive Slack channel message (using buttons)
Have the message received by managers and peers along with a test email for review
But there’s more:
In a second workflow supporting the same use case, you’ll see:
Your campaign sent to target colleagues for approval
If the “Approve” button is clicked, a Jira/Zendesk ticket is created for the marketing design team
But—if the “Reject” button is pushed, colleagues will be alerted via Slack message
Join us to learn more about this new, human-in-the-loop capability, brought to you by Integration Service connectors.
And...
Speakers:
Akshay Agnihotri, Product Manager
Charlie Greenberg, Host
2. DICE Lab
Deep Intelligence for Cognitive Environment (DICE) Lab
- School of Computer Science and Engineering, KOREATECH
- Focus on deep intelligence systems by understanding various
cognitive environments based on language and vision
technologies.
- https://www.dicelab.kr
- Looking for self-motivated graduate students!
2
13. https://dacon.io 13
2. 위성영상 도전 과제3
<Aerial Data Class 별 객체 수 비교>
데이터의 개수 불균형
Class Images Ratio
Car 154,348 75.658 %
Truck 20,931 10.259 %
Small ship 13,533 6.633 %
Train 5,648 2.768 %
Bus 5,429 2.661 %
Oil tank 1,093 0.535 %
Military aircraft 1,031 0.505 %
Civilian aircraft 550 0.269 %
Large ship 348 0.170 %
Crane 315 0.154 %
Roundabout 219 0.107 %
Dam 184 0.090 %
Helipad 155 0.075 %
Bridge 136 0.066 %
Athletic field 87 0.042 %
14. https://dacon.io 14
2. 위성영상 도전 과제3
Class length height
Dam 259.96 241.30
Athletic field 241.14 257.71
Bridge 173.66 158.53
Large ship 102.95 117.03
Roundabout 98.00 95.06
Crane 73.14 60.51
Civilian aircraft 58.27 58.61
Oil tank 39.36 35.54
Military aircraft 33.77 32.39
Train 26.80 16.80
Helipad 21.70 17.77
Small ship 15.91 15.88
Bus 13.93 16.05
Truck 12.47 13.16
Car 6.96 7.27
<Aerial Data Class 별 크기 비교>
데이터의 크기 불균형
17. https://dacon.io 17
3. 접근 방법
• 데이터 수의 부족
Multi-scale data augmentation - training step
• 항공뷰의 특징
RoI Transformer
𝐒 𝟐
A-Nets
Ensemble
• 데이터의 불균형
Class-dependent IoU thresholding
Multi-scale augmentation - inference step
Few shot learning
• 데이터 레이블링 노이즈
heteroscedastic uncertainty를 활용한 노이즈 캔슬링
18. https://dacon.io 18
3. 접근 방법
• 데이터 수의 부족
Multi-scale data augmentation - training step
• 항공뷰의 특징
RoI Transformer
𝐒 𝟐
A-Nets
Ensemble
• 데이터의 불균형
Class-dependent IoU thresholding
Multi-scale augmentation - inference step
Few shot learning
• 데이터 레이블링 노이즈
Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
19. https://dacon.io 19
3. 접근 방법 - Multi-scale data augmentation
• 학습데이터의 크기를 다양한 스케일로 학습[2]시키는 것
• 장점
• 다양한 크기의 object에 강건한 모델을 만들 수 있음
• Ours
• 이미지를 1.0배, 1.5배, 2배, 4배의 스케일로 생성
20. https://dacon.io 20
3. 접근 방법
• 데이터 수의 부족
Multi-scale data augmentation - training step
• 항공뷰의 특징
RoI Transformer
𝐒 𝟐
A-Nets
Ensemble
• 데이터의 불균형
Class-dependent IoU thresholding
Multi-scale augmentation - inference step
Few shot learning
• 데이터 레이블링 노이즈
Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
21. https://dacon.io 21
3. 접근 방법 - RoI Transformer
• RoI transformer[3]
• Angle 자체를 추론함으로써 연산량을 극적으로 줄임
• anchor의 개수 = (num_scale * num_aspect_ratio * num_angles
anchor의 개수 = (num_scale * num_aspect_ratio * 1)
• 표현 가능한 angle의 종류를 무한개로 늘림
• num_angles ∈ {
π
2
,
π
3
,
𝜋
4
, … ,
𝜋
𝑛
}, finite set
num_angles ∈ 𝑅 , infinite set
22. https://dacon.io 22
3. 접근 방법 - 𝐒 𝟐
A-Nets
S2
A-Nets(Single-shot Alignment Network)[4]
• Feature Alignment Module(FAM)
고품질 anchor를 생성하고, alignment convolution을 통해 anchor 위
치에 맞는 convolution을 수행함.
• Oriented Detection Module(ODM)
Active Rotating Filters(ARF)를 사용해 방향 정보를 인코딩하여
orientation-sensitive feature를 제공함.
23. https://dacon.io 23
3. 접근 방법 - Ensemble
• Ensemble
• RoI Transformer 장점
• 2-stage 모델로 정확한 regression이 가능함.
• S2
A-Nets 장점
• Alignment covolution을 이용해 정확한 객체의 위치에 대한 연산이
가능한 모델로 classification성능이 우수함.
• RoI Transformer결과와 S2
A-Nets결과를 합하여 NMS를 해줌.
RoI Transformer의 장점과 S2
A-Nets장점이 모두 드러난 앙상블 효과를 냄.
24. https://dacon.io 24
3. 접근 방법
• 데이터 수의 부족
Multi-scale data augmentation - training step
• 항공뷰의 특징
RoI Transformer
𝐒 𝟐
A-Nets
Ensemble
• 데이터의 불균형
Class-dependent IoU thresholding
Multi-scale augmentation - inference step
Few shot learning
• 데이터 레이블링 노이즈
Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
25. https://dacon.io 25
3. 접근 방법 - Class-dependent IoU thresholding
개수가 많은 객체에 높은 threshold를 적용
Class Images Ratio Threshold
Car 154,348 75.658 % 0.75
Truck 20,931 10.259 % 0.26
Small ship 13,533 6.633 % 0.15
Train 5,648 2.768 % 0.01
Bus 5,429 2.661 % 0.15
Oil tank 1,093 0.535 % 0.01
Military aircraft 1,031 0.505 % 0.01
Civilian aircraft 550 0.269 % 0.01
Large ship 348 0.170 % 0.01
Crane 315 0.154 % 0.01
Roundabout 219 0.107 % 0.01
Dam 184 0.090 % 0.01
Helipad 155 0.075 % 0.01
Bridge 136 0.066 % 0.01
Athletic field 87 0.042 % 0.01
26. https://dacon.io 26
3. 접근 방법 - Multi-scale augmentation - inference step
Class length height
Dam 259.96 241.30
Athletic field 241.14 257.71
Bridge 173.66 158.53
Large ship 102.95 117.03
Roundabout 98.00 95.06
Crane 73.14 60.51
Civilian aircraft 58.27 58.61
Oil tank 39.36 35.54
Military aircraft 33.77 32.39
Train 26.80 16.80
Helipad 21.70 17.77
Small ship 15.91 15.88
Bus 13.93 16.05
Truck 12.47 13.16
Car 6.96 7.27
클래스별 객체의 크기 차이가 있기 때문에 Inference step에서 다양한
크기의 이미지를 보고 추론하도록 함
27. https://dacon.io 27
3. 접근 방법 – Few shot learning
개수가 적은 10개의 객체에 대하여 따로 학습을 진행함
Class Images Ratio
Car 154,348 75.658 %
Truck 20,931 10.259 %
Small ship 13,533 6.633 %
Train 5,648 2.768 %
Bus 5,429 2.661 %
Oil tank 1,093 0.535 %
Military aircraft 1,031 0.505 %
Civilian aircraft 550 0.269 %
Large ship 348 0.170 %
Crane 315 0.154 %
Roundabout 219 0.107 %
Dam 184 0.090 %
Helipad 155 0.075 %
Bridge 136 0.066 %
Athletic field 87 0.042 %
28. https://dacon.io 28
3. 접근 방법
• 데이터 수의 부족
Multi-scale data augmentation - training step
• 항공뷰의 특징
RoI Transformer
𝐒 𝟐
A-Nets
Ensemble
• 데이터의 불균형
Class-dependent IoU thresholding
Multi-scale augmentation - inference step
Few shot learning
• 데이터 레이블링 노이즈
Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
29. https://dacon.io 29
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫
prediction f 𝜔
x 가 주어졌을 때
f 𝜔
x 에 가우시안 노이즈를 섞어서 최종적인 y값을 만들 수 있음
30. https://dacon.io 30
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫
f 𝜔
x 는 이상적으로 존재할 거라 믿는 값으로
실제값에서 노이즈를 덜어낸 값
31. https://dacon.io 31
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫
종래에는 𝝉−𝟏로 레이블링 데이터 자체의 노이즈에 대한 믿음을
사람이 하이퍼파라미터로 주었음
38. https://dacon.io 38
5. 실험 셋업
Train(RoI Transformer)
• Pretrained backbone model : ResNetXt[5]
• GPU : Tesla V100 8대
• Epochs : 7
• Optimzer : SGD
• Time : 2.5 days
Hyper-parameter Value
Learning rate 0.01
Learning rate decay 0.1
Weight decay 0.0001
Warm up iteration 500
Warm up ratio 1.0 / 3
Milestones [6]
Momentum 0.9
<Train parameter setting>
Train(S2aNet)
• Pretrained backbone model : ResNetXt[5]
• GPU : Tesla V100 8대
• Epochs : 3, 12
• Optimzer : SGD
• Time : 1 day
Hyper-parameter Value
Learning rate 0.01
Learning rate decay 0.1
Weight decay 0.0001
Warm up iteration 500
Warm up ratio 1.0 / 3
Milestones [8,11]
Momentum 0.9
<Train parameter setting>
39. https://dacon.io 39
5. 실험 결과 - RoI Tranformer
Model Multi-scale training Multi-scale test
Pulblic
(mAP)
Resnet101 (700x700), (1024x1024) (700x700), (1024x1024) 0.4730
Resnext101 (700x700), (1024x1024) (700x700), (1024x1024) 0.5020
Resnext101 (700x700), (1024x1024) (600x600), (800x800), (1024x1024)
0.5350
(+0.0330)
Resnext101 (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048)
0.5543
(+0.0523)
Resnext101* (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048)
0.5701
(+0.0681)
Uncertainty
+ resnext101*
(x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048)
0.5890
(+0.0870)
* : 클래스별 다른 threshold 적용
_ : Baseline
40. https://dacon.io 40
5. 실험 결과 - S2
A-Nets
Model Multi-scale training Multi-scale test
Pulblic
(mAP)
resnet50 (x1.0, x2.0, x4.0) (x0.5, x1.0, x2.0, x4.0)
0.527
(+0.0250)
resnet50* (x4.0, x4.0, x4.0) (x0.5, x1.0, x2.0, x4.0)
0.559
(+0.0570)
* : 클래스별 다른 threshold 적용
41. https://dacon.io 41
5. 실험 결과 - RoI Tranformer + S2
A-Nets (Ensemble)
모델명 Multi-scale training Multi-scale test
Pulblic
(mAP)
RoI Transformer
+ S2A-Net
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net : (x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net : (x0.5, x1.0, x2.0, x4.0)
0.6034
(+0.1014)
RoI Transformer*
+ S2A-Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net : (x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net : (x0.5, x1.0, x2.0, x4.0)
0.6179
(+0.1159)
Uncertainty based
RoI Transformer*
+ S2A-Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net : (x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net : (x0.5, x1.0, x2.0, x4.0)
0.6261
(+0.1241)
* : 클래스별 다른 threshold 적용
42. https://dacon.io 42
5. 실험 결과 - RoI Tranformer + S2
A-Nets (Ensemble)
모델명 Multi-scale training Multi-scale test
Pulblic
(mAP)
Uncertainty based
RoI Transformer* +
S2A-Net* +
Few_shot_S2A-Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
Few_shot_S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
Few_shot_S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
0.6285
(+0.1265)
Uncertainty based
RoI Transformer* +
S2A-Net* +
Few_shot_S2A-
Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
Few_shot_S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((500x500), (600x600),
(800x800), (1024x1024), (1200x1200),
(1536x1536), (2048x2048))
S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
Few_shot_S2A-Net :
(x0.5, x1.0, x1.5, x2.0, x3.0, x4.0)
0.6438
(+0.1418)
* : 클래스별 다른 threshold 적용
43. https://dacon.io 43
5. 실험 결과 - RoI Tranformer + S2
A-Nets (Ensemble)
모델명 Multi-scale training Multi-scale test
Public
(mAP)
Private
(mAP)
Uncertainty based RoI
Transformer*
+ S2A-Net*
+ Few_shot_S2A-Net*
RoI Transformer :
(x1.0, x1.5, x2.0)
S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
Few_shot_S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
RoI Transformer :
((500x500), (600x600), (800x800), (1024x1024),
(1200x1200), (1536x1536), (2048x2048))
S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
Few_shot_S2A-Net :
(x0.5, x1.0, x1.5, x2.0, x3.0, x4.0)
0.6438 0.6206
* : 클래스별 다른 threshold 적용
44. https://dacon.io 44
5. 실험 결과 분석 - ensemble 효과
RoI Transformer 결과 S2
A-Nets 결과
S2
A-Nets 에서는 helipad 부분을 잘 잡지만, RoI Transformer에서는 잘
잡지 못하는것을 볼 수 있음.
45. https://dacon.io 45
5. 실험 결과 분석 - ensemble 효과
RoI Transformer에서는 잘 잡지 못하던 helipad을 잘 잡게됨.
Ensemble(RoI Transformer + S2A-Nets) 결과
47. https://dacon.io 47
6. 결론
• 데이터 수의 부족
Multi-scale data augmentation - training step을 통해 해결했음.
• 항공뷰의 특징
RoI Transformer, 𝐒 𝟐
A-Nets을 ensemble하여 해결했음.
• 데이터의 불균형
Different class threshold을 통해 데이터 수 간의 불균형을 완화했음.
Multi-scale augmentation – inference step을 통해 객체 크기
불균형을 완화했음.
Few shot learning을 통해 데이터 수 간의 불균형을 완화했음.
• 데이터 레이블링 노이즈
Heteroscedastic uncertainty를 활용한 노이즈 캔슬링을 통해 노이즈
레이블링 문제를 완화했음.
48. https://dacon.io 48
Reference
[1] https://commons.wikimedia.org/wiki/File:Aerial_photograph_of_a_cargo_ship.jpg
[2] J. C. Park, S. H. Lee, J. U. Jung, S. B. Son, H. S. Oh, Y. C. Jung, “Uncertainty-based Deep Object
Detection from Aerial Images”, Journal of Institute of Control, Robotics and Systems, (2020).
[3] J. Ding, N. Xue, Y. Long, G.-S. Xia, and Q. Lu, “Learning RoI transformer for oriented object
detection in aerial images,” Proceedings of the IEEE Conference on Computer Vision and Pattern
Recognition, pp. 2844-2853, (2019).
[4] Han, Jiaming, et al. "Align Deep Features for Oriented Object Detection." arXiv preprint
arXiv:2008.09397 (2020).
[5] 'open-mmlab://resnext101_64x4d'