Submit Search
Upload
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
•
Download as PPTX, PDF
•
1 like
•
1,666 views
Yusuke Uchida
Follow
SIGNATE「オフロード画像のセグメンテーションチャレンジ」認識精度部門3位入賞の解法紹介です。https://signate.jp/competitions/101
Read less
Read more
Technology
Report
Share
Report
Share
1 of 15
Download now
Recommended
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
Deep Learning JP
Transformer 動向調査 in 画像認識(修正版)
Transformer 動向調査 in 画像認識(修正版)
Kazuki Maeno
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
[DL輪読会]End-to-End Object Detection with Transformers
[DL輪読会]End-to-End Object Detection with Transformers
Deep Learning JP
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
Recommended
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
Deep Learning JP
Transformer 動向調査 in 画像認識(修正版)
Transformer 動向調査 in 画像認識(修正版)
Kazuki Maeno
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
[DL輪読会]End-to-End Object Detection with Transformers
[DL輪読会]End-to-End Object Detection with Transformers
Deep Learning JP
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
semantic segmentation サーベイ
semantic segmentation サーベイ
yohei okawa
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
Takahiro Kubo
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
Kensho Hara
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
Deep Learning JP
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
Deep Learning JP
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Deep Learning JP
Action Recognitionの歴史と最新動向
Action Recognitionの歴史と最新動向
Ohnishi Katsunori
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
Hiroharu Kato
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
Takuya Minagawa
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
Deep Learning JP
Semantic segmentation
Semantic segmentation
Takuya Minagawa
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
SSII
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
cvpaper. challenge
backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
SSII
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
モデル高速化百選
モデル高速化百選
Yusuke Uchida
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
Yusuke Uchida
More Related Content
What's hot
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
semantic segmentation サーベイ
semantic segmentation サーベイ
yohei okawa
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
Takahiro Kubo
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
Kensho Hara
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
Deep Learning JP
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
Deep Learning JP
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Deep Learning JP
Action Recognitionの歴史と最新動向
Action Recognitionの歴史と最新動向
Ohnishi Katsunori
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
Hiroharu Kato
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
Takuya Minagawa
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
Deep Learning JP
Semantic segmentation
Semantic segmentation
Takuya Minagawa
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
SSII
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
cvpaper. challenge
backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
SSII
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
モデル高速化百選
モデル高速化百選
Yusuke Uchida
What's hot
(20)
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
semantic segmentation サーベイ
semantic segmentation サーベイ
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Action Recognitionの歴史と最新動向
Action Recognitionの歴史と最新動向
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
Semantic segmentation
Semantic segmentation
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
backbone としての timm 入門
backbone としての timm 入門
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
モデル高速化百選
モデル高速化百選
More from Yusuke Uchida
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
Yusuke Uchida
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
Yusuke Uchida
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
Yusuke Uchida
画像認識と深層学習
画像認識と深層学習
Yusuke Uchida
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
Deep Fakes Detection
Deep Fakes Detection
Yusuke Uchida
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
Yusuke Uchida
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
Humpback whale identification challenge反省会
Humpback whale identification challenge反省会
Yusuke Uchida
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
Yusuke Uchida
コンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネス
Yusuke Uchida
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Yusuke Uchida
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
Yusuke Uchida
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
Yusuke Uchida
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
Yusuke Uchida
最近のSingle Shot系の物体検出のアーキテクチャまとめ
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Yusuke Uchida
Embedding Watermarks into Deep Neural Networks
Embedding Watermarks into Deep Neural Networks
Yusuke Uchida
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
Yusuke Uchida
More from Yusuke Uchida
(20)
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
画像認識と深層学習
画像認識と深層学習
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
Deep Fakes Detection
Deep Fakes Detection
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Humpback whale identification challenge反省会
Humpback whale identification challenge反省会
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
コンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネス
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
最近のSingle Shot系の物体検出のアーキテクチャまとめ
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Embedding Watermarks into Deep Neural Networks
Embedding Watermarks into Deep Neural Networks
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
Recently uploaded
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Recently uploaded
(7)
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
1.
SIGNATE オフロード画像のセグメンテーション チャレンジ(認識精度部門) 3rd Place
Solution @yu4u 1
2.
コンペ概要 • 4クラスセグメンテーションタスク • background,
road, dirt road, other obstacle • データセット • train: オフロード環境の実走行で得られた画像(5014枚) • 19カテゴリ:3007枚(評価対象のroad, dirt road, other obstacleを含む) • 2カテゴリ:2007枚 • test: オフロード環境の実走行で得られた画像(640枚) • 評価指標 • road, dirt road, other obstacleのmIoU 2
3.
データ詳細 3
4.
アプローチ • モデル: 4
class segmentation model • FPN (efficientnet-b5) • UNet++ (efficientnet-b3, efficientnet-b5, efficientnet-b7, inceptionv4, resnet101, se_resnext101, skresnext50) • 8モデル x 5-fold CV = 40 model average ensemble • 損失関数 • cross entropy, iou, dice, lovasz loss • Optimizer • AdamW, lr: 1e-4 -> 1e-5, 30 epochs • augmentation • Resize to 960x540 • HorizontalFlip, RandomBrightnessContrast, ShiftScaleRotate • TTA: horizontal flip • train_images_Bは不使用 4
5.
Validation方針 • 類似画像が大量に存在するためrandom splitの信頼性が低い •
“データセットの類似に関して” • https://signate.jp/competitions/109/discussions/202101171843 52-39602 • クラスタリングしてみる • imagehashのphashを特徴量として sklearn.cluster.AgglomerativeClusteringを利用 • 凝縮型を利用したのは、同一道路を走っているような映像の場合でも その走行全体を1クラスタとしたいため 5
6.
(C) 防衛省・防衛装備庁
7.
Validation方針 • 類似画像が大量に存在するためrandom splitの信頼性が低い •
“データセットの類似に関して” • https://signate.jp/competitions/109/discussions/202101171843 52-39602 • クラスタリングしてみる • imagehashのphashを特徴量として sklearn.cluster.AgglomerativeClusteringを利用 • 凝縮型を利用したのは、同一道路を走っているような映像の場合でも その走行全体を1クラスタとしたいため • いっぱいクラスタが出てきた • が、「雪道」のようなレアなクラスタができてしまった • 雪道が認識できないモデルが生成される危険性があるため random splitを採用 7
8.
モデル • セグメンテーションアーキテクチャ • UNet,
UNet++, FPN, PAN, DeepLabV3+ を比較 • UNet++, FPNが良さそう • バックボーン • 良さそうなものもひたすら追加 • 学習がほぼ必要ない速度部門をやっていたので思考停止で学習だけ回していた • RegNetがあまりCV性能が良くなかったので外した以外は全て投入 • efficientnet-b3/b5/b7, inceptionv4, resnet101, se_resnext101, skresnext50 8
9.
損失関数 9 https://github.com/JunMa11/SegLoss
10.
損失関数 • Kaggleで良く利用されているcross entropy,
iou, dice, lovasz loss を採用 • CV上も全て利用したほうが良さそう 10
11.
Augmentation、Optimizer • Augmentation • HorizontalFlip,
RandomBrightnessContrast, ShiftScaleRotate • Optimizer • AdamW, lr: 1e-4 -> 1e-5 (CosineAnnealingWarmRestarts), 30 epochs • Automatic Mixed Precision利用 (ほぼ鰹節コンペの使いまわし) 11
12.
アンサンブル • 8モデル x
5-fold CV = 40 model average ensemble 12
13.
結果 13
14.
What did not
work • Pseudo label • train + train_images_B/test pseudo labelで訓練 • 評価される3ラベルのみiou, dice, lovasz lossを利用 14
15.
利用フレームワーク等 • パイプライン: pytorch-lightning •
config管理: OmegaConf • 実験管理: wandb • model: https://github.com/qubvel/segmentation_models.pytorch • Augmentation: albumentations • 参考図書 • https://neptune.ai/blog/image-segmentation-tips-and-tricks-from-kaggle- competitions • https://github.com/JunMa11/SegLoss • https://github.com/kevinzakka/pytorch-goodies 15
Download now