SlideShare a Scribd company logo
1 of 19
Download to read offline
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
DLゼミ
Deep High-Resolution Representation
Learning for Human Pose Estimation
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士課程2年 森 雄斗
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
2
論文情報
• 著者
• Ke Sun12, Bin Xiao2, Dong Liu1, Jingdong Wang2
• 1University of Science and Technology of Chine
• 2Microsoft
• 発表
• CVPR 2019
• 論文URL
• https://arxiv.org/pdf/1902.09212.pdf
• プロジェクトサイト
• https://jingdongwang2017.github.io/Projects/HRNet/PoseEst
imation.html
• GitHub (公式実装: pytorch)
• https://github.com/leoxiaobin/deep-high-resolution-
net.pytorch
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
3
論文概要
• Top-downアプローチの姿勢推定モデル
• 高解像度の表現を維持する機構を持つHRNetを使用
• 低解像度のサブネットワークを追加し、複数の解像度の
サブネットワークを並列に接続
• ポーズ追跡においても高い性能を確認
モデル構造 姿勢の推定結果
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
4
姿勢推定とアプローチ
• 人間のキーポイント(両肩、膝など)を画像、動画から推定
– 一般的には17箇所の座標を出力
• 従来の2種類のアプローチ
提案モデルの出力結果 別手法の結果 (PoseNet[1])
[1] https://www.tensorflow.org/lite/examples/pose_estimation/overview?hl=ja
個々の
人物推定
Top-down Bottom-up
個々の
姿勢推定
キーポイント
座標を推定
人物毎に
グルーピング
ex: DeepPose, Cascaded Pyramid Network ex: PoseNet (PersonLab), PifPaf
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
5
既存のモデルとの違い
• 正確なヒートマップ推定のために、全てのプロセスで高解
像度の表現を維持
• 中間のヒートマップの監視を行わないため、キーポイント
の検出精度に優れ、計算量やパラメータが効率的
提案するモデル構造
既存の姿勢推定モデルの構造
(a) Hourglass[1]
(b) Cascaded pyramid networks[2]
(c) SimpleBaseLine[3]
(d) Combination with dilated convolutions[4]
[1] A. Newell, K. Yang, and J. Deng. Stacked hourglass networks for human pose estimation. In ECCV, pages 483–499, 2016.
[2] Y. Chen, Z. Wang, Y. Peng, Z. Zhang, G. Yu, and J. Sun. Cascaded pyramid network for multi-person pose estimation. CoRR, abs/1711.07319, 2017.
[3] B. Xiao, H. Wu, and Y. Wei. Simple baselines for human pose estimation and tracking. In ECCV, pages 472–487, 2018.
[4] E. Insafutdinov, L. Pishchulin, B. Andres, M. Andriluka, and B. Schiele. Deepercut: A deeper, stronger, and faster multiperson pose estimation model. In ECCV, pages 34–50, 2016.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
6
姿勢推定の出力とヒートマップ
• 姿勢推定とは、サイズが 𝑊 × 𝐻 × 3 の画像から𝐾個の
キーポイント(膝や腕など)の位置を検出するタスク
• 最新の手法では、 𝑊′ × 𝐻′, {𝐻1, 𝐻2, … , 𝐻𝑘} の𝐾個の
ヒートマップを推定し、位置を求める
画像は別論文[1]から参照
[1] Wei, Shih-En, et al. "Convolutional pose machines." Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. 2016.
入力画像: 𝑊 × 𝐻 × 3
キーポイント1の
ヒートマップ
キーポイント2の
ヒートマップ
キーポイントK − 1の
ヒートマップ
キーポイントKの
ヒートマップ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
7
Parallel multi-resolution subnetworks
• 高解像度のサブネットワークを最初のネットワークとし、
一つずつ低解像度のサブネットワークを並列に接続
4つの並列サブネットワークの構造例
𝒩
𝑠𝑟: サブネットワーク
𝑠 : ステージ数
𝑟: 解像度インデックス
(解像度は第1サブネットワークの
1
2𝑟−1)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
8
Exchange Units
• マルチスケールのサブネットワークを融合
• 他の並列サブネットワークから情報を繰り返し受け
取ることが可能
𝐶𝑠𝑟
𝑏
: 畳み込みユニット, 𝜀𝑠
𝑏
: exchange unit
𝑏 : ブロック数
𝑠 : ステージ数
𝑟 : 解像度インデックス
第3ステージ、3ブロックの並列畳み込みユニットとexchange unit
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
9
Exchange Units
• マルチスケールのサブネットワークを融合
• 他の並列サブネットワークから情報を繰り返し受け
取ることが可能
アップサンプリングとダウンサンプリングの戦略
: nearest neighbor up-sampling (最近傍アップサンプリング)
+ 1 × 1 の畳み込み処理
: 3 × 3 のストライド付き畳み込み処理
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
10
ヒートマップの推定
• 最終の高解像度の表現からヒートマップを回帰
• 損失関数は予測ヒートマップとGround truthのヒート
マップの平均二乗誤差
• Ground truthは各キーポイントの位置を中心に標準偏差
1ピクセルの2次元ガウス関数を使用し生成
推論結果のヒートマップ画像
Ground truthはキーポイント
の座標(𝑥 × 𝑦)のみ
生成
Ground truthの
ヒートマップ画像
-比較-
損失関数
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
11
ネットワークのインスタンス化
• ネットワークはResNetのデザインルールを使用
• 4つの並列サブネットワークを持つ4つのステージ
から構成
• 実験では、大小のネットワークを使用
– HRNet-W32 (最後の3段階のチャンネル幅: 64, 128, 256)
– HRNet-W48 (最後の3段階のチャンネル幅: 96, 192, 386)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
12
実験1: COCO Keypoint Detection
• データセット
– COCO Keypoint Detection
• 200,000以上の17のキーポイントが
ラベル付けされた画像
• https://cocodataset.org/#home
• 評価指標
– Object Keypoint Similarity (OKS)
𝑂𝐾𝑆 =
σ𝑖 𝑒𝑥𝑝 Τ
−𝑑𝑖
2
2𝑠2𝑘𝑖
2
𝛿 𝑣𝑖 > 0
σ𝑖 𝛿 𝑣𝑖 > 0
𝑑𝑖 : 推定座標とGround truthの座標のユークリッド距離
𝑠 : 人物領域の面積
𝑘𝑖 : 減衰を制御するキーポイントごとの定数 (eyes < nose < … < ankles < Hips)
𝑣𝑖 : Ground truthの可視性フラグ (部位が画像に存在するかどうか)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
13
実験1: 結果
• モデルサイズ(Params)と計算量(GFLOPs)を抑えつつ、
高い精度を実現
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
14
実験1: 結果
• モデルサイズ(Params)と計算量(GFLOPs)を抑えつつ、
高い精度を実現
10個のOKS閾値に
対する平均適合率
OKS=0.5の
平均適合率
OKS=0.75の
平均適合率
中サイズの
人に対する
平均適合率
大サイズの人
に対する
平均適合率
10個のOKS閾
値に対する
平均再現率
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
15
実験2: MPII Human Pose Estimation
• データセット
– MPII Human Pose dataset
• 25,000枚のキーポイントラベル付きの画像
• http://human-pose.mpi-inf.mpg.de/
• 評価指標
– PCKh
• 頭部のサイズを1として、キーポイントがground truthの何%の範囲内
に入ってるか
• 一般的にはPCKh@0.5を使用
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
16
実験2: 結果
• 他のモデルよりも優れた精度
人体の構成を学習する
コンポジションモデルを
採用しているため高精度
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
17
Ablation Study
• マルチスケールの融合の効果を検証
• 入力サイズによる精度の違い
入力サイズが小さい方が
顕著に差があり
→ 処理全体で高解像度を
維持しているため
マルチスケールの融合は
精度向上に貢献し、回数
が増えるほど高精度
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
18
まとめ
• Top-downアプローチの姿勢推定モデル
• 高解像度の表現を維持する機構を持つHRNetを使用
• 低解像度のサブネットワークを追加し、複数の解像度の
サブネットワークを並列に接続
• ポーズ追跡においても高い性能を確認
モデル構造 姿勢の推定結果
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
19
現在(2021年9月)への影響
• 物体検出など別分野でも使用可能
– Deep High-Resolution Representation Learning for
Visual Recognition[1]
• 拡張したネットワークの提案
– HigherHRNet[2] (CVPR 2020)
– HRNet-DEKR[3] (CVPR 2021)
– Lite HRNet[4] (CVPR 2021)
[1] Sun, Ke, et al. "Deep high-resolution representation learning for human pose estimation." Proceedings of the IEEE/CVF
Conference on Computer Vision and Pattern Recognition. 2019.
[2] Cheng, Bowen, et al. "Higherhrnet: Scale-aware representation learning for bottom-up human pose estimation." Proceedings
of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020.
[3] Geng, Zigang, et al. "Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression." Proceedings of the IEEE/CVF
Conference on Computer Vision and Pattern Recognition. 2021.
[4] Yu, Changqian, et al. "Lite-hrnet: A lightweight high-resolution network." Proceedings of the IEEE/CVF Conference on
Computer Vision and Pattern Recognition. 2021.

More Related Content

What's hot

SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII
 
[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series
[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series
[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time SeriesDeep Learning JP
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Yamato OKAMOTO
 
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task LearningDeep Learning JP
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向Kensho Hara
 
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural NetworksSeiya Tokui
 
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)Tomohiro Motoda
 
【DL輪読会】Segment Anything
【DL輪読会】Segment Anything【DL輪読会】Segment Anything
【DL輪読会】Segment AnythingDeep Learning JP
 
SSII2022 [OS3-04] Human-in-the-Loop 機械学習
SSII2022 [OS3-04] Human-in-the-Loop 機械学習SSII2022 [OS3-04] Human-in-the-Loop 機械学習
SSII2022 [OS3-04] Human-in-the-Loop 機械学習SSII
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Yamato OKAMOTO
 
TransPose: Towards Explainable Human Pose Estimation by Transformer
TransPose: Towards Explainable Human Pose Estimation by TransformerTransPose: Towards Explainable Human Pose Estimation by Transformer
TransPose: Towards Explainable Human Pose Estimation by TransformerYasutomo Kawanishi
 
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? 【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? Deep Learning JP
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII
 
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion ModelsDeep Learning JP
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...Shunsuke Ono
 

What's hot (20)

SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
 
[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series
[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series
[DL輪読会]SOM-VAE: Interpretable Discrete Representation Learning on Time Series
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
 
20190804_icml_kyoto
20190804_icml_kyoto20190804_icml_kyoto
20190804_icml_kyoto
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
 
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks
 
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
 
【DL輪読会】Segment Anything
【DL輪読会】Segment Anything【DL輪読会】Segment Anything
【DL輪読会】Segment Anything
 
SSII2022 [OS3-04] Human-in-the-Loop 機械学習
SSII2022 [OS3-04] Human-in-the-Loop 機械学習SSII2022 [OS3-04] Human-in-the-Loop 機械学習
SSII2022 [OS3-04] Human-in-the-Loop 機械学習
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
TransPose: Towards Explainable Human Pose Estimation by Transformer
TransPose: Towards Explainable Human Pose Estimation by TransformerTransPose: Towards Explainable Human Pose Estimation by Transformer
TransPose: Towards Explainable Human Pose Estimation by Transformer
 
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? 【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
 

Similar to Deep High Resolution Representation Learning for Human Pose Estimation

Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...
Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...
Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...harmonylab
 
Learning to Incetivize Other Learning Agents
Learning to Incetivize Other Learning AgentsLearning to Incetivize Other Learning Agents
Learning to Incetivize Other Learning Agentsharmonylab
 
A Transformer-based Framework for Multivariate Time Series Representation Lea...
A Transformer-based Framework for Multivariate Time Series Representation Lea...A Transformer-based Framework for Multivariate Time Series Representation Lea...
A Transformer-based Framework for Multivariate Time Series Representation Lea...harmonylab
 
A Learning-based Iterative Method for Solving Vehicle Routing Problems
A Learning-based Iterative Method for Solving Vehicle Routing ProblemsA Learning-based Iterative Method for Solving Vehicle Routing Problems
A Learning-based Iterative Method for Solving Vehicle Routing Problemsharmonylab
 
A hybrid model for building energy consumption forecasting using long short t...
A hybrid model for building energy consumption forecasting using long short t...A hybrid model for building energy consumption forecasting using long short t...
A hybrid model for building energy consumption forecasting using long short t...harmonylab
 
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...harmonylab
 
Anomaly Detection for an E-commerce Pricing System
Anomaly Detection for an E-commerce Pricing SystemAnomaly Detection for an E-commerce Pricing System
Anomaly Detection for an E-commerce Pricing Systemharmonylab
 
メトリックラーニングを用いたバス乗客ODデータの推定に関する研究
メトリックラーニングを用いたバス乗客ODデータの推定に関する研究メトリックラーニングを用いたバス乗客ODデータの推定に関する研究
メトリックラーニングを用いたバス乗客ODデータの推定に関する研究harmonylab
 
Disentangling semantics and syntax in sentence embeddings with pre trained la...
Disentangling semantics and syntax in sentence embeddings with pre trained la...Disentangling semantics and syntax in sentence embeddings with pre trained la...
Disentangling semantics and syntax in sentence embeddings with pre trained la...harmonylab
 
From street photos to fashion trends leveraging user provided noisy labels fo...
From street photos to fashion trends leveraging user provided noisy labels fo...From street photos to fashion trends leveraging user provided noisy labels fo...
From street photos to fashion trends leveraging user provided noisy labels fo...harmonylab
 
Forecasting across time series databases using recurrent neural networks on g...
Forecasting across time series databases using recurrent neural networks on g...Forecasting across time series databases using recurrent neural networks on g...
Forecasting across time series databases using recurrent neural networks on g...harmonylab
 
Personalized outfit recommendation with learnable anchors
Personalized outfit recommendation with learnable anchorsPersonalized outfit recommendation with learnable anchors
Personalized outfit recommendation with learnable anchorsharmonylab
 
Interpreting and Steering AI Explanations Via Interactive Visualizations
Interpreting and Steering AI Explanations Via Interactive VisualizationsInterpreting and Steering AI Explanations Via Interactive Visualizations
Interpreting and Steering AI Explanations Via Interactive VisualizationsQianwen Wang
 
セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究
セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究
セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究harmonylab
 
Stereoscopic Display of Lung PET/CT DICOM Scans using Perspective
Stereoscopic Display of Lung PET/CT DICOM Scans using PerspectiveStereoscopic Display of Lung PET/CT DICOM Scans using Perspective
Stereoscopic Display of Lung PET/CT DICOM Scans using PerspectiveCassidy Chen
 
IRJET - Design and Development of Android Application for Face Detection and ...
IRJET - Design and Development of Android Application for Face Detection and ...IRJET - Design and Development of Android Application for Face Detection and ...
IRJET - Design and Development of Android Application for Face Detection and ...IRJET Journal
 
FACE MASK DETECTION USING ML
FACE MASK DETECTION USING MLFACE MASK DETECTION USING ML
FACE MASK DETECTION USING MLIRJET Journal
 
M.Tech computer-science-and-software-engineering
M.Tech computer-science-and-software-engineeringM.Tech computer-science-and-software-engineering
M.Tech computer-science-and-software-engineeringJECRC UNIVERSITY, RAJASTHAN
 
Motion capture for Animation
Motion capture for AnimationMotion capture for Animation
Motion capture for AnimationIRJET Journal
 
Gender and age classification using deep learning
Gender and age classification using deep learningGender and age classification using deep learning
Gender and age classification using deep learningIRJET Journal
 

Similar to Deep High Resolution Representation Learning for Human Pose Estimation (20)

Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...
Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...
Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Ba...
 
Learning to Incetivize Other Learning Agents
Learning to Incetivize Other Learning AgentsLearning to Incetivize Other Learning Agents
Learning to Incetivize Other Learning Agents
 
A Transformer-based Framework for Multivariate Time Series Representation Lea...
A Transformer-based Framework for Multivariate Time Series Representation Lea...A Transformer-based Framework for Multivariate Time Series Representation Lea...
A Transformer-based Framework for Multivariate Time Series Representation Lea...
 
A Learning-based Iterative Method for Solving Vehicle Routing Problems
A Learning-based Iterative Method for Solving Vehicle Routing ProblemsA Learning-based Iterative Method for Solving Vehicle Routing Problems
A Learning-based Iterative Method for Solving Vehicle Routing Problems
 
A hybrid model for building energy consumption forecasting using long short t...
A hybrid model for building energy consumption forecasting using long short t...A hybrid model for building energy consumption forecasting using long short t...
A hybrid model for building energy consumption forecasting using long short t...
 
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
 
Anomaly Detection for an E-commerce Pricing System
Anomaly Detection for an E-commerce Pricing SystemAnomaly Detection for an E-commerce Pricing System
Anomaly Detection for an E-commerce Pricing System
 
メトリックラーニングを用いたバス乗客ODデータの推定に関する研究
メトリックラーニングを用いたバス乗客ODデータの推定に関する研究メトリックラーニングを用いたバス乗客ODデータの推定に関する研究
メトリックラーニングを用いたバス乗客ODデータの推定に関する研究
 
Disentangling semantics and syntax in sentence embeddings with pre trained la...
Disentangling semantics and syntax in sentence embeddings with pre trained la...Disentangling semantics and syntax in sentence embeddings with pre trained la...
Disentangling semantics and syntax in sentence embeddings with pre trained la...
 
From street photos to fashion trends leveraging user provided noisy labels fo...
From street photos to fashion trends leveraging user provided noisy labels fo...From street photos to fashion trends leveraging user provided noisy labels fo...
From street photos to fashion trends leveraging user provided noisy labels fo...
 
Forecasting across time series databases using recurrent neural networks on g...
Forecasting across time series databases using recurrent neural networks on g...Forecasting across time series databases using recurrent neural networks on g...
Forecasting across time series databases using recurrent neural networks on g...
 
Personalized outfit recommendation with learnable anchors
Personalized outfit recommendation with learnable anchorsPersonalized outfit recommendation with learnable anchors
Personalized outfit recommendation with learnable anchors
 
Interpreting and Steering AI Explanations Via Interactive Visualizations
Interpreting and Steering AI Explanations Via Interactive VisualizationsInterpreting and Steering AI Explanations Via Interactive Visualizations
Interpreting and Steering AI Explanations Via Interactive Visualizations
 
セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究
セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究
セマンティックセグメンテーションによる路面画像の積雪状況認識に関する基礎研究
 
Stereoscopic Display of Lung PET/CT DICOM Scans using Perspective
Stereoscopic Display of Lung PET/CT DICOM Scans using PerspectiveStereoscopic Display of Lung PET/CT DICOM Scans using Perspective
Stereoscopic Display of Lung PET/CT DICOM Scans using Perspective
 
IRJET - Design and Development of Android Application for Face Detection and ...
IRJET - Design and Development of Android Application for Face Detection and ...IRJET - Design and Development of Android Application for Face Detection and ...
IRJET - Design and Development of Android Application for Face Detection and ...
 
FACE MASK DETECTION USING ML
FACE MASK DETECTION USING MLFACE MASK DETECTION USING ML
FACE MASK DETECTION USING ML
 
M.Tech computer-science-and-software-engineering
M.Tech computer-science-and-software-engineeringM.Tech computer-science-and-software-engineering
M.Tech computer-science-and-software-engineering
 
Motion capture for Animation
Motion capture for AnimationMotion capture for Animation
Motion capture for Animation
 
Gender and age classification using deep learning
Gender and age classification using deep learningGender and age classification using deep learning
Gender and age classification using deep learning
 

More from harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 

More from harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 

Recently uploaded

How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?XfilesPro
 
Maximizing Board Effectiveness 2024 Webinar.pptx
Maximizing Board Effectiveness 2024 Webinar.pptxMaximizing Board Effectiveness 2024 Webinar.pptx
Maximizing Board Effectiveness 2024 Webinar.pptxOnBoard
 
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking MenDelhi Call girls
 
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024BookNet Canada
 
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Alan Dix
 
Benefits Of Flutter Compared To Other Frameworks
Benefits Of Flutter Compared To Other FrameworksBenefits Of Flutter Compared To Other Frameworks
Benefits Of Flutter Compared To Other FrameworksSoftradix Technologies
 
Key Features Of Token Development (1).pptx
Key  Features Of Token  Development (1).pptxKey  Features Of Token  Development (1).pptx
Key Features Of Token Development (1).pptxLBM Solutions
 
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...HostedbyConfluent
 
Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)Allon Mureinik
 
How to Troubleshoot Apps for the Modern Connected Worker
How to Troubleshoot Apps for the Modern Connected WorkerHow to Troubleshoot Apps for the Modern Connected Worker
How to Troubleshoot Apps for the Modern Connected WorkerThousandEyes
 
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...Neo4j
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationSafe Software
 
Install Stable Diffusion in windows machine
Install Stable Diffusion in windows machineInstall Stable Diffusion in windows machine
Install Stable Diffusion in windows machinePadma Pradeep
 
Human Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR SystemsHuman Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR SystemsMark Billinghurst
 
Understanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitectureUnderstanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitecturePixlogix Infotech
 
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 3652toLead Limited
 
Enhancing Worker Digital Experience: A Hands-on Workshop for Partners
Enhancing Worker Digital Experience: A Hands-on Workshop for PartnersEnhancing Worker Digital Experience: A Hands-on Workshop for Partners
Enhancing Worker Digital Experience: A Hands-on Workshop for PartnersThousandEyes
 
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticsKotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticscarlostorres15106
 
Presentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreterPresentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreternaman860154
 
Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101Paola De la Torre
 

Recently uploaded (20)

How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?How to Remove Document Management Hurdles with X-Docs?
How to Remove Document Management Hurdles with X-Docs?
 
Maximizing Board Effectiveness 2024 Webinar.pptx
Maximizing Board Effectiveness 2024 Webinar.pptxMaximizing Board Effectiveness 2024 Webinar.pptx
Maximizing Board Effectiveness 2024 Webinar.pptx
 
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
 
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
 
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
 
Benefits Of Flutter Compared To Other Frameworks
Benefits Of Flutter Compared To Other FrameworksBenefits Of Flutter Compared To Other Frameworks
Benefits Of Flutter Compared To Other Frameworks
 
Key Features Of Token Development (1).pptx
Key  Features Of Token  Development (1).pptxKey  Features Of Token  Development (1).pptx
Key Features Of Token Development (1).pptx
 
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
 
Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)
 
How to Troubleshoot Apps for the Modern Connected Worker
How to Troubleshoot Apps for the Modern Connected WorkerHow to Troubleshoot Apps for the Modern Connected Worker
How to Troubleshoot Apps for the Modern Connected Worker
 
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
 
Install Stable Diffusion in windows machine
Install Stable Diffusion in windows machineInstall Stable Diffusion in windows machine
Install Stable Diffusion in windows machine
 
Human Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR SystemsHuman Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR Systems
 
Understanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitectureUnderstanding the Laravel MVC Architecture
Understanding the Laravel MVC Architecture
 
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
 
Enhancing Worker Digital Experience: A Hands-on Workshop for Partners
Enhancing Worker Digital Experience: A Hands-on Workshop for PartnersEnhancing Worker Digital Experience: A Hands-on Workshop for Partners
Enhancing Worker Digital Experience: A Hands-on Workshop for Partners
 
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticsKotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
 
Presentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreterPresentation on how to chat with PDF using ChatGPT code interpreter
Presentation on how to chat with PDF using ChatGPT code interpreter
 
Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101
 

Deep High Resolution Representation Learning for Human Pose Estimation

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. DLゼミ Deep High-Resolution Representation Learning for Human Pose Estimation 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士課程2年 森 雄斗
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 2 論文情報 • 著者 • Ke Sun12, Bin Xiao2, Dong Liu1, Jingdong Wang2 • 1University of Science and Technology of Chine • 2Microsoft • 発表 • CVPR 2019 • 論文URL • https://arxiv.org/pdf/1902.09212.pdf • プロジェクトサイト • https://jingdongwang2017.github.io/Projects/HRNet/PoseEst imation.html • GitHub (公式実装: pytorch) • https://github.com/leoxiaobin/deep-high-resolution- net.pytorch
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 3 論文概要 • Top-downアプローチの姿勢推定モデル • 高解像度の表現を維持する機構を持つHRNetを使用 • 低解像度のサブネットワークを追加し、複数の解像度の サブネットワークを並列に接続 • ポーズ追跡においても高い性能を確認 モデル構造 姿勢の推定結果
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 4 姿勢推定とアプローチ • 人間のキーポイント(両肩、膝など)を画像、動画から推定 – 一般的には17箇所の座標を出力 • 従来の2種類のアプローチ 提案モデルの出力結果 別手法の結果 (PoseNet[1]) [1] https://www.tensorflow.org/lite/examples/pose_estimation/overview?hl=ja 個々の 人物推定 Top-down Bottom-up 個々の 姿勢推定 キーポイント 座標を推定 人物毎に グルーピング ex: DeepPose, Cascaded Pyramid Network ex: PoseNet (PersonLab), PifPaf
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 5 既存のモデルとの違い • 正確なヒートマップ推定のために、全てのプロセスで高解 像度の表現を維持 • 中間のヒートマップの監視を行わないため、キーポイント の検出精度に優れ、計算量やパラメータが効率的 提案するモデル構造 既存の姿勢推定モデルの構造 (a) Hourglass[1] (b) Cascaded pyramid networks[2] (c) SimpleBaseLine[3] (d) Combination with dilated convolutions[4] [1] A. Newell, K. Yang, and J. Deng. Stacked hourglass networks for human pose estimation. In ECCV, pages 483–499, 2016. [2] Y. Chen, Z. Wang, Y. Peng, Z. Zhang, G. Yu, and J. Sun. Cascaded pyramid network for multi-person pose estimation. CoRR, abs/1711.07319, 2017. [3] B. Xiao, H. Wu, and Y. Wei. Simple baselines for human pose estimation and tracking. In ECCV, pages 472–487, 2018. [4] E. Insafutdinov, L. Pishchulin, B. Andres, M. Andriluka, and B. Schiele. Deepercut: A deeper, stronger, and faster multiperson pose estimation model. In ECCV, pages 34–50, 2016.
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 6 姿勢推定の出力とヒートマップ • 姿勢推定とは、サイズが 𝑊 × 𝐻 × 3 の画像から𝐾個の キーポイント(膝や腕など)の位置を検出するタスク • 最新の手法では、 𝑊′ × 𝐻′, {𝐻1, 𝐻2, … , 𝐻𝑘} の𝐾個の ヒートマップを推定し、位置を求める 画像は別論文[1]から参照 [1] Wei, Shih-En, et al. "Convolutional pose machines." Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. 2016. 入力画像: 𝑊 × 𝐻 × 3 キーポイント1の ヒートマップ キーポイント2の ヒートマップ キーポイントK − 1の ヒートマップ キーポイントKの ヒートマップ
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 7 Parallel multi-resolution subnetworks • 高解像度のサブネットワークを最初のネットワークとし、 一つずつ低解像度のサブネットワークを並列に接続 4つの並列サブネットワークの構造例 𝒩 𝑠𝑟: サブネットワーク 𝑠 : ステージ数 𝑟: 解像度インデックス (解像度は第1サブネットワークの 1 2𝑟−1)
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 8 Exchange Units • マルチスケールのサブネットワークを融合 • 他の並列サブネットワークから情報を繰り返し受け 取ることが可能 𝐶𝑠𝑟 𝑏 : 畳み込みユニット, 𝜀𝑠 𝑏 : exchange unit 𝑏 : ブロック数 𝑠 : ステージ数 𝑟 : 解像度インデックス 第3ステージ、3ブロックの並列畳み込みユニットとexchange unit
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 9 Exchange Units • マルチスケールのサブネットワークを融合 • 他の並列サブネットワークから情報を繰り返し受け 取ることが可能 アップサンプリングとダウンサンプリングの戦略 : nearest neighbor up-sampling (最近傍アップサンプリング) + 1 × 1 の畳み込み処理 : 3 × 3 のストライド付き畳み込み処理
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 10 ヒートマップの推定 • 最終の高解像度の表現からヒートマップを回帰 • 損失関数は予測ヒートマップとGround truthのヒート マップの平均二乗誤差 • Ground truthは各キーポイントの位置を中心に標準偏差 1ピクセルの2次元ガウス関数を使用し生成 推論結果のヒートマップ画像 Ground truthはキーポイント の座標(𝑥 × 𝑦)のみ 生成 Ground truthの ヒートマップ画像 -比較- 損失関数
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 11 ネットワークのインスタンス化 • ネットワークはResNetのデザインルールを使用 • 4つの並列サブネットワークを持つ4つのステージ から構成 • 実験では、大小のネットワークを使用 – HRNet-W32 (最後の3段階のチャンネル幅: 64, 128, 256) – HRNet-W48 (最後の3段階のチャンネル幅: 96, 192, 386)
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 12 実験1: COCO Keypoint Detection • データセット – COCO Keypoint Detection • 200,000以上の17のキーポイントが ラベル付けされた画像 • https://cocodataset.org/#home • 評価指標 – Object Keypoint Similarity (OKS) 𝑂𝐾𝑆 = σ𝑖 𝑒𝑥𝑝 Τ −𝑑𝑖 2 2𝑠2𝑘𝑖 2 𝛿 𝑣𝑖 > 0 σ𝑖 𝛿 𝑣𝑖 > 0 𝑑𝑖 : 推定座標とGround truthの座標のユークリッド距離 𝑠 : 人物領域の面積 𝑘𝑖 : 減衰を制御するキーポイントごとの定数 (eyes < nose < … < ankles < Hips) 𝑣𝑖 : Ground truthの可視性フラグ (部位が画像に存在するかどうか)
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 13 実験1: 結果 • モデルサイズ(Params)と計算量(GFLOPs)を抑えつつ、 高い精度を実現
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 14 実験1: 結果 • モデルサイズ(Params)と計算量(GFLOPs)を抑えつつ、 高い精度を実現 10個のOKS閾値に 対する平均適合率 OKS=0.5の 平均適合率 OKS=0.75の 平均適合率 中サイズの 人に対する 平均適合率 大サイズの人 に対する 平均適合率 10個のOKS閾 値に対する 平均再現率
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 15 実験2: MPII Human Pose Estimation • データセット – MPII Human Pose dataset • 25,000枚のキーポイントラベル付きの画像 • http://human-pose.mpi-inf.mpg.de/ • 評価指標 – PCKh • 頭部のサイズを1として、キーポイントがground truthの何%の範囲内 に入ってるか • 一般的にはPCKh@0.5を使用
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 16 実験2: 結果 • 他のモデルよりも優れた精度 人体の構成を学習する コンポジションモデルを 採用しているため高精度
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 17 Ablation Study • マルチスケールの融合の効果を検証 • 入力サイズによる精度の違い 入力サイズが小さい方が 顕著に差があり → 処理全体で高解像度を 維持しているため マルチスケールの融合は 精度向上に貢献し、回数 が増えるほど高精度
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 18 まとめ • Top-downアプローチの姿勢推定モデル • 高解像度の表現を維持する機構を持つHRNetを使用 • 低解像度のサブネットワークを追加し、複数の解像度の サブネットワークを並列に接続 • ポーズ追跡においても高い性能を確認 モデル構造 姿勢の推定結果
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 19 現在(2021年9月)への影響 • 物体検出など別分野でも使用可能 – Deep High-Resolution Representation Learning for Visual Recognition[1] • 拡張したネットワークの提案 – HigherHRNet[2] (CVPR 2020) – HRNet-DEKR[3] (CVPR 2021) – Lite HRNet[4] (CVPR 2021) [1] Sun, Ke, et al. "Deep high-resolution representation learning for human pose estimation." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019. [2] Cheng, Bowen, et al. "Higherhrnet: Scale-aware representation learning for bottom-up human pose estimation." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020. [3] Geng, Zigang, et al. "Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021. [4] Yu, Changqian, et al. "Lite-hrnet: A lightweight high-resolution network." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.