Invariant Information Clustering for Unsupervised Image Classification and Se...harmonylab
紹介論文
Invariant Information Clustering for Unsupervised Image Classification and Segmentation
Xu J, João F. Henriques, Andrea Vedaldi
出典:Xu J, João F. Henriques, Andrea Vedaldi:Invariant Information Clustering forUnsupervised Image Classification and Segmentation, International Conference on Computer Vision (ICCV 2019), Seoul, Korea
概要:本論文では、正解ラベルを必要としない教師なし学習手法IICを提案しています。元画像に一般的なランダム変換を加えたペアを作成し、元画像とペアの相互情報量を最大化するよう学習を行います。画像のクラス分類・セグメンテーションタスクにおいて、8つのベンチマークでSOTAを達成しています。さらに、半教師あり学習にすることで、従来の教師あり学習精度を超える結果を得ています
NeurIPS2021読み会 Fairness in Ranking under UncertaintyTatsuya Shirakawa
NeurIPS2021読み会の発表スライドです
論文: Fairness in Ranking under Uncertainty
ランキング対象の価値が完全に把握出来ない状況でのランキングにおけるFairnessを定義し、そこで定義されたFairnessを実現するランキングの構成方法を提案した論文です。
Invariant Information Clustering for Unsupervised Image Classification and Se...harmonylab
紹介論文
Invariant Information Clustering for Unsupervised Image Classification and Segmentation
Xu J, João F. Henriques, Andrea Vedaldi
出典:Xu J, João F. Henriques, Andrea Vedaldi:Invariant Information Clustering forUnsupervised Image Classification and Segmentation, International Conference on Computer Vision (ICCV 2019), Seoul, Korea
概要:本論文では、正解ラベルを必要としない教師なし学習手法IICを提案しています。元画像に一般的なランダム変換を加えたペアを作成し、元画像とペアの相互情報量を最大化するよう学習を行います。画像のクラス分類・セグメンテーションタスクにおいて、8つのベンチマークでSOTAを達成しています。さらに、半教師あり学習にすることで、従来の教師あり学習精度を超える結果を得ています
NeurIPS2021読み会 Fairness in Ranking under UncertaintyTatsuya Shirakawa
NeurIPS2021読み会の発表スライドです
論文: Fairness in Ranking under Uncertainty
ランキング対象の価値が完全に把握出来ない状況でのランキングにおけるFairnessを定義し、そこで定義されたFairnessを実現するランキングの構成方法を提案した論文です。
Google が 2018 年に発表した深層モデル BERT は、自然言語処理 (NLP) の多くのタスクでブレイクスルーを起こしました。性能面で進歩がある一方で、公平性に関するガイドラインが総務省から発表される等、産業界では解釈可能な AI を求める声が大きくなってきています。そこで本セッションでは、このギャップを埋めるために Microsoft Research が開発している、interpret-text と呼ばれる機械学習ライブラリをご紹介します。BERT を含む、様々な自然言語処理モデルを解釈するための 2 つの方法について解説し、簡単なデモをお見せします。
Deep Learning Digital Conference - connpass
https://dllab.connpass.com/event/178714/
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-Xcvpaper. challenge
「CVPR 2020 網羅的サーベイ」により作成された 3D From a Single Image and Shape-From-X エリアのメタサーベイ資料です。
CVPR 2020 網羅的サーベイ: http://xpaperchallenge.org/cv/survey/cvpr2020_summaries/listall/
cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2020の目標は「トップ会議に30+本投稿」することです。
http://xpaperchallenge.org/cv/
Future Standard では、IoTを活用した映像解析のサービス開発を行っており、その仕組みを支える技術についてお話をさせて頂きます。前半では、AWSでサーバー側の仕組みを構築した際に、どのような設計思想に基づいてアーキテクチャを構築したのかといったポイントを中心に説明します。後半は、NVIDIAのJetsonという組み込みコンピューターを使った、Faster R-CNN を使ったエッジでのリアルタイム物体認識の取り組みについてお話させて頂きます。
Google が 2018 年に発表した深層モデル BERT は、自然言語処理 (NLP) の多くのタスクでブレイクスルーを起こしました。性能面で進歩がある一方で、公平性に関するガイドラインが総務省から発表される等、産業界では解釈可能な AI を求める声が大きくなってきています。そこで本セッションでは、このギャップを埋めるために Microsoft Research が開発している、interpret-text と呼ばれる機械学習ライブラリをご紹介します。BERT を含む、様々な自然言語処理モデルを解釈するための 2 つの方法について解説し、簡単なデモをお見せします。
Deep Learning Digital Conference - connpass
https://dllab.connpass.com/event/178714/
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-Xcvpaper. challenge
「CVPR 2020 網羅的サーベイ」により作成された 3D From a Single Image and Shape-From-X エリアのメタサーベイ資料です。
CVPR 2020 網羅的サーベイ: http://xpaperchallenge.org/cv/survey/cvpr2020_summaries/listall/
cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2020の目標は「トップ会議に30+本投稿」することです。
http://xpaperchallenge.org/cv/
Future Standard では、IoTを活用した映像解析のサービス開発を行っており、その仕組みを支える技術についてお話をさせて頂きます。前半では、AWSでサーバー側の仕組みを構築した際に、どのような設計思想に基づいてアーキテクチャを構築したのかといったポイントを中心に説明します。後半は、NVIDIAのJetsonという組み込みコンピューターを使った、Faster R-CNN を使ったエッジでのリアルタイム物体認識の取り組みについてお話させて頂きます。
EfficientDet: Scalable and Efficient Object Detectionharmonylab
出典: Mingxing Tan,Ruoming Pang,Quoc V. Le:EfficientDet: Scalable and Efficient Object Detection,Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR2020)
公開URL:https://arxiv.org/pdf/1911.09070
概要:本論文では物体検出のためのニュラールネットワークアーキテクチャ設計の選択肢を体系的に調査し、効率を改善するいくつかの最適化を提案しています。まず簡単で高速にマルチスケール特徴を融合するBiFPN、次に物体検出器の複数のパラメータを同時に変更するcompound scalingを提案し、それらに基づいて物体検出器であるEfficientDetを開発しています。これによあり幅広いリソース制約において一貫して従来手法よりも優れた効率を達成しました。
2020/10/10に開催された第4回全日本コンピュータビジョン勉強会「人に関する認識・理解論文読み会」発表資料です。
以下の2本を読みました
Harmonious Attention Network for Person Re-identification. (CVPR2018)
Weekly Supervised Person Re-Identification (CVPR2019)
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦Rakuten Group, Inc.
In this talk, we introduced our innovative ways to collaborate with a variety of businesses, academia, clients and startups in order to create new social value.
We focus on data, discuss with business people, invent new ideas with clients and challenge social innovation with startups.
セル生産方式におけるロボットの活用には様々な問題があるが,その一つとして 3 体以上の物体の組み立てが挙げられる.一般に,複数物体を同時に組み立てる際は,対象の部品をそれぞれロボットアームまたは治具でそれぞれ独立に保持することで組み立てを遂行すると考えられる.ただし,この方法ではロボットアームや治具を部品数と同じ数だけ必要とし,部品数が多いほどコスト面や設置スペースの関係で無駄が多くなる.この課題に対して音𣷓らは組み立て対象物に働く接触力等の解析により,治具等で固定されていない対象物が組み立て作業中に運動しにくい状態となる条件を求めた.すなわち,環境中の非把持対象物のロバスト性を考慮して,組み立て作業条件を検討している.本研究ではこの方策に基づいて,複数物体の組み立て作業を単腕マニピュレータで実行することを目的とする.このとき,対象物のロバスト性を考慮することで,仮組状態の複数物体を同時に扱う手法を提案する.作業対象としてパイプジョイントの組み立てを挙げ,簡易な道具を用いることで単腕マニピュレータで複数物体を同時に把持できることを示す.さらに,作業成功率の向上のために RGB-D カメラを用いた物体の位置検出に基づくロボット制御及び動作計画を実装する.
This paper discusses assembly operations using a single manipulator and a parallel gripper to simultaneously
grasp multiple objects and hold the group of temporarily assembled objects. Multiple robots and jigs generally operate
assembly tasks by constraining the target objects mechanically or geometrically to prevent them from moving. It is
necessary to analyze the physical interaction between the objects for such constraints to achieve the tasks with a single
gripper. In this paper, we focus on assembling pipe joints as an example and discuss constraining the motion of the
objects. Our demonstration shows that a simple tool can facilitate holding multiple objects with a single gripper.
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matchingharmonylab
公開URL:https://arxiv.org/pdf/2404.19174
出典:Guilherme Potje, Felipe Cadar, Andre Araujo, Renato Martins, Erickson R. ascimento: XFeat: Accelerated Features for Lightweight Image Matching, Proceedings of the 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2023)
概要:リソース効率に優れた特徴点マッチングのための軽量なアーキテクチャ「XFeat(Accelerated Features)」を提案します。手法は、局所的な特徴点の検出、抽出、マッチングのための畳み込みニューラルネットワークの基本的な設計を再検討します。特に、リソースが限られたデバイス向けに迅速かつ堅牢なアルゴリズムが必要とされるため、解像度を可能な限り高く保ちながら、ネットワークのチャネル数を制限します。さらに、スパース下でのマッチングを選択できる設計となっており、ナビゲーションやARなどのアプリケーションに適しています。XFeatは、高速かつ同等以上の精度を実現し、一般的なラップトップのCPU上でリアルタイムで動作します。