【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matchingharmonylab
公開URL:https://arxiv.org/pdf/2404.19174
出典:Guilherme Potje, Felipe Cadar, Andre Araujo, Renato Martins, Erickson R. ascimento: XFeat: Accelerated Features for Lightweight Image Matching, Proceedings of the 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2023)
概要:リソース効率に優れた特徴点マッチングのための軽量なアーキテクチャ「XFeat(Accelerated Features)」を提案します。手法は、局所的な特徴点の検出、抽出、マッチングのための畳み込みニューラルネットワークの基本的な設計を再検討します。特に、リソースが限られたデバイス向けに迅速かつ堅牢なアルゴリズムが必要とされるため、解像度を可能な限り高く保ちながら、ネットワークのチャネル数を制限します。さらに、スパース下でのマッチングを選択できる設計となっており、ナビゲーションやARなどのアプリケーションに適しています。XFeatは、高速かつ同等以上の精度を実現し、一般的なラップトップのCPU上でリアルタイムで動作します。
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
This study focuses on addressing the challenges associated with decision-making in winter road snow removal operations, aiming to alleviate the burden on snow removal personnel. Specifically, we propose an approach to develop a system that collects and visualizes information on road snow conditions and weather data to support decision-making by personnel. Additionally, by sharing the collected information, we aim to facilitate the sharing of premonitions about changes in decision-making among snow removal personnel, reducing the need for physical inspections.We have validated the effectiveness of the system and confirmed its efficacy.
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
公開URL:https://openaccess.thecvf.com/content/CVPR2023/html/Vasu_MobileOne_An_Improved_One_Millisecond_Mobile_Backbone_CVPR_2023_paper.html
出典:Vasu, Pavan Kumar Anasosalu, et al.: MobileOne: An Improved One Millisecond Mobile Backbone, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (2023)
概要:モバイル端末向けのニューラルネットワークは多くの場合、FLOPsやパラメータ数で最適化されています。しかし、これらの最適化は実際のモバイルデバイスで実行した場合のネットワークの応答時間に相関しない場合があります。我々は昨今のニューラルネットワークの最適化のボトルネックを特定・分析し、その結果をもとにした新たな効率的なバックボーンMobileOneを設計しました。結果はMobileFormerと同等の性能を得ながら、38倍高速であり、最先端の効率性を達成しました。
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
公開URL:https://arxiv.org/pdf/2307.09288.pdf
出典:Touvron Hugo, et al.: Llama 2: Open foundation and fine-tuned chat models, arXiv preprint arXiv:2307.09288 (2023)
概要:70億から700億のパラメータを持つ大規模言語モデル(LLM)の事前学習であるLlama 2を開発し、リリースしました。Llama 2-Chatと呼ばれるファインチューニングされたLLMは、対話のユースケースに最適化されています。提案モデルは、検証したほとんどのベンチマークにおいて、オープンソースのチャットモデルを凌駕しており、有用性と安全性に関する人間による評価に基づいて、クローズドソースのモデルの適切な代替となる可能性があります。コミュニティが我々の研究を基に、LLMの責任ある開発に貢献できるようにすることも目的にあります。
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
公開URL:https://arxiv.org/abs/2210.03629
出典:Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao : ReAct: Synergizing Reasoning and Acting in Language Models, arXiv: 2210.03629 (2022)
概要:本論文では大規模言語モデルにおいて推論(Reasoning)と行動(Acting)を組合わせるprompt手法であるReActを提案した。知識集約型の推論タスク(QAタスク・事実検証タスク)と意思決定タスク(テキストゲーム、ウェブナビゲーション)でReActの性能を評価した。推論タスクにおいてReActはWikipedia APIとの対話によりChain of ThoughtのHallucinationを軽減し、意思決定タスクにおいては模倣学習や強化学習による手法を上回る性能を示した。
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
Kerosene is a very important source for heating in many areas. In cold regions of Japan, delivery companies regularly visit household oil tanks to replenish them so that they do not run out of fuel. However, it is hard to make a good delivery plan, since the delivery companies do not know how much kerosene is left in the kerosene tank. And most of the existing methods about energy consumption estimation are focused on one target. Little work has been done in kerosene consumption with many users. We present Deep learning based model to estimate the consumption and mean consumption of one time span. The model includes time series augmentation to extract more information from the time span and attention mechanism to extract inner connection between each time step. The experimental results indicate that our proposed approaches have MAE around 50L for refuel recordings and MAE around 4L for daily consumption. In order to evaluate our model in a realistic way, the estimation result is applied to an inventory routing algorithm. The result using our estimation is close to the result using real consumption data.
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matchingharmonylab
公開URL:https://arxiv.org/pdf/2404.19174
出典:Guilherme Potje, Felipe Cadar, Andre Araujo, Renato Martins, Erickson R. ascimento: XFeat: Accelerated Features for Lightweight Image Matching, Proceedings of the 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2023)
概要:リソース効率に優れた特徴点マッチングのための軽量なアーキテクチャ「XFeat(Accelerated Features)」を提案します。手法は、局所的な特徴点の検出、抽出、マッチングのための畳み込みニューラルネットワークの基本的な設計を再検討します。特に、リソースが限られたデバイス向けに迅速かつ堅牢なアルゴリズムが必要とされるため、解像度を可能な限り高く保ちながら、ネットワークのチャネル数を制限します。さらに、スパース下でのマッチングを選択できる設計となっており、ナビゲーションやARなどのアプリケーションに適しています。XFeatは、高速かつ同等以上の精度を実現し、一般的なラップトップのCPU上でリアルタイムで動作します。
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
This study focuses on addressing the challenges associated with decision-making in winter road snow removal operations, aiming to alleviate the burden on snow removal personnel. Specifically, we propose an approach to develop a system that collects and visualizes information on road snow conditions and weather data to support decision-making by personnel. Additionally, by sharing the collected information, we aim to facilitate the sharing of premonitions about changes in decision-making among snow removal personnel, reducing the need for physical inspections.We have validated the effectiveness of the system and confirmed its efficacy.
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
公開URL:https://openaccess.thecvf.com/content/CVPR2023/html/Vasu_MobileOne_An_Improved_One_Millisecond_Mobile_Backbone_CVPR_2023_paper.html
出典:Vasu, Pavan Kumar Anasosalu, et al.: MobileOne: An Improved One Millisecond Mobile Backbone, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (2023)
概要:モバイル端末向けのニューラルネットワークは多くの場合、FLOPsやパラメータ数で最適化されています。しかし、これらの最適化は実際のモバイルデバイスで実行した場合のネットワークの応答時間に相関しない場合があります。我々は昨今のニューラルネットワークの最適化のボトルネックを特定・分析し、その結果をもとにした新たな効率的なバックボーンMobileOneを設計しました。結果はMobileFormerと同等の性能を得ながら、38倍高速であり、最先端の効率性を達成しました。
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
公開URL:https://arxiv.org/pdf/2307.09288.pdf
出典:Touvron Hugo, et al.: Llama 2: Open foundation and fine-tuned chat models, arXiv preprint arXiv:2307.09288 (2023)
概要:70億から700億のパラメータを持つ大規模言語モデル(LLM)の事前学習であるLlama 2を開発し、リリースしました。Llama 2-Chatと呼ばれるファインチューニングされたLLMは、対話のユースケースに最適化されています。提案モデルは、検証したほとんどのベンチマークにおいて、オープンソースのチャットモデルを凌駕しており、有用性と安全性に関する人間による評価に基づいて、クローズドソースのモデルの適切な代替となる可能性があります。コミュニティが我々の研究を基に、LLMの責任ある開発に貢献できるようにすることも目的にあります。
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
公開URL:https://arxiv.org/abs/2210.03629
出典:Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao : ReAct: Synergizing Reasoning and Acting in Language Models, arXiv: 2210.03629 (2022)
概要:本論文では大規模言語モデルにおいて推論(Reasoning)と行動(Acting)を組合わせるprompt手法であるReActを提案した。知識集約型の推論タスク(QAタスク・事実検証タスク)と意思決定タスク(テキストゲーム、ウェブナビゲーション)でReActの性能を評価した。推論タスクにおいてReActはWikipedia APIとの対話によりChain of ThoughtのHallucinationを軽減し、意思決定タスクにおいては模倣学習や強化学習による手法を上回る性能を示した。
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
Kerosene is a very important source for heating in many areas. In cold regions of Japan, delivery companies regularly visit household oil tanks to replenish them so that they do not run out of fuel. However, it is hard to make a good delivery plan, since the delivery companies do not know how much kerosene is left in the kerosene tank. And most of the existing methods about energy consumption estimation are focused on one target. Little work has been done in kerosene consumption with many users. We present Deep learning based model to estimate the consumption and mean consumption of one time span. The model includes time series augmentation to extract more information from the time span and attention mechanism to extract inner connection between each time step. The experimental results indicate that our proposed approaches have MAE around 50L for refuel recordings and MAE around 4L for daily consumption. In order to evaluate our model in a realistic way, the estimation result is applied to an inventory routing algorithm. The result using our estimation is close to the result using real consumption data.
4. ヘリコプタのモデリング
メインロータの推力 :
テイルロータの推力 :
機体にかかる空気抵抗 :
機体にかかる重力 :
mr T
tr T
fus F
mg
メインロータのトルク :
テイルロータのトルク : tr
mr
Q
Q
発生するモーメント
Tmr
Ttr
mg
Qmr
Qtr Ffus
X
Y
Z
Roll,p
Yaw,r
Pitch,w
ヘリコプタをモデル化し,運動方程式によりヘリコプタの動きを算出
フラッピング運動を近似し,制御指令値からブレードの傾きを算出
発生する力
[加藤,1985]
5. 制御器
t
e t
m t K e t K e t K x
x Px x Ix x Dx
( )
( ) ( ) ( )
PIDコントローラ(X軸)
3つの制御器を直列構造に接続し,サーボモータへの制御指令値を算出
m(t) :目標値
e(t) :
t :
: P K 比例ゲイン 積分ゲイン
サンプリング時間[sec]
: D : K I K
t[sec] における現在値と目標値との偏差[m/sec]
微分ゲイン
PID制御により目標値を算出
Position
Controller
Velocity
Controller
Attitude
Controller
Helicopter
Dynamics
Velocity
Attitude
Input Signal
Attitude Reference
Velocity Reference
Position Reference
[野波,2004]
Position
6. 制御器
3つの制御器を直列構造に接続し,サーボモータへの制御指令値を算出
Position
Controller
Velocity
Controller
Attitude Controller
Position
Velocity
Attitude
Input Signal
Attitude Reference
Velocity Reference
Position Reference
PIDパラメータの選択
PIDパラメータの修正
データベース
速度制御器に適用 3軸:Kp
PIDパラメータ生成
レコードと類似度を算出
類似度に応じた重み付き平均を算出
制御誤差を利用
Helicopter Dynamics
[野波,2004]
[Takao,2004]
Memory-Based PID 制御
8. シミュレーション設定
範囲 5000m四方
消失点 範囲内ランダム
推定流路方向 標高から推定
探索範囲 半径1000m・角60度の扇形
遭難者位置 標高による確率分布
遭難者数 1人
制約条件:子機がアドホックネットワークを維持
評価関数: ( , ) ( ) ( )
,
,
P x y r t t penalty i
N
i
SX SY
x y
init penalty(i) :通信範囲より出たペナルティ
制約条件:子機はバラバラに飛行し,発見後,親機まで飛行
評価関数:
N
i
SX SY
x y
init back P x y r t t t
,
,
( , ) ( ) init t
back :遭難現場までの飛行時間 t
:親機までの飛行時間
親機数 1機体
子機数 N(1-9)機体
ビーコン通信範囲 20m
グリッド間隔 12.5m
機体間通信範囲 200m
探索時間 120min
子機体数を1-9機体に変更し,評価関数の推移を調査
実験Ⅰ
実験Ⅱ
9. 10機体の探索結果一例
シミュレーション結果
10機体の探索結果一例
棒グラフ:
線グラフ(青):
線グラフ(赤):
P(x, y)
P(x, y)r(t t) init
( , ) ( ) init back P x y r t t t
機体数
P(x, y)r(t)
機体数
実験Ⅰ P(x, y)r(t)
実験Ⅱ
探索時間の短縮という観点では,実験Ⅰの探索手法が優位
11. 実機実験
シミュレータ上で構築した制御器を実機へ導入
振動ノイズやセンサ誤差を含んだ観測値からKalman Filterを用いて状態推定
観測値yn:3軸加速度・角速度
状態xn:3軸速度・角速度・姿勢
入力un:制御指令値4ch
n n n n n x F x B u 1
n n n n y H x w
高さ及び,yaw角はマニュアル操作
内界センサを用いて,速度制御器と姿勢制御器を実装
シミュレータやマニュアル操作時の入力に基づき,
PIDパラメータを決定
目的
速度制御器 姿勢制御器
Kp Kp Ki Kd
0.7 0.4 0.01 0.03
角速度 deg/s
青:観測値
赤:Kalman
Filter
PIDパラメータ
動作が不安定な要因は積分誤差による為だと考えられ,
外界センサによる位置制御や補正により改善されると考えられる.