シャント音を用いた血管狭窄検出の
精度向上に関する研究
発表日 令和3年2月3日
所属 人工知能第一研究室
発表者 19E3015 野田 史也
指導教員 古家 賢一 教授
会場 第二会場(Zoom)
目次
• 背景
• 目的
• 従来研究
• 提案手法
• 実験
• 結果
• まとめ
1
背景
2
動脈と静脈を吻合させたAVF(内シャント)
作成することで十分な血流を得る
静脈
動脈
吻合部
患者の高齢化、シャントの長期使用
シャントが抱える問題点
狭窄(血管が細くなる) 閉塞(血管が詰まる)が発生
- 再手術を行わければならない
末期腎臓病患者(ESRD : End Stage Renal Disease)
-血液から老廃物や過剰な水分を除去するため血液透析を行う
目的
3
• シャント音からシャントの状態をコンピュータで管理
• 日常的に聴診器でシャントを管理
• 診断には専門的な知識が必要
特徴抽出
システムのイメージ
シャント音
識別
正常
異常
識別器
従来研究
4
シャント音
切り出し
特徴量
抽出
学習
識別フェーズ
特徴量
抽出
SVM
RF
𝑅𝐼 < 0.6
or
𝑅𝐼 ≥ 0.6
識別
シャント音
切り出し
学習フェーズ
シャント音
(学習データ)
シャント音
(テストデータ)
サンプル移動
伸縮処理
サンプル移動
伸縮処理
ラベリング
血管抵抗指数
𝑅𝐼 < 0.6 𝑜𝑟 𝑅𝐼 ≥ 0.6
血管狭窄診断支援のためのシャント音解析を用いた識別法の研究
(東 大輔 修士論文 2019)
血管抵抗指数(resistance index)
-末梢への血流の流れにくさを反映する指標
Time(sec)
Amplitude
Amplitude
Time(sec)
Amplitude
Time(sec)
一脈拍に対応するシャント音の切り出し
5
① 絶対値の算出
② 平滑化間引き処理
③ ピーク値の検出
④ ピーク値間の最小値の検出
⑤ 一脈拍に対応する
シャント音の切り出し
特徴量算出方法①(データ調整)
6
伸縮処理
基準データ
比較データ
① 基準データから伸縮データを作成
② 比較データと同じデータ長のものを選択、正規化相互相関係数Rを算出
R
正規化相互相関係数
の算出
特徴量算出方法②(移動伸縮処理)
7
R4
R2
R1
R3
R5
基準データ
比較データ
① 基準データから伸縮、前後にサンプル移動させたデータを作成
② 作成したデータと比較データから正規化相互相関係数Rを算出
正規化相互相関係数
の算出
サンプル移動
伸縮処理
二次元特徴量
8
50(周波数領域)×10(時間領域)の二次元特徴量を作成
• 時間周波数解析(STFT)で得られた結果を二次元特徴量に
• スペクトルの振幅が平均以上のとき1、未満のとき0の二値化
• 伸縮処理とサンプル移動のデータ拡張も検討
評価指標
9
正解率 =
𝑇𝑃 + 𝑇𝑁
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
第二種の誤り率 =
𝐹𝑁
𝑇𝑃 + 𝐹𝑁
従来研究の実験条件
10
データ長 0.8秒、一脈拍に対応したデータ長
学習データ数
240個
240個×データ拡張分(二次元特徴量)
テストデータ数 60個
識別器 二次カーネルSVM、RBFカーネルSVM、RF
特徴量
MFCC、周波数パワーの割合
正規化相互相関係数、二次元特徴量
条件
①シャント音固定長切り出し
②シャント音一脈拍切り出し
③データ調整
④サンプル移動・伸縮処理
⑤二次元特徴量
評価指標 正解率、第二種の誤り率
従来研究の結果
11
正解率
(%)
固定長 一脈拍
データ
調整
移動・伸縮
処理
二次元
特徴量
アンサンブル
二次
カーネル
SVM
55.3% 59.7% 59% 66% 62.3% 64.7%
RBF
カーネル
SVM
63.3% 63.7% 62.3% 67.7% 69% 65.3%
RF 71.3% 68% 67% 71.3% 71.7% 76.7%
第二種の
誤り率
(RF)
45.3% 46.7% 49.3% 30.7% 22.7% 39.3%
課題 : 識別精度の向上
提案手法
1. 識別器を勾配ブースティング決定木に変更
→ ランダムフォレストよりも正解率が向上したため
従来研究のRFを勾配ブースティング決定木へ変更
2. シャント音を周波数解析して得られる4つの特徴量の
組み合わせを変更して学習
→ 同じ識別器でも特徴量によって正解率に変化あり
特徴量の組み合わせについて検討されていない
ハイパーパラメータの探索にベイズ最適化を利用
→ 考慮すべきハイパーパラメータの種類が多いため
12
システム構成図
13
シャント音
切り出し
特徴量
抽出
ベイズ
最適化
学習
識別フェーズ
特徴量
抽出
勾配
ブースティング
決定木
𝑅𝐼 < 0.6
or
𝑅𝐼 ≥ 0.6
識別
シャント音
切り出し
学習フェーズ
シャント音
(学習データ)
シャント音
(テストデータ)
サンプル移動
伸縮処理
サンプル移動
伸縮処理
ラベリング
血管抵抗指数
𝑅𝐼 < 0.6 𝑜𝑟 𝑅𝐼 ≥ 0.6
アンサンブル学習
14
バギングの例 ブースティングの例
バギング
データの一部を用いて各学習器を
構築し、多数決で予測
ブースティング
前の学習器で予測した結果を元に
学習データの重みを更新
正解率の高い学習器の重みを大きくし
重み付きの多数決で予測
GBDTのアルゴリズム
15
目的変数の平均を計算
(初期モデル)
各学習データの損失
関数の負の勾配を計算
損失関数の勾配を元に
決定木を構築
決定木の数だけ
繰り返したか?
• GBDTのアルゴリズム
構築した決定木の
予測結果を用いる
アンサンブル内の
すべての決定木を
使用して予測
Yes
No
Gradient (勾配)
Boosting (ブースティング)
Decision (決定)
Tree (木)
ベイズ最適化
• ベイズ最適化は代理モデルを用いてパラメータを探索する手法
※代理モデルとしてガウス過程やTPEが用いられる
例) 次の4点の正解率が求まっていたとする
• ベイズ最適化
- 正解率が高そうなエリアを優先的に観測
- 局所解に陥らないように他のエリアも観測
- これまでの評価値に基づいて次の観測点を自動的に判断
16
0
1
2
3
4
5
6
0 1 2 3 4 5 6
木
の
個
数
木の深さ
ランダムフォレストの正解率
0
1
2
3
4
5
6
0 1 2 3 4 5 6
木
の
個
数
木の深さ
ランダムフォレストの正解率
10回で最適解に到達
獲得関数を用いて判断
実験条件
17
サンプリング周波数 48kHz(聴診器付きマイクロホン)
データ長 0.8秒(固定長)、 一脈拍に対応したデータ長
ラベリング RI値(0.6未満の値、 0.6以上の値)
学習データ数 240個(60個×4)
テストデータ数 60個
特徴量
MFCC
周波数パワーの割合
正規化相互相関係数
二次元特徴量
識別器 GBDT
探索回数 3000回
目的: 提案手法による識別精度の確認
5次の交差検定を行い、正解率と第二種の誤り率で評価
提案手法1の結果
識別
手法
固定長 一脈拍
データ
調整
移動・伸縮
処理
二次元
特徴量
アンサンブル
正解率
RF 71.3% 68% 67% 71.3% 71.7% 76.7%
提案法1 75.3% 70.7% 71.7% 71.0% 73.0% 78.0%
第二種
の
誤り率
RF 45.3% 46.7% 49.3% 30.7% 22.7% 39.3%
提案法1 41.3% 36% 34.0% 37.3% 27.3% 34%
提案手法2の結果
19
特徴量 相関R Peaks MFCC 二次元
相関R,
Peaks
相関R,
MFCC
相関R,
二次元
Peaks,
MFCC
正解率 50.0% 64.0% 78.3% 73.0% 64.7% 73.3% 75.0% 78.3%
第二種の
誤り率
100.0% 28.7% 29.3% 27.3% 47.3% 45.3% 28.7% 28.0%
特徴量
Peaks,
二次元
MFCC,
二次元
相関R,
Peaks,
MFCC
相関R,
MFCC,
二次元
相関R,
Peaks,
二次元
Peaks,
MFCC,
二次元
全ての
特徴量
アンサンブル
学習
正解率 74.3% 73.7% 75.3% 74.0% 73.7% 73.7% 74.7% 79.7%
第二種の
誤り率
26.7% 28.0% 32.0% 28.0% 28.7% 30.7% 24.7% 28.0%
相関R:正規化相互相関係数
Peaks :周波数パワーの割合
結果
20
76.7%
78.0%
79.7%
75%
76%
77%
78%
79%
80%
正解率
従来研究… 提案手法1… 提案手法2…
従来研究
(RFアンサンブル)
提案手法1
(アンサンブル)
提案手法2
(アンサンブル)
第二種の誤り率 39.3% 34.0% 28.0%
有意差検定
• 従来法と提案法の結果に「統計的に有意な差」があるかを
調べる手法
• 今回はt検定を用いて従来法の正解率と提案法の正解率に
有意差な差があるかを調査
- P値が0.05より小さい場合、統計的に有意な差ありと判断
21
正解率 P値
RF(従来法) 76.7% 比較対象
提案法1 78% 0.5725
提案法2 79.7% 0.2793
統計的に有意な差はない
まとめ
・目的
シャント音からシャントの状態をコンピュータで管理
・課題
利用するには識別精度が不十分
・提案
手法1:GBDTを用いたシャント音の識別
手法2:特徴量の組み合わせを変更してGBDTで学習・識別
・結果
提案手法1、2の識別で従来手法と比較して正解率の向上と
第二種の誤り率の低下を確認
- 正解率に関しては統計的に有意な差はない
22

修士論文