8. Co-attending Free-form Regions and Detections with
Multi-modal Multiplicative Feature Embedding for Visual
Question Answering [Lu+ AAAI2017]
物体検出により得られる物体領域候補は質問文に回答するのに有益だとい
う仮説から、Free-form(通常のAttention)とDetection based(物体領域候補
を選ぶ)の2種類の方法でAttentionを行う。 8
9. Co-attending Free-form Regions and Detections with
Multi-modal Multiplicative Feature Embedding for Visual
Question Answering [Lu+ AAAI2017]
物体領域候補を用いることで、画像全領域から探すよりも簡単に回答
に必要な画像領域が得られるので精度が上がる。 9