Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Weakly Supervised Affordance Detection #18

Open
yiskw713 opened this issue Oct 30, 2018 · 0 comments
Open

Weakly Supervised Affordance Detection #18

yiskw713 opened this issue Oct 30, 2018 · 0 comments

Comments

@yiskw713
Copy link
Owner

yiskw713 commented Oct 30, 2018

INFO

author

Johann Sawatzky, Abhilash Srikantha, Juergen Gall

conference

CVPR2017

link

pdf

概要

ピクセルごとにラベルを与えるのではなく,キーポイントのアノテーションのみで物体の affordance の検出を学習する手法を提案.

提案手法

2018-10-30 10 19 41

データセットは,CAD120 dataset の各動画の10フレーム目をアノテーションしたものを使用.

githubで公開されている.


セグメンテーションのモデルとして,DeepLabを採用している.従来のaffordanceの手法で前提としている,一つのピクセルには一つのクラスという設定とは異なり,マルチラベルを前提としている.この場合,loss としてクロスエントロピーは使えないので,代わりにシグモイド関数を元にしたものを使用(下記)
2018-10-30 10 18 03
2018-10-30 10 18 12
yi,lは,ピクセルxiに l というラベルが付与されていることをあらわす.


weakly supervision の問題設定においては,ラベル情報Yの代わりにキーポイント情報Z を用いて,ラベルYを推定するのが目的である.事前学習されたVGGもしくは,ResNet を用いるが,はじめにキーポイントZからY^を初期化する.初期化は以下の方法で行う.
2018-10-30 11 42 23
zlというラベルが付与されているxl(キーポイント)と,ある点xiのL1距離がある閾値より小さい場合,その点にラベルを付与するというものである.


こうして得られたY^に対して,尤度を最大化させるようにCNNを学習させる.
2018-10-30 11 42 38


学習後,再度 P(Y|I, θ) を計算し直す.
2018-10-30 11 43 18
キーポイントの情報からラベル l があるかどうかわかるので,
2018-10-30 11 43 30
よって最終的なY^は,
2018-10-30 11 43 41

この最終的なCNNの推定に対して,さらにGrabcut を用いる事で,アフォーダンス推定のs精度を上げた.下図参照.

2018-10-30 10 19 09

検証

UMD part affordance dataset と,CAD120 dataset に対して,SOTAな weakly-supervised segmentation の手法と,提案手法を比較.weakly supervised な手法のなかでSOTAを達成.

新規性

  • affordance detection に weakly supervised な手法を応用した点
  • affordance をマルチラベル問題として取り組んだ点(?)

議論,展望

コメント

date

Oct.29, 2018

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant