2020年06月に読んだ論文など
6月はあまり論文を読めませんでしたが、振り返りのためにまとめておきます。なぜあまり読めなかったかというと、調子の悪かったPS4を買い替えた記念に、ダークソウル2をダウンロードして遊んでいたためです(白目)。 一応全ボス倒したので、7月は切り替えて、CVPR2020の論文を中心に読んでいきたいですねえ。
今月のQiita記事
Qiitaに論文読解の記事を書いたものについては、ここにまとめておいておきます。
- 【論文読解】Single-view view synthesis with multiplane images - Qiita
- 【論文読解】First Order Motion Model for Image Animation - Qiita
- 【論文読解】Unsupervised Learning of Probably Symmetric Deformable 3D Objects From Images in the Wild - Qiita
- 【論文読解】RandAugment: Practical automated data augmentation with a reduced search space - Qiita
個人的には、前々から読まねばと思っていたRandAugmentの論文がようやく読めたので一番楽しかったかな。
その他論文
Sketch-BERT: Learning Sketch Bidirectional Encoder Representation from Transformers by Self-supervised Learning of Sketch Gestalt
CVPR2020採択論文です。
スケッチのためのBERT。あくまでもEncoderなので、スケッチの生成タスクなどは別途Decoderを構築する必要がある。分類や検索のためのPretarainedモデルを得ることができます。
ストロークの各ポイントは5次元の特徴量を持っていて、うち2次元は前のポイントからのオフセット、残りの3次元はストロークの始点・終点・それ以外を表すone-hotベクトルです。
事前学習のタスクは、15%マスクされたポイントの予測。2次元のオフセットにはL1損失、残り3つにはCELossが適用されます。マスクされた入力は、すべて0として入力されるようです。
Lin, Hangyu, et al. "Sketch-BERT: Learning Sketch Bidirectional Encoder Representation from Transformers by Self-supervised Learning of Sketch Gestalt." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020.
Topology-Preserving Deep Image Segmentation
NeurIPs2019採択論文です。
セグメンテーションの出力結果が、真の画像と同じトポロジカルな性質を満たしてほしいという要求をTopologicalLossというものとして組み込んだというものです。
percistence diagramを作成し、その各ドットと真のドットの対応付けをダイアグラム上の距離をコストとするコスト最小化問題として解きつつ、そのコストを損失として各ドットを対応する真のドットの位置に近づけるように更新していく、という手法です。ドットの座標はbirthとdeathになっており、これは具体的にはセグメンテーションの出力結果のあるピクセルの値(尤度)になっているので、その値を上げたり下げたりする、というわけです。
Hu, Xiaoling, et al. "Topology-preserving deep image segmentation." Advances in Neural Information Processing Systems. 2019.