コンピュータビジョン最前線 Spring 2022
第2号では、まず、最新動向サーベイ「イマドキノ動画認識」にて、畳み込みニューラルネットワーク(CNN)の動画認識への適用、Transformerをベースにした認識モデルについて紹介。論文フカヨミ記事3本では、単一の画像を入力とする単眼超解像(single image SR; SISR)、ディープニューラルネットワーク(DNN)における課題となっている敵対的サンプル、画像を扱うためのTransformerであるVision Transformer(ViT)のそれぞれについて、基礎から分野のトレンドまで、重要論文を紐解きながら詳しく解説。最後にチュートリアル記事「ニュウモンVisual SLAM」にて、以前にも増して注目を集めているVisual SLAMについて(本記事では単眼カメラのVisual SLAMを取り上げる)、発展の歴史と基礎を丁寧に解説する。
イマドキノ動画認識―実世界の“動き”を捉える最先端手法―(原 健翔)
フカヨミ超解像―分野の最前線にズームイン!!―(内田 奏)
フカヨミ敵対的サンプル―AI分野における果てなき攻防の最前線―(福原吉博)
フカヨミ画像生成―話題のTransformerはどう使われるのか!?―(秋本直郁)
ニュウモンVisual SLAM―CV界の総合格闘技に挑戦!―(櫻田 健)
こんぴゅ~た☆びじょん君(@kanejaki)
CVイベントカレンダー