tombone推荐的几篇CVPR2013论文

tombone是Tomasz Malisiewicz 的博客名字，他曾在CMU获得了机器人学的博士学位，目前在MIT做博士后，主要研究方向是图像和视频中的目标识别。

由于他的研究方向的关系，他推荐的几篇论文也都和这个方向相关。

这篇论文用到了Abhinav Gupta 的3D场景理解，以及Ali Farhadi 的视觉短语（visual phrases）的思想。不同的是，这篇文章用到了RGB-D的数据。这也是今年CVPR文章中的一个热点。

W. Choi, Y. -W. Chao, C. Pantofaru, S. Savarese. "Understanding Indoor Scenes Using 3D Geometric Phrases" in CVPR, 2013. [pdf]

这篇文章是利用MTurk的标记结果，来学习鸟类身上的哪一个部位对于细致分类（fine-grained categorization）更加有用。对于研究精细分类或者经常利用MTurk的人来说，这篇文章值得一读。

Fine-Grained Crowdsourcing for Fine-Grained Recognition. Jia Deng, Jonathan Krause, Li Fei-Fei. CVPR, 2013. [ pdf ]

这篇文章获得了最佳论文(CVPR 2013 Best Paper)的奖项，来自 Google Research!

Fast, Accurate Detection of 100,000 Object Classes on a Single Machine. Thomas Dean, Mark Ruzon, Mark Segal, Jon Shlens, Sudheendra Vijayanarasimhan, Jay Yagnik. CVPR, 2013 [pdf]

下面这篇Scene-SIRF的文章是tombone本人最推崇的一篇。利用Jon Barron（这篇文章的一作）的算法来将输入图像分解为一些本征图像的方式，最早用于目标上，而这篇文章将其应用到了自然场景上。

Intrinsic Scene Properties from a Single RGB-D Image. Jonathan T. Barron, Jitendra Malik. CVPR, 2013 [pdf]

这是一个基于图的定位，利用了一种 “Visual Memex”的技术。Visual Memex是一个非参数化的图模型，建模了一些视觉概念以及它们的相互关系。这个方法和传统目标识别方法的最大区别是没有显示的目标类别的概念。

关于Visual Memex可以参考文章：Tomasz Malisiewicz, Alexei A. Efros. Beyond Categories: The Visual Memex Model for Reasoning About Object Relationships. In NIPS, December 2009. PDF

Graph-Based Discriminative Learning for Location Recognition. Song Cao, Noah Snavely. CVPR, 2013. [pdf]

这篇文章提供了一个全新的方法来定位图像中的轮廓，这种方法的速度要比gPb快得多。而且有公开代码，应该以后会有广泛影响力。

Sketch Tokens: A Learned Mid-level Representation for Contour and Object Detection. Joseph J. Lim, C. Lawrence Zitnick, and Piotr Dollar. CVPR 2013. [ pdf ] [https://github.com/joelimlimit/SketchTokens]

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。