tombone是Tomasz Malisiewicz 的博客名字,他曾在CMU获得了机器人学的博士学位,目前在MIT做博士后,主要研究方向是图像和视频中的目标识别。
由于他的研究方向的关系,他推荐的几篇论文也都和这个方向相关。
这篇论文用到了Abhinav Gupta 的3D场景理解,以及Ali Farhadi 的视觉短语(visual phrases)的思想。不同的是,这篇文章用到了RGB-D的数据。这也是今年CVPR文章中的一个热点。
这篇文章是利用MTurk的标记结果,来学习鸟类身上的哪一个部位对于细致分类(fine-grained categorization)更加有用。对于研究精细分类或者经常利用MTurk的人来说,这篇文章值得一读。
这篇文章获得了最佳论文(CVPR 2013 Best Paper)的奖项,来自 Google Research!
这是一个基于图的定位,利用了一种 “Visual Memex”的技术。Visual Memex是一个非参数化的图模型,建模了一些视觉概念以及它们的相互关系。这个方法和传统目标识别方法的最大区别是没有显示的目标类别的概念。
关于Visual Memex可以参考文章:Tomasz Malisiewicz, Alexei A. Efros. Beyond Categories: The Visual Memex Model for Reasoning About Object Relationships. In NIPS, December 2009. PDF
这篇文章提供了一个全新的方法来定位图像中的轮廓,这种方法的速度要比gPb快得多。而且有公开代码,应该以后会有广泛影响力。
联系客服