Hypercolumn（实例分割）

资源分类

Hypercolumn（实例分割）

2019-10-15 |

233 |

原标题：https://www.leiphone.com/news/201910/lmQrxjj65N4ZWT0n.html

来源：AI研习社链接：https://www.yanxishe.com/TextTranslation/1590

我们将在这篇文章中讨论超列（Hypercolumn）。“超列”这个词是从神经系统科学当中借鉴来的，用来描述一组对于多角度的边缘以及以柱状结构排列的多种频率敏感的V1神经元。论文通过借鉴超列的思想，提高了预测准确率，并在2015年的CVPR上发表，被引用次数超过800。这篇论文发表之时，它的第一作者Dr. Bharath Hariharan正在加利福尼亚大学伯克利分校攻读博士学位。后来当实例分割的概念在2017年的TPAMI上出现的时候，Dr. Hariharan已经成为Facebook的AI研究部（FAIR）的博士后研究员。之后，另一篇著名的论文特征金字塔网络（FPN）在2017年的CVPR上发表。目前他已经成为了康奈尔大学的助理研究员，专注于三维空间的计算机视觉研究

大纲

1. 超列的概念

2. 使用超列进行像素分类

3. 高效地实现超列

4. 快速实现超列

5. 结论

超列的概念

1.1超列的表示

卷积神经网络（CNN）通常使用最后一层的输出作为特征表示。然而，最后一层的输出在空间上太过粗糙，以至于不能够精确定位。
如上图所示，在一个像素上的超列是那个像素的网络所有节点的激活值的串联成的向量。
通过这种方式，空间上的定位信息可以从靠前的网络层中获得，并且会有更好的预测准确率。

1.2超列问题的提出

首先，假设我们能够通过物体检测系统使用非最大抑制的方法对物体进行检测。
其次，检测出的物体边界框被稍微扩大并且在这个扩大的边界框中预测出一个热图。
对于分割，热图揭示了某一特定位置在特定区域内的概率。检测后物体被分割，我们称这种方法就是题目中说的实例分割方法。
而且对于部分标记以及关键点预测同样管用，每个部分或关键点可以预测出不同的热图，每个热图都表示了一个位置属于那个部分或关键点的概率。
每次都能预测出50x50的热图，然后被调整到适应扩大了的边界框的大小并被画在图片上。

2.使用超列进行像素分类

某一位置上的超列是一个长向量，连接了网络中部分或者全部的特征映射图的特征。
举例来说，使用AlexNet网络架构中的池化层2（256通道），卷积层4（384通道），以及全连接层7（384通道），将会产生4736维的向量。
位置很重要，例如：对于一个检测到的人，头部应该在检测框的顶部。因此，对每个50X50大小的位置训练不同的分类器的最简单的方法，就是在每个位置上使用1x1的卷积层或者全连接层。
但是，仍然存在三个问题：1.每个点能够获取的数据十分有限，容易导致过拟合的发生。2.训练如此多的分类器的计算代价是昂贵的。3.相邻的像素是十分相似的。

3.高效的超列