目标检测论文解读3——Fast R-CNN

目标检测论文解读3——Fast R-CNN

2019-11-26 |

|

84 |

0

原标题：目标检测论文解读3——Fast R-CNN

原文来自：博客园原文链接：https://www.cnblogs.com/xin1998/p/11374221.html

背景

　　deep ConvNet兴起，VGG16应用在图像分类任务上表现良好，本文用VGG16来解决检测任务。SPP NET存在CNN层不能fine tuning的缺点，且之前的方法训练都是分为多个阶段，特征提取+SVM分类+边框回归，这些问题在Fast R-CNN上都得到了解决。

方法

　　网络模型采用VGG16结构,跟SPP NET相比有如下改进。

　　ROI pooling

　　将最后的max pooling层换成RoI pooling层，可以认为是SPP NET的特殊情况，只有一层金字塔，feature map被分为H*W个bin，作max pooling。

　　bbox regressor

　　网络末尾采用两个不同的全连接层，分别输出分类和位置结果，实现了end-to-end的训练过程。

　　CNNs参数更新

　　其实SPP NET也并不是不能更新CNNs的参数，只是这样开销太大，这是因为SPP NET先是将一堆图片的ROI求出来，打乱后随机取N张训练，这些ROI可能来自于很多不同的图片，这样如果要进行反向传播，必须保存这些图片训练中各层的feature map，开销巨大；Fast R-CNN采用了分层的思想，只在R=2张原图中取N个ROI，这样只用计算存储两张图片，开销大大降低。

总结

　　是在SPP NET的基础上做出的改进，让训练过程变成end-to-end，整个网络的参数都能更新。

缺点

　　ROI的提取采用的还是SS方法。　　

免责声明：本文来自互联网新闻客户端自媒体，不代表本网的观点和立场。

合作及投稿邮箱：E-mail:editor@tusaishared.com

上一篇：决策树ID3原理及R语言python代码实现（西瓜书）

下一篇：目标检测论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

用户评价

全部评价

热门资源

Python 爬虫（二）...

所谓爬虫就是模拟客户端发送网络请求，获取网络响...
TensorFlow从1到2...

原文第四篇中，我们介绍了官方的入门案例MNIST，功...
TensorFlow从1到2...

“回归”这个词，既是Regression算法的名称，也代表...
机器学习中的熵、...

熵 (entropy) 这一词最初来源于热力学。1948年，克...
TensorFlow2.0（10...

前面的博客中我们说过，在加载数据和预处理数据时...

智能在线

400-630-6780
聆听.建议反馈

E-mail: support@tusaishared.com