Faster_RCNN for text detection
使用Faster_RCNN做文本检测
软件支持:
python2.7
tesnsorflow_gpu, cython, python-opencv, easydict, etc.
将ICDAR2011数据集简单制作成VOC2007格式, 放入Faster_RCNN
以下链接是处理好的ICDAR2011数据
链接: https://pan.baidu.com/s/15vVdxmLI7uI1IAMOqJrHKQ 密码: asqb
将VGG_imagenet.npy放到Faster-RCNN_TFdatapretrain_model文件夹下
链接: https://pan.baidu.com/s/1z4xSXJk7U81SpPusqr0trA 密码: xjph
VOC2007结构
JPEGImages文件夹 : 训练图片和测试图片
Annatations文件夹 : xml格式的标签文件
ImageSets文件夹 : Action暂时不用 Layout暂时不用
Main存放的是图像物体识别的数据,Main里面有test.txt , train.txt, val.txt,trainval.txt.
数据制作
构建Cython模块
cd $FRCN_ROOT/lib
make
测试模型
cd $FRCN_ROOTpython ./tools/demo.py --model model_path
训练模型
cd $FRCN_ROOT./experiments/scripts/faster_rcnn_end2end.sh DEVICE DEVICE_ID VGG16 pascal_voc