Environment
项目说明
是对一篇行人检测博客的实现How to Automate Surveillance Easily with Deep Learning
基于谷歌目标检测API :Google's TensorFlow Object Detection API
使用ssd_mobilenet_v1_coco作为预训练模型
数据集:Town Centre Dataset
训练使用显卡RTX 2080 Ti,GPU加速训练 ,训练步数:50000
文件说明
object_detection、slim、utils.py:谷歌目标检测API及其依赖文件
extract_GT.py:将数据的标注由csv格式转为xml格式
extract_towncentre.py:从视频中提取训练和测试数据,其中前3600帧为训练集,后900帧为测试集
creat_tf_record.py:将提取的图片和标注转换为tf_record格式
pedestrian_detection:训练完成后,导出的模型
test_data:900张测试图片及其标签,以及原始视频的后2500帧,用于实时检测应用
test_image.jpg:用于计算单张图片的测试时间的图片
image_object_detection.py:检测单张图片,并输出检测时间
real_time_detection.py:用于实时检测,视频流可以选择摄像头或者本地视频文件
如何使用
python real_time_detection.py
--stream 0 #0为摄像头检测,1为本地视频
--video_dir test_data/test.avi #本地视频的路径
--output_dir output #输出检测结果视频的路径,不指定则不输出
参考
Pedestrian-Detection(基于annotations实现)
MobileNet-SSDLite-RealSense-TF
Object-Detection-MobileNet
Quick Start: Distributed Training on the Oxford-IIIT Pets Dataset on Google Cloud