spikeking / keras-yolo3-detection Goto Github PK

View Code? Open in Web Editor NEW

629.0 32.0 235.0 146 KB

YOLO v3 物体检测算法

Python 100.00%

keras-yolo3-detection's Introduction

YOLO v3 目标检测算法源码

欢迎关注，微信公众号 深度算法 （ID: DeepAlgorithm）

通过6篇文章，完整的呈现YOLO v3的源码细节。慢慢读完，掌握一些高级的深度学习开发技巧。

参考：

勘误：

第4篇真值，最后：“y_true的第0和1位是中心点xy，范围是(0~13/26/52)” -> “y_true的第0和1位是中心点xy，范围是(0~1)”；
第3篇网络，其中关于补充部分1*1卷积参数那个有误。不是13*13*1*1*18应该是1*1*1024*18； Thx@草绛ly
第6篇预测，max_boxes是在每层的feature_map中的每个类别分别最多产生20个框，而不是每张图片； Thx@略略略

keras-yolo3-detection's People

Contributors

Stargazers

Watchers

Forkers

alexliyang jan1995 syzlhh safari22 jellydream xiusdk liuxiao214 weiniuzhu wycjl zhukkang jeozhao chantcalf nethorse justaskumelis trantorrepository mygmyg zhzgithub 975150313 seebrand paipaipaidaxing 760146355 styjb wangchao12 langsunny kevinyzy1 xianweilv aurora11111 ycwu133 zhaomonica zhaolei-momo yijiuzai cszgzjy abeltianxiong xhqglorry11 juslikewind rayshark xinyuyun honggexiao wenbank richardwang96 wuxiangchao wayne980 csq20081052 cooper111 y495965825 ld909 spiolynn jijiangyan 2017tjm doraeman barbecacov mengpengfei alexanderbin123 xlsong19 alphonses strugglingyq yusirkuan heianzhuzai yubobo pivapi yi-hu-yueh erikfather codezonex cuiguohua professor98911 outsor 1093872843 graycrown chem2099 devopsmi huizhang2017 zhangming8 hulkmaker shadowkun lingguomeng dreamerdoremi nxsf8023 maweifei julina-lingli davis-love-ai luoolu mrlgb and9527 younkun liangzuan1983 goodtalen adia1223 ccf19881030 piseyyou wingniuqichao 2017e8020161116 lunar-r mlearing zhaorui56 goodvubo lu-k-brant yan0409 iynaur liuwenhaha styty

keras-yolo3-detection's Issues

wider_annotation key error

hi, when i convert the training file, i met some error as below:
Traceback (most recent call last):
File "wider_annotation.py", line 137, in
generate_train_file(train_bbx_file, train_data_folder, out_file)
File "wider_annotation.py", line 44, in generate_train_file
img_path = name_dict[name]
KeyError: '2_Demonstration_Political_Rally_2_620.jpg'

Could you help tell what happened? thank you very much.
@SpikeKing

有没有实例教程

关于该项目，说的有些简陋，我是新手有没有写具体的教程？

你好，能麻烦您一下吗？看代码的时候有一个地方不太理解

在yolo3_train.py文件中，_main()函数里，if False 和 if True这两个条件为何这么写？第一个不是会执行不到吗？我是个新手，所以不是很理解，希望您方便的话解答一下，万分感谢！

good job!

写的很好 ,相信不久就会用到!

请问作者，loss中对x,y使用的交叉熵是否应为squared loss？

yolo v3 于2.1. Bounding Box Prediction中对xy和wh使用的loss进行了说明：

During training we use sum of squared error loss.

但在作者的实现中，对wh使用的确实是squared loss，但xy实现使用交叉熵，代码如下：

xy_loss = object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[..., 0:2],
                                                               from_logits=True)

所以请教作者为何这样实现？
谢谢

重复是什么情况

一共905次，但是一遍轮回了3天半之后。居然紧接着再来一遍905次？？？？什么情况

第二篇文章勘误

拆分图片尺寸的宽h和高w；

应该是为：拆分图片尺寸的宽w和高h？

谢谢

请问有没有detect images的方法

可否32张图片一个batch 做test？

能否分享一下训练速度

我在用pytorch做训练，发现loss计算时会有.cuda()搬运过程，导致速度没有办法提上来，训练非常慢，40 samples/second，不知道您这个训练速度是多少，谢谢了，另外我的输入尺寸是416，７３６

请问作者是否缺失文件

你好为什么使用voc 的数据集训练的模型，检测马路上的车，一台都检测不出来

keras yolov3 mobilenet

I've trained yolov3 on mobilenet backend and get a good MAP(about 90M and 2 times faster than keras yolov3)。I upload my code for mobilenet-yolov3 on https://github.com/Adamdad/keras-YOLOv3-mobilenet.git
use it as you wish

想问一下这个项目是基于qqwweee的keras-yolo3的吗？

大佬，问一下这个项目是基于qqwweee的keras-yolo3的吗？
因为自己之前用它那个训练了一个自己的yolo，但很多东西都不理解，所以想跟着大佬学习一下，如果两个版本是大致兼容的我心里会更加有底一些。

第5章 loss 小疑问

老师您好！

我看您的文章中写道：

其中，model_body.output是已有模型的预测值，y_true是真实值，两者的格式相同，如下：
model_body: [(?, 13, 13, 18), (?, 26, 26, 18), (?, 52, 52, 18)]
y_true: [(?, 13, 13, 18), (?, 26, 26, 18), (?, 52, 52, 18)]

但是我输出了model_body.output.shape
model_body.output.shape = [(?,?,?,18), (?,?,?,18), (?,?,?,18)]
这个是因为输入的shape为None导致，但是并没有在 grid_shape = K.shape(feats)[1:3] 这一步出错，这是为什么呢？

如何进行对于结果的测评呢？

通过看你的简书，得知你已经写好了train的代码以及验证的代码，那么如何获取你训练模型的准确率的数据呢？

关于cfg文件

由于我们是训练单类，cfg文件中的class和最后一层的输出filter数量，是不是应该修改啊？

wider_face_val_bbx_gt.txt

@SpikeKing
您好，请问您知道wider_face_val_bbx_gt.txt 这个文件如何生成的吗，我想标记自己的数据集，生成类似的内容的.txt文件，谢谢！

对于model.py文件有一些问题

不知道博主大大是否看懂了这个文件网络结构的搭建，如果理解的话可否写一个博客解析一下这个文件的内容。
我有一个问题，对于make_last_layers我的理解是，将目标输出分为3类，输出结果分别是1313,2626,52*52，但是我没有看到具体实现。

请问如何可视化训练过程呢？

我想看到loss，recall，precision等的变化曲线

如何进行批量测试？

对于多个类别的视频检测遇到的问题

问题如下：
在同一张验证图片当中会有多个结果，如何过滤掉置信度比较低的类别
ps:感觉是yolo v3的sigmoid层惹的祸，应该改为softmax层就好了，那么具体应该怎么改呢？

eg:想要预测衣服的颜色，预测出来白色的置信值是0.52，绿色的置信值是0.2，如何过滤掉绿色呢？

预训练模型

HI @SpikeKing 能否分享一下与训练模型？
没有GPU的人基本无法训练这个，非常感谢！

对于日志文件的疑问

如果通过检查点机制生成了临时的h5模型，突然间中断了，如何继续训练？

望回复，谢谢作者大大
@SpikeKing

mAP测试

请问你复现的YOLO3有没有测试过mAP？我复现的YOLO3，在没有数据增强，没有multi-scale training的情况下，在VOC数据集上fine-tune，只能达到76的mAP，且解冻后训练两个周期后马上就过拟合。。。。。。
训练计划为：前20个周期只训练输出层，学习率为0.0001，之后训练所有层
https://github.com/Stinky-Tofu/YOLO_V3

关于max_boxes=20这个参数值

训练时用到的model.py模块里get_random_data()函数中的参数max_boxes=20，和测试的时候model.py模块里yolo_eval()函数中的参数max_boxes=20，这个max_boxes到底表达的时什么意思呢？为什么是设置成20，如果设置成更大或者更小的值对训练和测试可能会有什么影响呢？

请问，这个输入时候需要将所有数据统一到固定尺寸，如果训练集尺寸不固定的话是不是不能训练，谢谢

如题

COCO的anchors列表

10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326
到底是怎样作用在特征图上，能够给出一个详细的图解？

对于训练模型结果的优化

我按照你的步骤训练出来的模型，在WIDER_test/images/0--Parade的结果并不是特别好，这个文件夹下是多个人小物体检测，请问有没有好的调参的建议.我利用你之前给我的repo：https://github.com/Cartucho/mAP，进行了一下测试，结果是mAP值是34.6%，不知道在你那测试是怎样的

我在train keras-yolo3的时候，遇到了如下错误

我感觉应该是在unfreeze的时候内存溢出，但是我将batch_size已经设置为1了，
我的gpu是980ti，6G显存，够用吗？

已经成功训练出来了，欢迎在github上@我交流，希望作者大大不要关闭我这个issue

本项目是基于keras的yolo3的人脸检测项目，
主要有如下问题
1）由于我的gpu是单卡980ti,才6GB显存，因此我将2个地方的batch_size设置为1，并且epoch设置为小的epoch

2)在测试阶段，需要记得将model_path以及classes_path设置为wider的特定路径

请教一个问题

yolov3是否能像faster rcnn那样从全链接层前提取目标位置的特征，如果可以应该提取哪里的或者需要做什么样的改动？谢谢

yolo v3 keras版本源码是不是有问题?请问一下loss计算中的raw_pred[...,0:2],raw_pred[...,4:5],好raw_pred[...,5:]像没有经过sigmoid?

自己在阅读源码时候发现下面这段代码似乎有问题，raw_pred[...,0:2],raw_pred[...,4:5],好raw_pred[...,5:]像没有经过sigmoid，直接使用bianry_crossentropy无法保证其在０－１之间：
xy_loss = object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[...,0:2], from_logits=True)
wh_loss = object_mask * box_loss_scale * 0.5 * K.square(raw_true_wh-raw_pred[...,2:4])
confidence_loss = object_mask * K.binary_crossentropy(object_mask, raw_pred[...,4:5], from_logits=True)+
(1-object_mask) * K.binary_crossentropy(object_mask, raw_pred[...,4:5], from_logits=True) * ignore_mask
class_loss = object_mask * K.binary_crossentropy(true_class_probs, raw_pred[...,5:], from_logits=True)

spikeking / keras-yolo3-detection Goto Github PK

keras-yolo3-detection's Introduction

YOLO v3 目标检测算法 源码