Giter Site home page Giter Site logo

keras-yolo3-detection's Introduction

YOLO v3 目标检测算法 源码

欢迎关注,微信公众号 深度算法 (ID: DeepAlgorithm)

相关文章:

通过6篇文章,完整的呈现YOLO v3的源码细节。慢慢读完,掌握一些高级的深度学习开发技巧。

参考:

勘误:

  1. 第4篇 真值,最后:“y_true的第0和1位是中心点xy,范围是(0~13/26/52)” -> “y_true的第0和1位是中心点xy,范围是(0~1)”;
  2. 第3篇 网络,其中关于补充部分1*1卷积参数那个有误。不是13*13*1*1*18应该是1*1*1024*18; Thx@草绛ly
  3. 第6篇 预测,max_boxes是在每层的feature_map中的每个类别分别最多产生20个框,而不是每张图片; Thx@略略略

keras-yolo3-detection's People

Contributors

spikeking avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

keras-yolo3-detection's Issues

wider_annotation key error

hi, when i convert the training file, i met some error as below:
Traceback (most recent call last):
File "wider_annotation.py", line 137, in
generate_train_file(train_bbx_file, train_data_folder, out_file)
File "wider_annotation.py", line 44, in generate_train_file
img_path = name_dict[name]
KeyError: '2_Demonstration_Political_Rally_2_620.jpg'

Could you help tell what happened? thank you very much.
@SpikeKing

有没有实例教程

关于该项目,说的有些简陋,我是新手有没有写具体的教程?

good job!

写的很好 ,相信不久就会用到!

请问作者,loss中对x,y使用的交叉熵是否应为squared loss?

yolo v3 于2.1. Bounding Box Prediction中对xywh使用的loss进行了说明:

During training we use sum of squared error loss.

但在作者的实现中,对wh使用的确实是squared loss,但xy实现使用交叉熵,代码如下:

xy_loss = object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[..., 0:2],
                                                               from_logits=True)

所以请教作者为何这样实现?
谢谢

重复是什么情况

一共905次,但是一遍轮回了3天半之后。居然紧接着再来一遍905次????什么情况

第二篇文章勘误

拆分图片尺寸的宽h和高w;

应该是为:拆分图片尺寸的宽w和高h?

谢谢

能否分享一下训练速度

我在用pytorch做训练,发现loss计算时会有.cuda()搬运过程,导致速度没有办法提上来,训练非常慢,40 samples/second,不知道您这个训练速度是多少,谢谢了,另外我的输入尺寸是416,736

想问一下这个项目是基于qqwweee的keras-yolo3的吗?

大佬,问一下这个项目是基于qqwweee的keras-yolo3的吗?
因为自己之前用它那个训练了一个自己的yolo,但很多东西都不理解,所以想跟着大佬学习一下,如果两个版本是大致兼容的我心里会更加有底一些。

第5章 loss 小疑问

老师您好!

我看您的文章中写道:

其中,model_body.output是已有模型的预测值,y_true是真实值,两者的格式相同,如下:
model_body: [(?, 13, 13, 18), (?, 26, 26, 18), (?, 52, 52, 18)]
y_true: [(?, 13, 13, 18), (?, 26, 26, 18), (?, 52, 52, 18)]

但是我输出了model_body.output.shape
model_body.output.shape = [(?,?,?,18), (?,?,?,18), (?,?,?,18)]
这个是因为输入的shape为None导致,但是并没有在 grid_shape = K.shape(feats)[1:3] 这一步出错,这是为什么呢?

关于cfg文件

由于我们是训练单类,cfg文件中的class和最后一层的输出filter数量,是不是应该修改啊?

wider_face_val_bbx_gt.txt

@SpikeKing
您好,请问您知道wider_face_val_bbx_gt.txt 这个文件如何生成的吗,我想标记自己的数据集,生成类似的内容的.txt文件,谢谢!

对于model.py文件有一些问题

不知道博主大大是否看懂了这个文件网络结构的搭建,如果理解的话可否写一个博客解析一下这个文件的内容。
我有一个问题,对于make_last_layers我的理解是,将目标输出分为3类,输出结果分别是1313,2626,52*52,但是我没有看到具体实现。

对于多个类别的视频检测遇到的问题

问题如下:
在同一张验证图片当中会有多个结果,如何过滤掉置信度比较低的类别
ps:感觉是yolo v3的sigmoid层惹的祸,应该改为softmax层就好了,那么具体应该怎么改呢?

eg:想要预测衣服的颜色,预测出来白色的置信值是0.52,绿色的置信值是0.2,如何过滤掉绿色呢?

预训练模型

HI @SpikeKing 能否分享一下与训练模型?
没有GPU的人基本无法训练这个,非常感谢!

mAP测试

请问你复现的YOLO3有没有测试过mAP?我复现的YOLO3,在没有数据增强,没有multi-scale training的情况下,在VOC数据集上fine-tune,只能达到76的mAP,且解冻后训练两个周期后马上就过拟合。。。。。。
训练计划为:前20个周期只训练输出层,学习率为0.0001,之后训练所有层
https://github.com/Stinky-Tofu/YOLO_V3

关于max_boxes=20这个参数值

训练时用到的model.py模块里get_random_data()函数中的参数max_boxes=20,和测试的时候model.py模块里yolo_eval()函数中的参数max_boxes=20,这个max_boxes到底表达的时什么意思呢?为什么是设置成20,如果设置成更大或者更小的值对训练和测试可能会有什么影响呢?

COCO的anchors列表

10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326
到底是怎样作用在特征图上,能够给出一个详细的图解?

请教一个问题

yolov3是否能像faster rcnn那样从全链接层前提取目标位置的特征,如果可以应该提取哪里的或者需要做什么样的改动?谢谢

yolo v3 keras版本源码是不是有问题?请问一下loss计算中的raw_pred[...,0:2],raw_pred[...,4:5],好raw_pred[...,5:]像没有经过sigmoid?

自己在阅读源码时候发现下面这段代码似乎有问题,raw_pred[...,0:2],raw_pred[...,4:5],好raw_pred[...,5:]像没有经过sigmoid,直接使用bianry_crossentropy无法保证其在0-1之间:
xy_loss = object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[...,0:2], from_logits=True)
wh_loss = object_mask * box_loss_scale * 0.5 * K.square(raw_true_wh-raw_pred[...,2:4])
confidence_loss = object_mask * K.binary_crossentropy(object_mask, raw_pred[...,4:5], from_logits=True)+
(1-object_mask) * K.binary_crossentropy(object_mask, raw_pred[...,4:5], from_logits=True) * ignore_mask
class_loss = object_mask * K.binary_crossentropy(true_class_probs, raw_pred[...,5:], from_logits=True)

自己训练完以后,检测的效果不好

会出现同一对象被重复检测为不同类别,然后检测框重叠在一块,而且还有错检、漏检的情况出现。
有哪位大神指点一下吗?万分感谢

人脸检测精度

您好,请问您测试过模型在FDDB或者WIDER FACE上的精度么?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.