datawhalechina / dive-into-cv-pytorch Goto Github PK

View Code? Open in Web Editor NEW

791.0 19.0 178.0 45.85 MB

动手学CV-Pytorch版

License: GNU General Public License v3.0

Jupyter Notebook 28.92% Python 70.63% Shell 0.45%

dive-into-cv-pytorch's Introduction

Dive-into-CV-PyTorch

本项目《动手学CV-Pytorch版》是Datawhale:whale:CV小组的一个重点项目，我们旨在构建一个以Pytorch为框架，强调动手实战的计算机视觉教程项目，帮助大家更好的学习。

项目大体上会按照计算机视觉的不同领域和应用场景进行章节划分，循序渐进，带领大家走进CV的世界，以动手实战的方式，从入门到进阶。

目前已经完成的内容包括：预备知识、图像分类入门、目标检测入门、生成式对抗网络入门、CV中的Transformer四个章节，后续的章节敬请期待。相信随着项目的推进，你我将互相见证彼此的进步。

食用方法

🐳 推荐使用 动手学CV-PyTorch 在线阅读 进行学习

有配套代码的章节，可以在项目code目录的相应章节目录下面找到。

以下是目录与代码更新进度

动手学CV-Pytorch 目录

第一章: 预备知识
第二章: 图像分类入门
- 2.1 数据读取与数据扩增
- 2.2 图像分类介绍
- 2.3 模型训练与验证
- 2.4 天池CV入门赛实战
  - 街景字符识别baseline讲解
  - 比赛方案与优化技巧总结
- 附录A torchvision.transforms速查表
第三章: 目标检测入门
第四章: 图像分割入门
- 推进中...
第五章: 生成式对抗网络入门
第六章: CV中的Transformer
- 6.1 你好，Transformer
- 6.2 Transformer实战：OCR字符识别

常见问题

在线教程页面无法打开:

测试中存在部分人打不开在线教程的情况。

部分小伙伴反馈尝试切换浏览器后可以正常打开了，如果仍然不行，最有效的解决办法是科学上网。
无法加载图片的解决办法:

根本解决办法还是科学上网，也可以尝试修改host文件看下是否能解决。

windows解决方案：修改host文件
公式无法正常显示解决办法：

github中的markdown不支持LATEX公式，如果你喜欢在本项目中直接浏览教程，可以安装chrome的MathJax Plugin for Github插件让大部分公式正常显示。但是包含公式的章节强力建议使用动手学CV-PyTorch 在线阅读进行学习

致谢

感谢以下Datawhale成员对项目推进作出的贡献(排名不分先后)：

贡献者名单

成员	个人简介及贡献	个人主页
安晟	图像算法工程师，项目负责人	CSDN, Github
闫永强	图像算法工程师，3.4、3.5、3.6、6.1节作者
宋志龙	图像算法工程师，3.1、3.2、3.3节作者
沈豪	复旦大学网安博士在读，第五章作者	知乎, Github
袁明坤	西安电子科技大学硕士，2.1、6.2节作者	CSDN
王程伟	南昌航空大学研究生，1.5、2.1节作者	CSDN
张强	宁波大学计算机硕士，2.2节作者	Github
游璐颖	福州大学计算机硕士，1.2节作者	个人主页
李一飞	参与1.3、1.4节优化
樊亮	1.3节作者	CSDN
杨皓博	1.4节作者	Github
伊雪	中电科网安研究院开发工程师，2.3节作者
阿水	Datawhale成员，公众号：Coggle数据科学, 为第二章提供部分素材	知乎

关注我们

"Datawhale是一个专注AI领域的开源组织，以“for the learner，和学习者一起成长”为愿景，构建对学习者最有价值的开源学习社区。关注我们，一起学习成长。"

dive-into-cv-pytorch's People

Contributors

Stargazers

Watchers

Forkers

dzteague niceljg super-alex lucas-cx kirinallen wljsky i-liu netbuddy mayinjin 18235123621 zhushaoquan cnxqscn liquanlei1984 nykuo-inn red1scarf gentletorch zhugeliang1 siyisan windskysolo hzy-caiji interview-ljy yiliu-lly monsterwi ginkgo-cheung qjiewang bobdeng1974 szuryan open-classes dqi002 noticeable 2209520576 uestctubiao maomaojianjian sohoscripts cainvelasquez willianflower jackyvan chaoshengt shw2018 allensmile zhangjiahuan17 yanzhuangzhuang123 samprasgit xuheding carmanzheng xu384603970 stark0629 cathyshang xrosliang likegift tcwltcwl zilong-dai ao-123 zhaolei5885 hulinliu zhanglamei love1005lin edward223 djy89 sinianyutian star-gazers lizhaofu wfy1697 yuanwind tangguihua monsterchan sunlinlin-aragon saxloy tina-wa linglu-0112 yiyi-philosophy taoshss gxb3071393901 yjfdunese gookr5 isdeepwhite yefang008514 zhiwenwang20122302 gufenglees akira617 tenderzada prozhom qwerty6518 littleel shenhao-stu lihaohua302675082 shuowang-ai jiangjudging cuglilong mapstory6788 clearme777 sea2ching lihengtianxia piggytough august-1997 lidaweinuc winterfellding xiaolong-rrl deserant lx-zheng

dive-into-cv-pytorch's Issues

感觉可以不用每一次点击超链接都在一个新的标签页中打开

每次在首页点击 Get started 都要在新的标签页中加载

Recommend using jupyter notebook instead of markdown

Hi, thanks for your significant work. Some bugs may not be found if you use markdown, so I was wondering if you could use jupyter notebook? Thanks!

6.2recignition_by_transformer-》ocr_by_transformer.py运行报错,求帮助。。。

D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))

epoch 0
train...
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
Epoch Step: 1 Loss: 5.298872 Tokens per Sec: 69.338173
Traceback (most recent call last):
File "E:/pycharmproject/dive-into-cv-pytorch-master/dive-into-cv-pytorch-master/code/chapter06_transformer/6.2_recognition_by_transformer/ocr_by_transformer.py", line 341, in
train_mean_loss = run_epoch(train_loader, ocr_model, loss_compute, device)
File "E:/pycharmproject/dive-into-cv-pytorch-master/dive-into-cv-pytorch-master/code/chapter06_transformer/6.2_recognition_by_transformer/ocr_by_transformer.py", line 230, in run_epoch
for i, batch in enumerate(data_loader):
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data\dataloader.py", line 435, in next
data = self._next_data()
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data\dataloader.py", line 1085, in _next_data
return self._process_data(data)
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data\dataloader.py", line 1111, in _process_data
data.reraise()
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch_utils.py", line 428, in reraise
raise self.exc_type(msg)
KeyError: Caught KeyError in DataLoader worker process 0.
Original Traceback (most recent call last):
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data_utils\worker.py", line 198, in _worker_loop
data = fetcher.fetch(index)
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data_utils\fetch.py", line 44, in fetch
data = [self.dataset[idx] for idx in possibly_batched_index]
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data_utils\fetch.py", line 44, in
data = [self.dataset[idx] for idx in possibly_batched_index]
File "E:\pycharmproject\dive-into-cv-pytorch-master\dive-into-cv-pytorch-master\code\chapter06_transformer\6.2_recognition_by_transformer\ocr_by_transformer.py", line 109, in getitem
gt.append(self.lbl2id_map[lbl])
KeyError: 'Â'

进程已结束,退出代码1

部分图片未加载网页版1.3 -1小节开头部分 #bug#

实际图片如下图, 未加载不限于此小节, 前1.1节也碰到类似状况

Little mistake in 2.2.1

第二章2.1节第二部分最后一个代码块，开头import的时候少了一个r~
from torch.utils.data import DataLoade
ps. 感觉这部分写的很棒，也很清晰！

2.1数据读取与数据扩增中代码有一点点小问题

在2.1中的读取示例2(示例1基础上附带数据增强)，代码上面是custom_transform，下面是custom_transforms

object_detection教程

xmin = int(bbox.find('xmin').text) - 1 ymin = int(bbox.find('ymin').text) - 1 xmax = int(bbox.find('xmax').text) - 1 ymax = int(bbox.find('ymax').text) - 1为什么要减1呢？原始图片左上角的坐标是从(0,0)开始吗

第一、二章问题建议收集

大家好，我是datawhale成员安晟，也是本项目《动手学CV-pytorch版》的组织者。经过CV小组几周的努力，我们初步完成了前两章内容的构建。内容涉及环境安装、pytorch基本使用、CNN基本概念，分类问题实战等较基础的知识点。

我们希望能够更好的发扬datawhale的开源精神，帮助到有决心有动力想要进入CV领域的入门者。同时，项目还处于初期阶段，不免会有各种不够完美的地方，因此非常希望听听大家的意见建议，尤其是入门学习者的声音。

如果你刚刚入门CV，或者正在参加我们组织的《零基础入门CV赛事- 街景字符编码识别》新人赛，非常希望大家将本项目的内容当作学习材料，并且把在学习中遇到的问题，发现的我们的教程不全面，不细致的部分指出，帮助我们更好的输出优质内容。

因此，我发布了本次活动：

大家可以在本issue下发表评论，指出你的意见和改进建议。点赞最多的两个评论将会获得我本人赞助的大红包一个或深度学习优质书籍一本~
同时，大家也可以评论指出你认为写的最好的章节，来支持内容创作者，同样获得认可(点赞)最多章节的主要作者也会获得我本人赞书的红包一个~

期待大家积极响应，活动截至时间2020/6/5日晚12点。
注：获得奖励的前提是评论必须为有建设性的意见和建议，恶意刷赞是禁止的。平票时将会由本项目组成员根据评论质量来决定奖品归属。

gan

gan章节的代码什么时候可以放出来啊

3.1 目标检测基本概念

IoU intersection 的计算是不是不对