Giter Site home page Giter Site logo

dive-into-cv-pytorch's Introduction

Dive-into-CV-PyTorch

本项目《动手学CV-Pytorch版》是Datawhale:whale:CV小组的一个重点项目,我们旨在构建一个以Pytorch为框架,强调动手实战的计算机视觉教程项目,帮助大家更好的学习。

项目大体上会按照计算机视觉的不同领域和应用场景进行章节划分,循序渐进,带领大家走进CV的世界,以动手实战的方式,从入门到进阶。

目前已经完成的内容包括:预备知识图像分类入门目标检测入门生成式对抗网络入门CV中的Transformer四个章节,后续的章节敬请期待。相信随着项目的推进,你我将互相见证彼此的进步。

食用方法

🐳 推荐使用 动手学CV-PyTorch 在线阅读 进行学习

有配套代码的章节,可以在项目code目录的相应章节目录下面找到。

以下是目录与代码更新进度

动手学CV-Pytorch 目录

常见问题

  • 在线教程页面无法打开:

    测试中存在部分人打不开在线教程的情况。

    部分小伙伴反馈尝试切换浏览器后可以正常打开了,如果仍然不行,最有效的解决办法是科学上网。

  • 无法加载图片的解决办法:

    根本解决办法还是科学上网,也可以尝试修改host文件看下是否能解决。

    windows解决方案:修改host文件

  • 公式无法正常显示解决办法

    github中的markdown不支持LATEX公式,如果你喜欢在本项目中直接浏览教程,可以安装chrome的MathJax Plugin for Github插件让大部分公式正常显示。但是包含公式的章节强力建议使用 动手学CV-PyTorch 在线阅读 进行学习

致谢

感谢以下Datawhale成员对项目推进作出的贡献(排名不分先后):

贡献者名单
成员 个人简介及贡献 个人主页
安晟 图像算法工程师,项目负责人 CSDN, Github
闫永强 图像算法工程师,3.4、3.5、3.6、6.1节作者
宋志龙 图像算法工程师,3.1、3.2、3.3节作者
沈豪 复旦大学网安博士在读,第五章作者 知乎, Github
袁明坤 西安电子科技大学硕士,2.1、6.2节作者 CSDN
王程伟 南昌航空大学研究生,1.5、2.1节作者 CSDN
张强 宁波大学计算机硕士,2.2节作者 Github
游璐颖 福州大学计算机硕士,1.2节作者 个人主页
李一飞 参与1.3、1.4节优化
樊亮 1.3节作者 CSDN
杨皓博 1.4节作者 Github
伊雪 中电科网安研究院开发工程师,2.3节作者
阿水 Datawhale成员,公众号:Coggle数据科学, 为第二章提供部分素材 知乎

关注我们

"Datawhale是一个专注AI领域的开源组织,以“for the learner,和学习者一起成长”为愿景,构建对学习者最有价值的开源学习社区。关注我们,一起学习成长。"

dive-into-cv-pytorch's People

Contributors

2209520576 avatar dulpyanghaobo avatar gookr5 avatar leafy-lee avatar monkeydemon avatar qiangzibro avatar shenhao-stu avatar skywatcherfanl avatar sm1les avatar szuryan avatar yxyibb avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

dive-into-cv-pytorch's Issues

6.2recignition_by_transformer-》ocr_by_transformer.py运行报错,求帮助。。。

D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))

epoch 0
train...
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\nn_reduction.py:44: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
warnings.warn(warning.format(ret))
Epoch Step: 1 Loss: 5.298872 Tokens per Sec: 69.338173
Traceback (most recent call last):
File "E:/pycharmproject/dive-into-cv-pytorch-master/dive-into-cv-pytorch-master/code/chapter06_transformer/6.2_recognition_by_transformer/ocr_by_transformer.py", line 341, in
train_mean_loss = run_epoch(train_loader, ocr_model, loss_compute, device)
File "E:/pycharmproject/dive-into-cv-pytorch-master/dive-into-cv-pytorch-master/code/chapter06_transformer/6.2_recognition_by_transformer/ocr_by_transformer.py", line 230, in run_epoch
for i, batch in enumerate(data_loader):
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data\dataloader.py", line 435, in next
data = self._next_data()
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data\dataloader.py", line 1085, in _next_data
return self._process_data(data)
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data\dataloader.py", line 1111, in _process_data
data.reraise()
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch_utils.py", line 428, in reraise
raise self.exc_type(msg)
KeyError: Caught KeyError in DataLoader worker process 0.
Original Traceback (most recent call last):
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data_utils\worker.py", line 198, in _worker_loop
data = fetcher.fetch(index)
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data_utils\fetch.py", line 44, in fetch
data = [self.dataset[idx] for idx in possibly_batched_index]
File "D:\anaconda\envs\transformer_ocr\lib\site-packages\torch\utils\data_utils\fetch.py", line 44, in
data = [self.dataset[idx] for idx in possibly_batched_index]
File "E:\pycharmproject\dive-into-cv-pytorch-master\dive-into-cv-pytorch-master\code\chapter06_transformer\6.2_recognition_by_transformer\ocr_by_transformer.py", line 109, in getitem
gt.append(self.lbl2id_map[lbl])
KeyError: 'Â'

进程已结束,退出代码1

Little mistake in 2.2.1

第二章2.1节第二部分最后一个代码块,开头import的时候少了一个r~
from torch.utils.data import DataLoade
ps. 感觉这部分写的很棒,也很清晰!

object_detection教程

xmin = int(bbox.find('xmin').text) - 1 ymin = int(bbox.find('ymin').text) - 1 xmax = int(bbox.find('xmax').text) - 1 ymax = int(bbox.find('ymax').text) - 1为什么要减1呢?原始图片左上角的坐标是从(0,0)开始吗

第一、二章问题建议收集

大家好,我是datawhale成员安晟,也是本项目《动手学CV-pytorch版》的组织者。经过CV小组几周的努力,我们初步完成了前两章内容的构建。内容涉及环境安装、pytorch基本使用、CNN基本概念,分类问题实战等较基础的知识点。

我们希望能够更好的发扬datawhale的开源精神,帮助到有决心有动力想要进入CV领域的入门者。同时,项目还处于初期阶段,不免会有各种不够完美的地方,因此非常希望听听大家的意见建议,尤其是入门学习者的声音。

如果你刚刚入门CV,或者正在参加我们组织的《零基础入门CV赛事- 街景字符编码识别》新人赛,非常希望大家将本项目的内容当作学习材料,并且把在学习中遇到的问题,发现的我们的教程不全面,不细致的部分指出,帮助我们更好的输出优质内容。

因此,我发布了本次活动:

  • 大家可以在本issue下发表评论,指出你的意见和改进建议。点赞最多的两个评论将会获得我本人赞助的大红包一个或深度学习优质书籍一本~

  • 同时,大家也可以评论指出你认为写的最好的章节,来支持内容创作者,同样获得认可(点赞)最多章节的主要作者也会获得我本人赞书的红包一个~

期待大家积极响应,活动截至时间2020/6/5日晚12点。
注:获得奖励的前提是评论必须为有建设性的意见和建议,恶意刷赞是禁止的。平票时将会由本项目组成员根据评论质量来决定奖品归属。

gan

gan章节的代码什么时候可以放出来啊

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.