Comments (21)
@WenmuZhou db 和db head
from pytorchocr.
基础训练代码 @novioleo
from pytorchocr.
基础训练代码 @novioleo
@Jinreejing 第一期利用paddle ocr预训练的模型的数据,然后目前是对mbv3的crnn和res34的crnn进行训练的代码编写。训练用数据集可以用icdar2013和icdar2015也可以用其他数据集。conv部分的lr和wd要小一点,lstm的部分可以是正常的。
from pytorchocr.
实现fpn @novioleo
from pytorchocr.
想试试dataloader🙏 @novioleo
from pytorchocr.
实现fpn @novioleo
@WenmuZhou 麻烦给他明确下具体任务,主要的输入输出,方便上下游联调测试
from pytorchocr.
想试试dataloader🙏 @novioleo
@ZenFSheng 麻烦实现两个dataloader(其实本质是dataset+dataloader),分别用于det和rec,可以优先实现rec的部分,能够加载常见的IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE等相关数据集格式,可以先适配ic13,后期进行增加。
from pytorchocr.
实现fpn @novioleo
@WenmuZhou 麻烦给他明确下具体任务,主要的输入输出,方便上下游联调测试
fpn的输入应为一个list[stage1(B,C1,H//4,W//4),stage2(B,C2,H//8,W//8),stage3(B,C3,H//16,W//16),stage4(B,C4,H//32,W//32)], 其输出应为shape为(B,C,H//4,W//4)的tensor,先实现这一通用的FPN,后面其他诡异的融合情况再另行添加
from pytorchocr.
想试试dataloader🙏 @novioleo
@ZenFSheng 麻烦实现两个dataloader(其实本质是dataset+dataloader),分别用于det和rec,可以优先实现rec的部分,能够加载常见的IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE等相关数据集格式,可以先适配ic13,后期进行增加。
rec的dataset可以采用TextLineDataset(即用文本文件记载图片路径和label的形式)+转换工具这种形式
det的dataset考虑的比较多:1. 各种算法预处理的不同;2. 数据集格式的适配或转换工具
from pytorchocr.
@novioleo 我觉得我们可以先定下配置系统并提供一个example,这样后面比较清晰
from pytorchocr.
推荐先设计大概的框架,做一些约定,这样整合的话比较方便
from pytorchocr.
推荐先设计大概的框架,做一些约定,这样整合的话比较方便
@ofexe 感谢提醒。最近会有相关代码提交上来。届时会出相关的框架性代码,大家可以再进行开发。
from pytorchocr.
@novioleo 我觉得我们可以先定下配置系统并提供一个example,这样后面比较清晰
@WenmuZhou 好的。我个人建议我们可以先把基于mbv3的一整套的方案串通,这样再po出来,大家可以运行起来,这样就方便了。
from pytorchocr.
我想认领demo的实现
from pytorchocr.
我想认领demo的实现
@afterimagex 主要是为了实现一个类似于chineseocr那种网页,然后能够进行可视化的模型结果的展示以及试用。
from pytorchocr.
我想认领demo的实现
@afterimagex 主要是为了实现一个类似于chineseocr那种网页,然后能够进行可视化的模型结果的展示以及试用。
没问题
from pytorchocr.
大佬有计划实现EAST吗,自己实现了一下,性能比paddle的差太多了。很期待大佬的实现
from pytorchocr.
大佬有计划实现EAST吗,自己实现了一下,性能比paddle的差太多了。很期待大佬的实现
@lgcy 你好,欢迎你pr,我们可以帮你优化性能相关,你看如何?
from pytorchocr.
pr
你好,真的非常感谢大佬可以帮忙优化性能。只是我的代码是按照自己的流程走的,你们这个模块化很清晰,要融进去感觉比较麻烦。我应该怎么弄呢
from pytorchocr.
你好,真的非常感谢大佬可以帮忙优化性能。只是我的代码是按照自己的流程走的,你们这个模块化很清晰,要融进去感觉比较麻烦。我应该怎么弄呢
@lgcy 首先,选择对应的backbone,在torchocr.network.backbones中选择你需要的Det的backbone,目前只适配了res和mb。然后neck层就是east中对backbone的fm进行进一步处理的部分,head层就是east的回归值的地方。你可以一步一步走一下~fork之后开一个新的branch试试我说的,然后有问题可以at我,然后我帮你看下。你看如何?
from pytorchocr.
你好,真的非常感谢大佬可以帮忙优化性能。只是我的代码是按照自己的流程走的,你们这个模块化很清晰,要融进去感觉比较麻烦。我应该怎么弄呢
@lgcy 首先,选择对应的backbone,在torchocr.network.backbones中选择你需要的Det的backbone,目前只适配了res和mb。然后neck层就是east中对backbone的fm进行进一步处理的部分,head层就是east的回归值的地方。你可以一步一步走一下~fork之后开一个新的branch试试我说的,然后有问题可以at我,然后我帮你看下。你看如何?
好的,我试试
from pytorchocr.
Related Issues (20)
- 没看到保存的pth文件 HOT 1
- loss:nan怎么解决? HOT 1
- 同样的数据,代码,在colab训练没有nan错误,在win10上就会出现nan错误,是怎么解决? HOT 1
- 有没有本项目crnn pth训练结果 转onnx的代码?
- 大佬们你们训练的时候速度是多少?为什么我这里这么👨
- 文本识别: RecLmdbDataset数据集存在严重bug
- 您好,作者,请问可以加载paddle的检测模型进行微调训练吗? HOT 4
- 识别模型训练时如何开启数据增强 HOT 2
- pytorchOCR中的DBNet与文幕纯DBNet精度差别大
- 有没有Int版本的模型
- ValueError: num_samples should be a positive integer value, but got num_samples=0
- 如何在ocr识别的字典文件中添加上下标的训练素材
- python tools/infer_rec.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml HOT 6
- 请问目前转换成onnx格式推理的功能可以使用了吗 HOT 3
- 请问cls的模型有开源参数吗 HOT 2
- 在det模型中,如何调节检测框之间合并的间距阈值
- use the comand to run the train report the warning,any one have the same warning? HOT 1
- 训练ch_PP-OCRv3_rec不收敛,CTCLOSS到50就不降了 HOT 1
- ch_ppocr_mobile_v2.0_cls_train 的 config文件是不是没上传? HOT 3
- cls_mv3 模型权重是不是忘了上传了? 链接里没有 HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from pytorchocr.