Giter Site home page Giter Site logo

Comments (21)

WenmuZhou avatar WenmuZhou commented on April 19, 2024

@WenmuZhou db 和db head

from pytorchocr.

Jinreejing avatar Jinreejing commented on April 19, 2024

基础训练代码 @novioleo

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

基础训练代码 @novioleo

@Jinreejing 第一期利用paddle ocr预训练的模型的数据,然后目前是对mbv3的crnn和res34的crnn进行训练的代码编写。训练用数据集可以用icdar2013和icdar2015也可以用其他数据集。conv部分的lr和wd要小一点,lstm的部分可以是正常的。

from pytorchocr.

PKQ1688 avatar PKQ1688 commented on April 19, 2024

实现fpn @novioleo

from pytorchocr.

ZenFSheng avatar ZenFSheng commented on April 19, 2024

想试试dataloader🙏 @novioleo

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

实现fpn @novioleo

@WenmuZhou 麻烦给他明确下具体任务,主要的输入输出,方便上下游联调测试

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

想试试dataloader🙏 @novioleo

@ZenFSheng 麻烦实现两个dataloader(其实本质是dataset+dataloader),分别用于det和rec,可以优先实现rec的部分,能够加载常见的IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE等相关数据集格式,可以先适配ic13,后期进行增加。

from pytorchocr.

WenmuZhou avatar WenmuZhou commented on April 19, 2024

实现fpn @novioleo

@WenmuZhou 麻烦给他明确下具体任务,主要的输入输出,方便上下游联调测试

fpn的输入应为一个list[stage1(B,C1,H//4,W//4),stage2(B,C2,H//8,W//8),stage3(B,C3,H//16,W//16),stage4(B,C4,H//32,W//32)], 其输出应为shape为(B,C,H//4,W//4)的tensor,先实现这一通用的FPN,后面其他诡异的融合情况再另行添加

from pytorchocr.

WenmuZhou avatar WenmuZhou commented on April 19, 2024

想试试dataloader🙏 @novioleo

@ZenFSheng 麻烦实现两个dataloader(其实本质是dataset+dataloader),分别用于det和rec,可以优先实现rec的部分,能够加载常见的IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE等相关数据集格式,可以先适配ic13,后期进行增加。

rec的dataset可以采用TextLineDataset(即用文本文件记载图片路径和label的形式)+转换工具这种形式
det的dataset考虑的比较多:1. 各种算法预处理的不同;2. 数据集格式的适配或转换工具

from pytorchocr.

WenmuZhou avatar WenmuZhou commented on April 19, 2024

@novioleo 我觉得我们可以先定下配置系统并提供一个example,这样后面比较清晰

from pytorchocr.

ofexe avatar ofexe commented on April 19, 2024

推荐先设计大概的框架,做一些约定,这样整合的话比较方便

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

推荐先设计大概的框架,做一些约定,这样整合的话比较方便

@ofexe 感谢提醒。最近会有相关代码提交上来。届时会出相关的框架性代码,大家可以再进行开发。

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

@novioleo 我觉得我们可以先定下配置系统并提供一个example,这样后面比较清晰

@WenmuZhou 好的。我个人建议我们可以先把基于mbv3的一整套的方案串通,这样再po出来,大家可以运行起来,这样就方便了。

from pytorchocr.

afterimagex avatar afterimagex commented on April 19, 2024

我想认领demo的实现

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

我想认领demo的实现

@afterimagex 主要是为了实现一个类似于chineseocr那种网页,然后能够进行可视化的模型结果的展示以及试用。

from pytorchocr.

afterimagex avatar afterimagex commented on April 19, 2024

我想认领demo的实现

@afterimagex 主要是为了实现一个类似于chineseocr那种网页,然后能够进行可视化的模型结果的展示以及试用。

没问题

from pytorchocr.

lgcy avatar lgcy commented on April 19, 2024

大佬有计划实现EAST吗,自己实现了一下,性能比paddle的差太多了。很期待大佬的实现

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

大佬有计划实现EAST吗,自己实现了一下,性能比paddle的差太多了。很期待大佬的实现

@lgcy 你好,欢迎你pr,我们可以帮你优化性能相关,你看如何?

from pytorchocr.

lgcy avatar lgcy commented on April 19, 2024

pr

你好,真的非常感谢大佬可以帮忙优化性能。只是我的代码是按照自己的流程走的,你们这个模块化很清晰,要融进去感觉比较麻烦。我应该怎么弄呢

from pytorchocr.

novioleo avatar novioleo commented on April 19, 2024

你好,真的非常感谢大佬可以帮忙优化性能。只是我的代码是按照自己的流程走的,你们这个模块化很清晰,要融进去感觉比较麻烦。我应该怎么弄呢

@lgcy 首先,选择对应的backbone,在torchocr.network.backbones中选择你需要的Det的backbone,目前只适配了res和mb。然后neck层就是east中对backbone的fm进行进一步处理的部分,head层就是east的回归值的地方。你可以一步一步走一下~fork之后开一个新的branch试试我说的,然后有问题可以at我,然后我帮你看下。你看如何?

from pytorchocr.

lgcy avatar lgcy commented on April 19, 2024

你好,真的非常感谢大佬可以帮忙优化性能。只是我的代码是按照自己的流程走的,你们这个模块化很清晰,要融进去感觉比较麻烦。我应该怎么弄呢

@lgcy 首先,选择对应的backbone,在torchocr.network.backbones中选择你需要的Det的backbone,目前只适配了res和mb。然后neck层就是east中对backbone的fm进行进一步处理的部分,head层就是east的回归值的地方。你可以一步一步走一下~fork之后开一个新的branch试试我说的,然后有问题可以at我,然后我帮你看下。你看如何?

好的,我试试

from pytorchocr.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.