youngmiao / crnn Goto Github PK

View Code? Open in Web Editor NEW

134.0 134.0 45.0 68 KB

Based on crnn add Chinese recognition

License: MIT License

Python 93.48% Lua 6.52%

crnn's People

Contributors

Stargazers

Watchers

Forkers

bluemyocean tanyufei amore-hdu onebaicai lxhsjtu mingchaoxu kitter oujunke wuzifan suntim syrilzhang nursinghoming glb-seu bobrey blackhilloldmonster gzjas beimingmaster liben2018 ppeng dreadlord1984 linecode narcissuscyn maolb yongduek hhgxx123 hwangkc etrigger microphoneben chankeh diesel790529 ewenwan zhaoyin214 siyecao99999 gyf513 sjtuzhangxiao wenwenyu andycat1231 lifloveyou harlanhong yanggui19891007 bitqinyong jjz-learning lizhiping1997 luckyandpower

crnn's Issues

输入图片尺寸

你的输入图片尺寸高度为32，宽度时根据高度缩放的，是在脚本中将keep ratio设置为true吗

could you serve a copy of train.txt

could you serve a copy of train.txt ,I can't train it for my own dataset,thanks a lot

what kind of trainroot and valroot like?

there are two bugs in the code

first :
preds = preds.squeeze(2) -> preds = preds.squeeze(1)
second:
preds = preds.transpose(1, 0).contiguous().view(-1) -> preds = preds.transpose(-1, 0).contiguous().view(-1)
to change the two lines then get the result

精确度为0，验证集没输出

你好，我自己用您给的生成数据工程synthdata-zh做数据集，其中word.txt是26个小写字母，每个字母生成550训练样本，50的验证样本，共600张。
然后在CRNN工程里的tool里面，用tolmdb.py产生相关训练与验证集合文件，再把key.py里面的alphabet也改成26个小写字母，开始训练，但是出现这样的结果，不知道哪里有问题？

ncalss

我使用中文字符时，一个字符的len是3,当我使用100时，len为300，nclass为301，但是我看你使用了中文字符，类别数就是比字符数多1，所以我觉得有些疑问。还有一个问题就是我用合成的样本进行训练和测试，效果比较好，但是我用自然场景下扣出来的文本进行测试，如果只是效果不好那我觉得是合理的，但是我预测出来的标签序列有alphabet中不包含的字符，这让我觉得很奇怪。请问你有遇到过这个问题吗，或者你的看法是什么呢？

预训练模型载入发现如下问题，请问如何解决？

File "crnn_main.py", line 109, in
if len(model_dict[weig1]) == len(pre_trainmodel[weig1]) and len(model_dict[bias1]) == len(pre_trainmodel[bias1]):
KeyError: 'rnn.1.embedding.weight'

请问训练的数据集标签label长度不一样，可以进行训练吗？

比如我有的训练图片有10个字符，而有的有13个字符，这种情况的训练集可以训练吗

t7_data is an object not a list

@YoungMiao
I get an error in these lines. I think t7_data is an object, not a list

crnn/tool/convert_t7.py

Lines 120 to 123 in e78bb7d

    
           t7_data = torchfile.load(t7_file) 
        
           t7_layers = [] 
        
           for layer in t7_data: 
        
               torch_layer_serial(layer, t7_layers)

name = layer[0]
TypeError: 'NoneType' object is not subscriptable

@wulivicte 你的训练集是什么数据，21类中英文在哪里下载？

多GPU训练loss不对，单GPU训练没有问题

麻烦问一下，我用多个gpu训练的loss感觉不对，与单gpu训练相同Loss值的模型，预测结果非常差，单gpu训练的模型预测是正确的。@ wulivicte，请问您遇到过这种问题吗，怎么解决的，非常感谢。

训练模型保存在哪儿呢

你好，我没有找到保存训练模型的代码，也不知道训练好的模型时保存在哪儿

how about 5000 alphabet?

crnn_main.py

max_iter = min(max_iter, len(data_loader))

accuracy = n_correct / float(max_iter * opt.batchSize)

请问这两句该怎么理解？

has you make cpu model? i hasnt GPU,thk

UnicodeDecodeError: 'utf8' codec can't decode byte 0xb2 in position 0: invalid start byte

训练汉字的时候始终报错，请问这个问题怎么解决啊

Corrupted image for

请问博主训练的时候用了多少个epoch，样本数据一共是多少？

Corrupted image?

用synthdata-zh这个项目生成的图片，训练时一直有Corrupted image的错误

dimenson mismatch problem

There is something wrong (dimenson mismatch) when fine tune with your code.
for k,v in model_dict.items(): if (k != weig1 or k != bias1): model_dict[k] = pre_trainmodel[k] crnn.load_state_dict(model_dict)
I fixed it by updating
if (k != weig1 or k != bias1):
to
if not (k == weig1 or k == bias1):