更新于2019年10月,由于比赛结束且OCR方向不是主要的研究方向而且对NLP没有太深入理解,暂时停止该仓库的更新。
- 文字方向检测(VGG16)
- 文本区域检测(CTPN)
- 文本内容识别(DenseNet + CTC)
- 说明
- 利用VGG16分类网络对大量的图片(包含正向文字、偏移90度、偏移180度、偏移270度)进行训练。
- 思路一
- Densenet + CTC(CTC Loss的提出为OCR的端到端模型提供巨大的可能性)
- 思路二
- DenseNet + BLSTM + CTC(双向LSTM作为语言模型,进一步强化自然语言处理的捕捉效果不明显)