View Code? Open in Web Editor
NEW
电子发票识别,可识别 电子普票 电子专票
Home Page: http://www.heycore.com/invoice.html
License: MIT License
Java 70.74%
JavaScript 29.26%
einvoice's Introduction
- 👋 Hi, I’m @sanluan
- 👀 I’m interested in ...
- 🌱 I’m currently learning ...
- 💞️ I’m looking to collaborate on ...
- 📫 How to reach me ...
einvoice's People
Watchers
einvoice's Issues
首先,抱歉我不能提供原票:
一、部分(并非全部)过路费发票,无法识别日期;
二、带有销货单的发票,无法识别票面上面的货物
三、部分发票,未知原因,不能识别货物名称,看起来也没有什么特殊的
com.sanluan.einvoice.service.InvoiceExtractor
第79行应当修改:
修改前:Matcher matcher = pattern.matcher(fullText);
修改后:Matcher matcher = pattern.matcher(allText);
因为使用未处理文本导致合计金额识别不准确
出问题的发票文件:011002000911-12095199.pdf
此发票中货物名称:日用杂品润本(RUNBEN)驱蚊 液婴儿 110ml 防蚊 驱蚊水 驱防蚊喷 雾 防蚊液 蚊虫叮咬花露水7%驱
在 com.sanluan.einvoice.service.InvoiceExtractor 文件 318-321 行中,有用到税率中的“%”来判定是否为下一商品名称,但是这个商品名称自带“%”。然后就会炸掉。
未命名文件夹 2.zip
这是有问题的pdf票和ofd
有个测试网站我试了一下全电的pdf返回的发票号不全目前代码测试我没做,只做个小提醒。