Improve the performance of huawei OCR
华为原始的OCR通用文字服务会存在几个问题: 1、有时候存在乱码 2、自己做笔记的划线、符号会识别成文字或者符号 3、识别的文本顺序会错乱
因此自己做了相应改进, 1、通过字符块高度对比,筛掉乱码; 2、通过重新排序调整成正确的顺序 3、通过os函数,实现连续读取同一文件夹下所有jpg文件的内容,并将结果存储
备注: 代码使用的前提是已经下载了OCR的python sdk包,并具备华为云账号
| Name | Name | Last commit date | ||
|---|---|---|---|---|