Skip to content

[bug] 识别时,库内部的图片被轻微拉伸了。导致 box 数值不准 #24

@fanybook

Description

@fanybook

我做了个小功能,鼠标右键点击图片中的文字,然后识别出文字

但是发现一个长图,上边功能好使,到接近底部时,功能就不好使了

于是我打开 debug,输出框图,我发现 debug 输出的图片相较于我的原始图片,被拉伸了

720 × 4200像素的图片,被轻微拉伸到了 736 × 4224像素,导致长图,在底部时,鼠标获取到的和 x 和 y,与 box 里的对应不上


期待的改进:

  1. 尽量在 ocr 过程中,不 resize 图片
  2. 如果上边做不到,那么在返回的 result 结果里,返回 resize 后的宽高(这样至少可以自己做转化)
  3. 如果为了老版本的使用者,不能轻易修改 result 的结果,可以再增加函数
const result = {
    "width": 736,
    "height": 4224,
    "ocr": [
        ...
    ]
}

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions