在文字识别OCR我调用试卷切图接口,文档里两个接口,一个是传图片base64数据,一个是传图片url,前者我有不低的切图错误几率,文字块能识别出来,但是标注的文字块的坐标点却错的,怎么解决?这是分析结果,题目的文字块大都识别出来了,但是标注的坐标点信息却是错的
{
“page_list”: [{
“angle”: 1,
“doc_index”: 1,
“height”: 1571,
“orgHeight”: 1536,
“orgWidth”: 2048,
“page_id”: 0,
“subject_list”: [{
“content_list_info”: [{
“doc_index”: 1,
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 1,
“y”: 0
}]
}],
“ids”: [],
“is_multipage”: false,
“prism_wordsInfo”: [{
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “.(每季16526135)如图,把”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “ABCD”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “折叠,使点”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “C 点A 合,这时点D落在点”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “D'”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “处,析为”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “EF.若”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “$$\angle B A E = 5 5 ^ { \circ } ,$$”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “∠D’AD=”
}, {
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “,”
}],
“text”: “.(每季16526135)如图,把 ABCD 折叠,使点 C 点A 合,这时点D落在点 D’ 处,析为 EF.若 $$\angle B A E = 5 5 ^ { \circ } ,$$ ∠D’AD= , “
}, {
“content_list_info”: [{
“doc_index”: 1,
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 1,
“y”: 0
}]
}],
“ids”: [],
“is_multipage”: false,
“prism_wordsInfo”: [{
“pos”: [{
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}, {
“x”: 0,
“y”: 0
}],
“word”: “$$D ^ { x }$$”
}, {
“pos”: [{
“x”: 1,
“y”: 0
}, {
“x”: 1,
“y”: 0
}, {
“x”: 1,
“y”: 0
}, {
“x”: 1,
“y”: 0
}],
“word”: “E”
}, {
“pos”: [{
“x”: 1,
“y”: 0
楼主你好,切图错误问题,主要有以下几个方面需要注意和排查:
图片质量问题:传入的图片质量是否过低,是否模糊,是否存在压缩等问题,这些问题会导致识别时出现错误。
坐标误差问题:在传入图片时,需要确保图片的尺寸和坐标点的精度准确,可以通过浏览器截图工具确定。
接口使用问题:在调用接口时,需要确保参数的正确性和完整性,如是否传入了必要的参数,参数格式是否正确等。
代码问题:需要确保代码没有逻辑缺陷和语法错误,建议检查代码中相关部分的代码实现是否正确。
这种情况可能是由于多种原因导致的。首先,你需要确定是接口的问题,还是你处理base64图片数据的方式有问题。
接口问题:如果你发现错误几率较高,可能是接口本身的问题。你可以尝试使用另一个接口,或者联系接口的开发者或客服,反馈你的问题,看看他们是否有解决方案。
处理base64图片数据的方式问题:如果你确定接口没有问题,那可能是你处理base64图片数据的方式有问题。例如,你可能没有正确地解码base64图片数据,或者你可能没有正确地处理切图后的图片数据。
你可以尝试以下方法来解决这个问题:
重新处理base64图片数据:确保你已经正确地解码base64图片数据,并且你已经正确地处理切图后的图片数据。
调整切图参数:如果你使用的接口允许你设置切图参数,你可以尝试调整这些参数,看看是否可以提高切图的准确性。
使用其他工具或库:如果你发现你处理base64图片数据的方式有问题,你可以尝试使用其他工具或库来处理这些数据。
要尽量平铺,不要有褶皱倾斜,教育接口维护现状暂时不更新。md5不同结果可能不同。此回答整理自钉群“阿里云读光OCR客户交流反馈群 2”