tongchenkeji 发表于:2023-5-30 20:29:490次点击 已关注取消关注 关注 私信 ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下?[阿里云OCR] 暂停朗读为您朗读 ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 印刷文字识别# 文字识别1940# 视觉智能开放平台3859
一位隐者AM 2023-11-28 3:33:39 1 阿里云OCR提供了“表格文字识别”接口,可以实现对表格类文档的识别,并支持输出分栏结果。您可以通过以下步骤来试用该功能: 在阿里云控制台中开通阿里云OCR服务,并获取AccessKey ID和AccessKey Secret。 调用“表格文字识别”接口,传入待识别的图片或PDF文件,并设置识别参数(如语言、表格边框检测等),在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数,表示需要输出分栏结果。 接口返回的JSON格式结果中,每个单元格的内容将按照分栏结果进行组织,并在每个单元格对象中添加“split_words”字段,表示该单元格的分栏结果。如果某行或某列没有分栏,则该字段的值为null。 注意事项: “表格文字识别”接口仅能识别表格类文档,而且要求表格边框比较明显,否则可能会影响识别效果。 分栏结果的数量受到多种因素的影响,如表格布局、字体大小、单元格内容等,因此具体情况需根据实际情况而定。 分栏结果仅适用于表格类文档,不适用于一般的文本识别场景。
魏红斌AM 2023-11-28 3:33:39 2 阿里云的OCR服务支持分栏输出功能,您可以通过以下接口进行使用: 使用阿里云OSS SDK调用OSS API,获取OCR识别结果。 使用阿里云API调用OCR服务API,获取OCR识别结果。
wljslmzAM 2023-11-28 3:33:39 3 您好,阿里云OCR(Optical Character Recognition)提供了多个接口,其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍: 接口名称:ocr_table_recognize 功能描述:支持表格识别和指定区域文字识别,可输出分栏结果。 请求方式:HTTP POST 请求参数: 参数名 类型 是否必填 描述 image binary 是 图像二进制数据,需base64编码 output_prob boolean 否 是否返回单字符置信度信息,默认为false output_keypoints boolean 否 是否返回单字位置信息,默认为false min_size integer 否 指定表格中文字最小高度,默认10 table_border_confidence float 否 表格边界置信度阈值,默认0.5 form_content_confidence float 否 表格内容行置信度阈值,默认0.5 cell_content_confidence float 否 表格单元格置信度阈值,默认0.5 返回参数: 参数名 类型 描述 request_id string 请求ID result object 识别结果 在请求中设置output_keypoints为true,则result中的单字位置信息会被返回,从而实现分栏输出的功能。 在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret,以便进行API请求。
阿里云OCR提供了“表格文字识别”接口,可以实现对表格类文档的识别,并支持输出分栏结果。您可以通过以下步骤来试用该功能:
在阿里云控制台中开通阿里云OCR服务,并获取AccessKey ID和AccessKey Secret。
调用“表格文字识别”接口,传入待识别的图片或PDF文件,并设置识别参数(如语言、表格边框检测等),在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数,表示需要输出分栏结果。
接口返回的JSON格式结果中,每个单元格的内容将按照分栏结果进行组织,并在每个单元格对象中添加“split_words”字段,表示该单元格的分栏结果。如果某行或某列没有分栏,则该字段的值为null。
注意事项:
阿里云的OCR服务支持分栏输出功能,您可以通过以下接口进行使用:
使用阿里云OSS SDK调用OSS API,获取OCR识别结果。 使用阿里云API调用OCR服务API,获取OCR识别结果。
您好,阿里云OCR(Optical Character Recognition)提供了多个接口,其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍:
在请求中设置output_keypoints为true,则result中的单字位置信息会被返回,从而实现分栏输出的功能。
在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret,以便进行API请求。
分栏输出也还不能把上面那张图片的2列分开,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”