ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下?[阿里云OCR]

ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
3 条回复 A 作者 M 管理员
  1. 阿里云OCR提供了“表格文字识别”接口,可以实现对表格类文档的识别,并支持输出分栏结果。您可以通过以下步骤来试用该功能:

    1. 在阿里云控制台中开通阿里云OCR服务,并获取AccessKey ID和AccessKey Secret。

    2. 调用“表格文字识别”接口,传入待识别的图片或PDF文件,并设置识别参数(如语言、表格边框检测等),在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数,表示需要输出分栏结果。

    3. 接口返回的JSON格式结果中,每个单元格的内容将按照分栏结果进行组织,并在每个单元格对象中添加“split_words”字段,表示该单元格的分栏结果。如果某行或某列没有分栏,则该字段的值为null。

    注意事项:

    • “表格文字识别”接口仅能识别表格类文档,而且要求表格边框比较明显,否则可能会影响识别效果。
    • 分栏结果的数量受到多种因素的影响,如表格布局、字体大小、单元格内容等,因此具体情况需根据实际情况而定。
    • 分栏结果仅适用于表格类文档,不适用于一般的文本识别场景。
  2. 阿里云的OCR服务支持分栏输出功能,您可以通过以下接口进行使用:

    使用阿里云OSS SDK调用OSS API,获取OCR识别结果。 使用阿里云API调用OCR服务API,获取OCR识别结果。

  3. 您好,阿里云OCR(Optical Character Recognition)提供了多个接口,其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍:

    • 接口名称:ocr_table_recognize
    • 功能描述:支持表格识别和指定区域文字识别,可输出分栏结果。
    • 请求方式:HTTP POST
    • 请求参数:
    参数名 类型 是否必填 描述
    image binary 图像二进制数据,需base64编码
    output_prob boolean 是否返回单字符置信度信息,默认为false
    output_keypoints boolean 是否返回单字位置信息,默认为false
    min_size integer 指定表格中文字最小高度,默认10
    table_border_confidence float 表格边界置信度阈值,默认0.5
    form_content_confidence float 表格内容行置信度阈值,默认0.5
    cell_content_confidence float 表格单元格置信度阈值,默认0.5
    • 返回参数:
    参数名 类型 描述
    request_id string 请求ID
    result object 识别结果

    在请求中设置output_keypoints为true,则result中的单字位置信息会被返回,从而实现分栏输出的功能。

    在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret,以便进行API请求。

  4. 分栏输出也还不能把上面那张图片的2列分开,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”