在文字识别OCR可以识别Word结构化吗?目前支持哪些文件格式呀?支持离线吗?[阿里云OCR]

在文字识别OCR可以识别Word结构化吗?目前支持哪些文件格式呀?支持离线吗?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
3 条回复 A 作者 M 管理员
  1. 不支持。图片 部分接口支持pdf。不支持。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

  2. 文字识别OCR可以支持多种文件格式,包括.doc、.docx、.pdf等。
    此外,OCR还支持在线和离线两种识别模式:

    • 在线模式:实时上传文件到云端进行识别。
    • 离线模式:下载OCR SDK,安装到本地服务器,即可实现离线识别。

    需要注意的是,在线模式可以节省时间,并具备较高的准确率,而离线模式则可以更快地处理大量文件。

  3. 是的,阿里云的文字识别OCR可以识别 Word 文档,并支持多种文件格式,包括.docx、.doc、.pdf 等等。如果您需要离线使用OCR,可以下载离线 SDK,通过下载模型实现离线识别。
    不过,离线 SDK 不支持所有文件格式,只能支持常见的一些文件格式,因此建议您使用线上服务进行识别。同时,为了更好地识别 Word 文档,可以考虑先将其转换成 PDF 格式,以提高识别准确率

  4. 支持的。

    RecognizeDocumentStructure – 文档结构化识别https://help.aliyun.com/document_detail/447632.html?spm=a2c4g.2261246.0.i8

    文档结构化识别。

    调试
    您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

    调试调试 调试
    授权信息
    下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

    操作:是指具体的权限点。
    访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
    资源类型:是指操作中支持授权的资源类型。具体说明如下:
    对于必选的资源类型,用背景高亮的方式表示。
    对于不支持资源级授权的操作,用全部资源表示。
    条件关键字:是指云产品自身定义的条件关键字。
    关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。

    支持的图片格式
    PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
    PDF文件格式的文档结构化解析请点击文档智能解析快速了解