文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？[阿里云OCR]

文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

7 条回复 A 作者 M 管理员

三掌柜666AM 2023-11-28 3:21:31 1
楼主你好，是的，阿里云文字识别OCR服务中提供了“文字识别（含位置信息版）”API，该API可以实现在图片中识别指定关键字的位置信息，返回关键字在图片中的坐标。您可以使用以下步骤开始：

登录阿里云控制台，进入OCR服务页面

创建一个OCR应用

获取AccessKey和SecretKey

调用“文字识别（含位置信息版）”API进行图片识别

具体实现方法请参考阿里云OCR服务相关文档。
已喜欢已反对
魏红斌AM 2023-11-28 3:21:31 2

本文主要介绍文字识别收费能力的计费方式及报价。其余未收费能力当前还处于公测阶段，可免费使用。

咨询服务
如果您有任何购买问题需要咨询阿里云视觉智能开放平台，欢迎各位企业用户、开发商、服务商或者开发者通过钉钉搜索群号23109592，加入阿里云视觉智能开放平台咨询群，与平台取得联系。

车牌识别
车牌识别能力支持按量付费和单类目预付费资源包方式进行计费。

已喜欢已反对
六月的雨在钉钉AM 2023-11-28 3:21:31 3

您好，文字识别OCR根据不同的场景提供了不同的文字识别服务，比如身份证识别、银行卡识别等，根据您上传的身份证图片或者银行卡图片准确识别出图片中的文本内容。但是文字识别OCR目前还不支持手动指定识别图中关键字的坐标位置。

已喜欢已反对
认真学习的heartAM 2023-11-28 3:21:31 4
可以使用阿里云的OCR服务中的“通用文字识别”功能来实现这一目标。您可以上传一张包含文字的图片，然后在识别结果中找到指定的关键字，并获取其在图片中的坐标信息。

以下是一般步骤的概述：

创建阿里云账号并开通OCR服务： 如果您还没有阿里云账号，您需要首先注册一个账号，并在控制台中开通OCR服务。

获取API访问凭证： 在阿里云控制台中，您需要获取API访问凭证，通常是Access Key ID和Access Key Secret。

调用OCR API： 使用API访问凭证，您可以通过调用OCR API来上传图片并获取识别结果。在识别结果中，您可以找到关键字的位置信息，通常以坐标、边界框等形式表示。
已喜欢已反对
玥轩AM 2023-11-28 3:21:31 5

是的，有一些OCR API可以支持获取图片上指定关键字的坐标。例如，Tesseract OCR是一个开源的OCR引擎，支持多种语言，包括中文。您可以使用pytesseract库将其集成到Python中，然后使用它的image_to_data函数来获取图片上指定关键字的坐标。

已喜欢已反对
小周sirAM 2023-11-28 3:21:31 6
是的，阿里云提供了OCR（文字识别）服务，可以用于获取图片上指定关键字的坐标。阿里云的OCR服务名为”文档识别（OCR）”，您可以使用其API来实现该功能。

阿里云的文档识别（OCR）服务提供了多种功能，包括通用文字识别、身份证识别、驾驶证识别、银行卡识别等。通过调用相应的接口，您可以将图片上传到阿里云服务器，并从返回结果中提取包含关键字的文字位置信息。

您可以参考阿里云官方文档中的”文档识别（OCR）”部分，查看可用的API及其使用方法。具体来说，您可能会使用到的服务包括：

身份证识别（IdCardOCR）：用于识别身份证图片，并返回身份证正反面的文字内容和位置信息。

通用文字识别（OCR）：用于识别通用场景下的文本，返回图片中文字内容和位置信息。

表格文字识别（TableOCR）：用于识别表格中的文字，包括表头和表格内容，并返回文字的位置和结构化输出。
已喜欢已反对
wljslmzAM 2023-11-28 3:21:31 7
是的，阿里云提供了文字识别（OCR）服务，并且支持获取图片上指定关键字的坐标。您可以使用阿里云的文本识别（OCR）API来实现此功能。

阿里云的文本识别（OCR）服务包含了多种功能，可以识别图片中的文字、身份证、银行卡等信息，并提供了相应的API接口供开发者调用。

下面是使用阿里云的文本识别（OCR）服务获取图片上指定关键字坐标的一般步骤：

注册/登录阿里云账号：如果您还没有阿里云账号，请先注册一个账号并登录。

开通文字识别（OCR）服务：在阿里云控制台中选择并开通文字识别（OCR）服务。

获取API密钥：在阿里云控制台中创建并获取您的API密钥（Access Key ID和Access Key Secret），以便进行API调用。

调用API接口：使用您的API密钥，通过调用阿里云的OCR API接口进行请求，具体可以参考阿里云提供的文档或SDK示例代码。在调用接口时，您需要将待识别的图片上传并传递给接口，同时指定要识别的关键字。

参考文档：RecognizeAdvanced – 全文识别高精版

解析API响应：获取API的响应结果，在响应结果中会包含关键字的坐标信息，您可以从中提取出需要的信息。
已喜欢已反对

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？[阿里云OCR] 暂停朗读为您朗读

文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？[阿里云OCR]