tongchenkeji 发表于:2023-6-27 11:16:000次点击 已关注取消关注 关注 私信 哈喽,文档智能的OCR 表格识别,这里Python怎么能直接获取excel结果导出呢?![阿里云云效] 暂停朗读为您朗读 哈喽,文档智能的OCR 表格识别,这里Python怎么能直接获取excel结果导出呢? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 阿里云云效# Python483# 文字识别1940
xin在这AM 2023-11-28 8:17:53 1 用这个ocr https://market.aliyun.com/products/57124001/cmapi024968.html?spm=5176.730005.result.10.7676352437vFoX&innerSource=search_%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB#sku=yuncode1896800000 ,此回答整理自钉群“【官方】阿里云文档智能客户交流群”
一位隐者AM 2023-11-28 8:17:53 2 阿里云云效的文档智能OCR表格识别功能可将图片中的表格内容转换为结构化数据。你可以通过以下步骤使用Python将识别结果导出到Excel: 首先,确保你已经安装了相应的 Python 包,包括 Aliyun Python SDK 和 openpyxl。 在你的 Python 代码中导入必要的库和模块: import jsonfrom aliyunsdkcore import clientfrom aliyunsdkocr.request.v20191230 import RecognizeTableOCRRequestfrom openpyxl import Workbook 创建阿里云 OCR 客户端对象,并设置 API 访问凭据: clt = client.AcsClient( "your_access_key_id", "your_access_key_secret", "your_region_id" # 如:cn-shanghai) 构造 OCR 请求并调用接口进行表格识别: req = RecognizeTableOCRRequest.RecognizeTableOCRRequest()req.set_ImageURL("your_image_url") # 图片的 URLreq.set_OutputType("excel") # 输出格式为 Excelreq.set_OutputFileSuffix(".xlsx") # 输出文件后缀response = clt.do_action_with_exception(req)result = json.loads(response.decode("utf-8")) 处理表格识别结果,并将其导出到 Excel 文件: wb = Workbook()ws = wb.activetables = result["Tables"]for table in tables: rows = table["Rows"] for row in rows: cells = row["Cells"] row_data = [] for cell in cells: row_data.append(cell["Text"]) ws.append(row_data)wb.save("output.xlsx") # 导出结果到 Excel 文件 在上述代码中,你需要替换 "your_access_key_id"、"your_access_key_secret" 和 "your_region_id" 分别为你的阿里云访问密钥ID、访问密钥Secret和相应的区域ID。同时,将 "your_image_url" 替换为你要识别的图片的URL。 通过以上步骤,你可以使用 Python 调用阿里云云效的文档智能OCR表格识别功能,并将识别结果导出到 Excel 文件中。
用这个ocr https://market.aliyun.com/products/57124001/cmapi024968.html?spm=5176.730005.result.10.7676352437vFoX&innerSource=search_%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB#sku=yuncode1896800000 ,此回答整理自钉群“【官方】阿里云文档智能客户交流群”
阿里云云效的文档智能OCR表格识别功能可将图片中的表格内容转换为结构化数据。你可以通过以下步骤使用Python将识别结果导出到Excel:
首先,确保你已经安装了相应的 Python 包,包括 Aliyun Python SDK 和 openpyxl。
在你的 Python 代码中导入必要的库和模块:
在上述代码中,你需要替换
"your_access_key_id"
、"your_access_key_secret"
和"your_region_id"
分别为你的阿里云访问密钥ID、访问密钥Secret和相应的区域ID。同时,将"your_image_url"
替换为你要识别的图片的URL。通过以上步骤,你可以使用 Python 调用阿里云云效的文档智能OCR表格识别功能,并将识别结果导出到 Excel 文件中。