OCR不能以表格输出啊?{ “RequestId”: “198E71AD-6549-5A62-B445-3F72CAA26880”, “Data”: “{“algo_version”:”05ee8bc73efd541d3b5b851196091e8491d7731f”,”angle”:0,”content”:”中学附属初中19~20学年度班级课表 三中附中 1 初二3 9月1日启用 星期 星期一 – 星期二 星期三 星期四 星期五 节次 上 1 07:40 语文 数学 语文 英语 历史 08:20 喜辉 彩霞 喜辉 刘燕 嘉嵩 08:30 生物 地理 语文 数学 语文 2 09:10 品青 晓明 喜辉 彩霞 喜辉 09:20 数学 政治 数学 地理 数学 3 10:00 彩霞 艳媚 彩霞 晓明 彩霞 10:25 物理 语文 英语 语文 口语 4 11:05 吕学武 喜辉 刘燕 喜辉 外教、刘燕 11:15 英语 英语 音乐 美术 英语 午 5 11:55 刘燕 刘燕 马丽丽 海发 刘燕 02:30 数学 物理 生物 政治 体育 下 6 03:10 彩霞 吕学武 陈品青 艳媚 上冲 03:25 历史 信息 物理 数学 物理 7 04:05 嘉嵩 杨依 吕学武 彩霞 吕学武 午 8 04:15 班会 课活 体育 体活 科活 04:55 上冲 “,”height”:528,”orgHeight”:528,”orgWidth”:825,”prism_tablesInfo”:[{“cellInfos”:[{“pos”:[{“x”:5,”y”:7},{“x”:811,”y”:10},{“x”:813,”y”:91},{“x”:5,”y”:93}],”tableCellId”:0,”word”:”中学附属初中19~20学年度班级课表三中附中1初二39月1日启用”,”xec”:7,”xsc”:0,”yec”:0,”ysc”:0},{“pos”:[{“x”:5,”y”:93},{“x”:242,”y”:92},{“x”:242,”y”:139},{“x”:5,”y”:140}],”tableCellId”:1,”word”:”星期节次”,”xec”:2,”xsc”:0,”yec”:1,”ysc”:1},{“pos”:[{“x”:242,”y”:92},{“x”:356,”y”:92},{“x”:356,”y”:139},{“x”:242,”y”:139}],”tableCellId”:2,”word”:”星期一-“,”xec”:3,”xsc”:3,”yec”:1,”ysc”:1},{“pos”:[{“x”:356,”y”:92},{“x”:469,”y”:92},{“x”:469,”y”:139},{“x”:356,”y”:139}],”tableCellId”:3,”word”:”星期二”,”xec”:4,”xsc”:4,”yec”:1,”ysc”:1},{“pos”:[{“x”:469,”y”:92},{“x”:583,”y”:92},{“x”:583,”y”:139},{“x”:469,”y”:139}],”tableCellId”:4,”word”:”星期三”,”xec”:5,”xsc”:5,”yec”:1,”ysc”:1},{“pos”:[{“x”:583,”y”:92},{“x”:698,”y”:92},{“x”:698,”y”:139},{“x”:583,”y”:139}],”tableCellId”:5,”word”:”星期四”,”xec”:6,”xsc”:6,”yec”:1,”ysc”:1},{“pos”:[{“x”:698,”y”:92},{“x”:813,”y”:91},{“x”:813,”y”:140},{“x”:698,”y”:139}],”tableCellId”:6,”word”:”星期五”,”xec”:7,”xsc”:7,”yec”:1,”ysc”:1},{“pos”:[{“x”:5,”y”:140},{“x”:78,”y”:140},{“x”:78,”y”:377},{“x”:5,”y”:378}],”tableCellId”:7,”word”:”上午”,”xec”:0,”xsc”:0,”ye
OCR不能以表格输出啊?[阿里云OCR]
「点点赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!
OCR 技术可以识别各种类型的文本内容,包括表格数据。在 OCR 识别后,可以将结果按照表格格式输出,以方便后续处理和分析。
一般情况下,OCR 表格输出有以下几种方式:
表格识别:OCR 服务可以自动识别图像中的表格结构,并将其中的文本、数字等信息转换为可编辑的表格格式。例如,将一个 Excel 表格的内部内容通过 OCR 技术进行识别,并输出为标准的 Excel 文件格式。
文本识别:如果 OCR 技术无法自动识别表格结构,也可以将表格文本内容直接识别为纯文本形式,并输出为 CSV、TXT 等格式的文件。这种方式虽然不具备表格的格式和样式,但可以保留原始数据的完整性和数据字段信息。
API 输出:对于一些使用 OCR API 的应用程序,可以通过编程方式将 OCR 识别结果输出为 JSON、XML 等格式的数据流,以便其他系统进行解析和利用。这种方式需要根据相应的 API 接口和开发文档进行相应的编码和调用。
需要注意的是,在 OCR 表格输出时,需要考虑到识别精度、表格结构复杂性等多个因素,并根据实际需求进行选择和调整。同时,也需要在进行数据处理和分析时,仔细核实输出结果的正确性和完整性,以确保数据的准确性和可靠性。
OCR技术可以以表格输出,但是要求原始图像的质量比较高,且表格内部分格线清晰,文字内容清晰、整齐、规整。如果图像质量不高或者表格中有错位、不规则格线,那么表格内的文字可能会被识别错误,并不适合以表格输出。另外,对于复杂的表格结构,需要进行表格分析和识别的难度也相对较高。因此,在使用OCR技术进行表格识别时,需要具备一定的图像处理和分析能力,并使用专门的OCR表格识别技术和工具。同时,根据表格的特点和需求,需要选择合适的输出方式。例如,对于一些简单的表格,可以直接将识别结果以表格形式输出;对于一些复杂的表格,可以将识别结果以XML或JSON等数据格式进行输出,以便进行后续的数据处理和分析。
可以用这个接口测试 https://market.aliyun.com/products/57124001/cmapi024968.html?spm=5176.730005.result.10.76da3524bNilZ5&innerSource=search_%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB#sku=yuncode1896800000,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”