ocr介绍里有分栏输出的介绍，不知道那个接口，可否试用下？[阿里云OCR]

ocr介绍里有分栏输出的介绍，不知道那个接口，可否试用下？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

3 条回复 A 作者 M 管理员

一位隐者AM 2023-11-28 3:33:39 1
阿里云OCR提供了“表格文字识别”接口，可以实现对表格类文档的识别，并支持输出分栏结果。您可以通过以下步骤来试用该功能：

在阿里云控制台中开通阿里云OCR服务，并获取AccessKey ID和AccessKey Secret。

调用“表格文字识别”接口，传入待识别的图片或PDF文件，并设置识别参数（如语言、表格边框检测等），在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数，表示需要输出分栏结果。

接口返回的JSON格式结果中，每个单元格的内容将按照分栏结果进行组织，并在每个单元格对象中添加“split_words”字段，表示该单元格的分栏结果。如果某行或某列没有分栏，则该字段的值为null。

注意事项：

“表格文字识别”接口仅能识别表格类文档，而且要求表格边框比较明显，否则可能会影响识别效果。

分栏结果的数量受到多种因素的影响，如表格布局、字体大小、单元格内容等，因此具体情况需根据实际情况而定。

分栏结果仅适用于表格类文档，不适用于一般的文本识别场景。
已喜欢已反对
魏红斌AM 2023-11-28 3:33:39 2

阿里云的OCR服务支持分栏输出功能，您可以通过以下接口进行使用：

使用阿里云OSS SDK调用OSS API，获取OCR识别结果。使用阿里云API调用OCR服务API，获取OCR识别结果。

已喜欢已反对

您好，阿里云OCR（Optical Character Recognition）提供了多个接口，其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍：

接口名称：ocr_table_recognize
功能描述：支持表格识别和指定区域文字识别，可输出分栏结果。
请求方式：HTTP POST
请求参数：

参数名	类型	是否必填	描述
image	binary	是	图像二进制数据，需base64编码
output_prob	boolean	否	是否返回单字符置信度信息，默认为false
output_keypoints	boolean	否	是否返回单字位置信息，默认为false
min_size	integer	否	指定表格中文字最小高度，默认10
table_border_confidence	float	否	表格边界置信度阈值，默认0.5
form_content_confidence	float	否	表格内容行置信度阈值，默认0.5
cell_content_confidence	float	否	表格单元格置信度阈值，默认0.5

返回参数：

参数名	类型	描述
request_id	string	请求ID
result	object	识别结果

在请求中设置output_keypoints为true，则result中的单字位置信息会被返回，从而实现分栏输出的功能。

在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret，以便进行API请求。

xin在这AM 2023-11-28 3:33:39 4

分栏输出也还不能把上面那张图片的2列分开，此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

已喜欢已反对

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ocr介绍里有分栏输出的介绍，不知道那个接口，可否试用下？[阿里云OCR] 暂停朗读为您朗读

ocr介绍里有分栏输出的介绍，不知道那个接口，可否试用下？[阿里云OCR]