tongchenkeji 发表于:2023-4-18 23:29:400次点击 已关注取消关注 关注 私信 人脸人体视频活体检测视频活体检测这个坐标是 视频第一帧的坐标吗?[视觉智能开放平台] 暂停朗读为您朗读 人脸人体视频活体检测视频活体检测这个坐标是 视频第一帧的坐标吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 视觉智能开放平台# 视觉智能开放平台3859
wljslmzAM 2023-11-28 8:11:32 1 阿里云视觉智能开放平台人脸人体视频活体检测API返回的坐标是相对于视频帧的坐标,具体是相对于视频帧左上角的原点的坐标。每个坐标点用一个矩形框表示,矩形框的位置由左上角的横纵坐标和矩形框的宽高组成,表示一个矩形区域。每个矩形框的坐标信息都是一个数组,依次表示:左上角坐标X值、左上角坐标Y值、矩形框宽度、矩形框高度。 在进行视频活体检测时,如果视频中存在多个目标人脸或人体,则 API 分别返回每个目标的坐标信息。具体来说,如果您使用视频活体检测API处理的是一段视频,则该视频的所有帧都会被分别处理,每帧都会返回检测结果。如果您需要在视频中定位每个目标人脸或人体的位置,则需要根据API返回的结果信息,在视频中匹配并定位每个目标的位置。
xin在这AM 2023-11-28 8:11:32 2 可以这么理解,检测出人脸的位置,当视频中出现多个人脸时,对画面中面积最大的人脸进行判断进行人脸位置的检测返回位置坐标,此回答整理自钉群“阿里云视觉智能开放平台咨询1群”
阿里云视觉智能开放平台人脸人体视频活体检测API返回的坐标是相对于视频帧的坐标,具体是相对于视频帧左上角的原点的坐标。每个坐标点用一个矩形框表示,矩形框的位置由左上角的横纵坐标和矩形框的宽高组成,表示一个矩形区域。每个矩形框的坐标信息都是一个数组,依次表示:左上角坐标X值、左上角坐标Y值、矩形框宽度、矩形框高度。
在进行视频活体检测时,如果视频中存在多个目标人脸或人体,则 API 分别返回每个目标的坐标信息。具体来说,如果您使用视频活体检测API处理的是一段视频,则该视频的所有帧都会被分别处理,每帧都会返回检测结果。如果您需要在视频中定位每个目标人脸或人体的位置,则需要根据API返回的结果信息,在视频中匹配并定位每个目标的位置。
可以这么理解,检测出人脸的位置,当视频中出现多个人脸时,对画面中面积最大的人脸进行判断进行人脸位置的检测返回位置坐标,此回答整理自钉群“阿里云视觉智能开放平台咨询1群”