qwen-vl-chat模型可以传入多张图片吗?

如下图中的红框位置,本人使用的是官方的demo代码,除了单张本地图片和图片url可以传入,可以传入【多张图片】进行图像识别吗?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
1 条回复 A 作者 M 管理员
  1. Qwen-VL-Chat 模型目前并不支持一次处理多张图片的功能。
    该模型仅支持一次处理一张图片,并且只能返回该图片的一份文本描述。如果您想同时处理多张图片,那么您需要多次调用该模型,并分别对每张图片进行处理。
    当然,您也可以考虑自己编写一些自定义代码来处理这种情况。例如,您可以编写一段 Python 代码,将所有图片合并成一张大图,然后再将其传递给 Qwen-VL-Chat 模型进行处理。

  2. 不可以。目前 qwen-vl-chat 模型不支持传入多张图片进行图像识别。根据官方文档,该模型仅支持传入单张本地图片或图片 URL。如果你需要进行多张图片的图像识别,