云环境奇东Stable Diffusion服务失败[阿里云服务器]

按照部署Stable Diffusion玩转AI绘画 的实验手册,安装stable diffusion服务

执行到命令:
python launch.py –listen –skip-torch-cuda-test

显示报错

RuntimeError: The NVIDIA driver on your system is too old (found version 11040). Please update your GPU driver by downloading and installing a new version from the URL: http://www.nvidia.com/Download/index.aspx Alternatively, go to: https://pytorch.org to install a PyTorch version that has been compiled with your version of the CUDA driver.

这里应该是ECS实例中的gpu driver版本不够导致的,但是没有很方便的方式去更新实例上的gpu驱动。需要实验室提供驱动下载,或者升级实验室ecs中的nvidia驱动、cuda的版本

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
4 条回复 A 作者 M 管理员
  1. 这个错误消息表示您的NVIDIA驱动程序版本过旧(找到版本11040)。您需要通过从URL:http://www.nvidia.com/Download/index.aspx 下载并安装新版本来更新GPU驱动程序。或者,转到:https://pytorch.org 安装与CUDA驱动程序版本匹配的PyTorch版本。
    为了更新驱动程序,您可以尝试以下步骤:

    1. 访问NVIDIA官方网站(http://www.nvidia.com),在“支持”页面中查找适合您硬件的最新驱动程序。
    2. 下载并安装最新的驱动程序。
    3. 安装完成后,请重新启动计算机以完成更新。
  2. 您在尝试运行 Stable Diffusion 服务时遇到了一个错误,提示 NVIDIA 驱动版本过低。在 Amazon Web Services (AWS) 上的 Elastic Compute Service (ECS) 实例中,无法直接更新 NVIDIA 驱动版本,因为这些实例的驱动程序是预装的,并且由 AWS 管理。因此,建议您采取以下措施:

    1. 调整 ECS 实例类型:您可以选择使用更高版本的 ECS 实例,其中包含较新的 NVIDIA 驱动程序。您可以在 AWS 管理控制台中选择适当的实例类型。

    2. 使用其他计算服务:另一种解决方案是使用 AWS EC2 实例,因为 EC2 允许您选择合适的实例类型并自行安装所需的 NVIDIA 驱动程序和 CUDA 版本。这样可以确保稳定性和兼容性。

    3. 向实验室请求帮助:如果您无法自行调整或选择实例类型,建议向实验室管理员提出请求,以获取更高的 NVIDIA 驱动版本。他们可能会提供其他解决方案,例如为您分配具有更高 NVIDIA 驱动版本的 ECS 实例。

  3. 这个问题是由于你的GPU驱动版本过低导致的。你可以尝试以下几种方法来解决这个问题:

    1. 更新GPU驱动:根据错误信息中的链接,前往NVIDIA官方网站下载并安装最新的GPU驱动。注意选择适合你GPU型号的驱动版本。

    2. 更新CUDA:PyTorch在编译时会使用特定的CUDA版本。如果你当前的CUDA版本过低,可能会导致问题。你可以前往PyTorch官方网站查看支持的CUDA版本,然后下载并安装最新的CUDA版本。

    3. 使用其他版本的PyTorch:如果你当前的CUDA版本无法更新,可以尝试使用其他版本的PyTorch。有些版本的PyTorch可能已经编译好了适合你的CUDA版本的版本。你可以在PyTorch官方网站的”Releases”页面找到这些版本。

  4. 原因是torch版本和cuda不一致。

    1、查看python版本
    python –version

    2、确定torch版本
    这个是官网的,供参考:https://pytorch.org/get-started/previous-versions/

    Cuda 11.4官网上没有,11.3也可用,所以下载的11.3,对应的torch版本选1.12.1,

    推荐用国内镜像:https://mirror.sjtu.edu.cn/pytorch-wheels/cu113/?mirror_intel_list,本机器选的

    torch-1.12.1+cu113-cp310-cp310-linux_x86_64.whl,其中 cu113,支持cuda11.3; cp310,支持python3.10;

    3、下载
    推荐国内镜像,速度快,交大的:

    https://mirror.sjtu.edu.cn/pytorch-wheels/cu113/?mirror_intel_list

    wget  https://mirror.sjtu.edu.cn/pytorch-wheels/cu113/torch-1.12.1+cu113-cp310-cp310-linux_x86_64.whl6252820/article/details/134055851

    4、安装

    pip install  torch-1.12.1+cu113-cp310-cp310-linux_x86_64.whl

  5. 根据报错信息,您的系统上的NVIDIA驱动版本过旧(找到的版本为11040)。请通过以下链接下载并安装新版本的GPU驱动程序:http://www.nvidia.com/Download/index.aspx。

    另外,您可以尝试访问https://pytorch.org以获取与您的CUDA驱动程序版本兼容的PyTorch版本。