dsw实例无法启动,卡在准备环境很久,然后显示以失败,求救[阿里云机器学习PAI]

Creating DswInstance timeout, pod event is (combined from similar events): Unable to attach or mount volumes: unmounted volumes=[dsw-24614-0], unattached volumes=[default-token-2bpnm host-data-volume tmp shm overlay dsw-env dsw-24614-0 log dsw-logs]: timed out waiting for the condition这是报错代码

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
1 条回复 A 作者 M 管理员
  1. 这个错误提示是创建DswInstance超时导致的。其中包含了无法挂载卷的问题。原因可能是资源不足或者网络不稳定。你可以尝试以下几个解决方法:

    1、检查你的资源是否充足,包括CPU、内存和存储空间等。如果不足,可以扩容资源。

    2、检查网络是否稳定,如果网络不稳定,可以更换网络环境。

    3、检查卷是否正确挂载,可以在Pod中执行kubectl describe pod 命令查看详细信息,检查卷是否正确挂载。

    /4可以尝试在创建DswInstance的时候添加–wait参数,让API等待资源可用再创建。

  2. 这个错误表示 Kubernetes 在等待 pod 中的 PVC 或 PV 挂载时超时,导致 pod 创建失败。

    一些常见的原因包括:

    1. 确保容器没有试图挂载不存在的 PVC 或 PV 。如果挂载的 PVC 或 PV 不存在,则 pod 将无法正确启动并且失败。

    2. 检查你的 PVC 和 PV 是否设置正确。确保 PV 中的存储类和 PVC 中的存储类相匹配,并且 PVC 的访问模式与 PV的访问模式相匹配。

    3. PVC 可以占用和钩子。请检查您的 PVC 定义,确保 volumeMounts 段中没有钩子或占用。

    4. 检查 Kubernetes 组件是否正在运行。如果 Kubernetes 组件未运行,则将无法正确部署 pod。请检查 kube-apiserver、kube-controller-manager 和 kube-scheduler 是否正在运行。

    5. 检查节点是否可用,容量是否充足。如果节点的可用存储空间不足,容器无法正确挂载 PVC 或 PV 。请确保分配给节点的存储空间足够容纳 pod 中的 PVC,也可以尝试清除节点上的一些资源以腾出空间。