机器学习PAI用swing跑的时间久么?我自己实现的spark都跑不动[阿里云机器学习PAI]

机器学习PAI用swing跑的时间久么?我自己实现的spark都跑不动

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
3 条回复 A 作者 M 管理员
  1. 机器学习的计算需要大量的计算资源和时间来训练模型,如果您的数据集非常大,或者您的机器配置不足以支持训练模型,则可能会导致训练时间非常长或甚至无法运行。

    同时,基于 Spark 的机器学习框架也需要一个相当大的集群才能更好地进行分布式计算,如果您的集群配置不佳或者数据规模比较大,那么您可能需要进行一些优化,例如将输入数据缩小到必要的范围、优化算法并调整其他参数等等。

    最终,我建议您评估您的算法和数据,考虑更好的硬件配置或使用更适合您数据的算法来获得更好的结果。

  2. 机器学习PAI使用的是阿里云的PAI平台,其中包含了高性能的计算资源和优化的分布式计算框架,因此相比较于自己实现的Spark等并行计算框架,可能运行速度更快一些。但是具体的运行时间取决于数据集大小、模型复杂度以及所使用的算法等多个因素,不同的任务可能有不同的表现。同时,Swing是一种基于Java的GUI工具包,主要用于开发桌面应用程序,与机器学习PAI的运行效率关系不大。

  3. PAI(Platform of AI)是阿里云提供的一种人工智能开发平台,提供了多种机器学习和深度学习框架的支持,其中包括了 Spark、TensorFlow 等。

    PAI 提供了一种无需配置复杂环境的快速体验方式,即使用 Jupyter Notebook 来编写和运行机器学习程序。同时,PAI 还提供了一种基于 Swing UI 的可视化交互式开发环境,称之为 PAI Swing。

    PAI Swing 提供了类似 Jupyter Notebook 的交互式编程方式,但使用了类似于 IDE 的界面。相比于 Jupyter Notebook,PAI Swing 的优点在于其更加适合开发和调试较大规模的机器学习项目,而且不需要太多的配置和管理。

    至于你提到的 Spark 在自己的机器上跑不动的问题,可能和环境配置有关。Spark 的运行需要一定的内存和计算资源,还需要配置一些环境变量和参数。如果配置不当,就容易出现运行缓慢或者无法运行的情况。

  4. 不久,我们在实际业务场景中,跑的也不久,user最大的点击序列长度、item的user序列长度一般设置500,600这样,此回答整理自钉群“【EasyRec】推荐算法交流群”