数据开发与运行如何在pyodps调用第三方包?[阿里云DataWorks]

数据开发与运行如何在pyodps调用第三方包?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
2 条回复 A 作者 M 管理员
  1. 可以按照以下步骤进行:

    1、将第三方包上传至DataWorks。

    可以将第三方包上传至DataWorks的文件系统中,或者上传至阿里云对象存储(OSS)中,然后通过DataWorks中的“数据集成”功能进行读取。

    2、安装第三方包。

    在pyodps代码中,可以使用pip命令或者其他常用Python包管理工具,在DataWorks使用Jupyter Notebook新建一个空白的代码框,运行以下命令,安装第三方包:

    !pip install -U 包名 -t 安装路径

    其中,“-U”表示升级安装包,“-t”表示指定安装路径,可以根据自己实际需要修改。安装完成后,可以通过以下命令查看已安装的包:

    !pip list

    3、在pyodps代码中引用第三方包。

    在安装第三方包后,可以在pyodps代码中使用import命令引用已安装的包。例如,如果要使用pandas包,可以在pyodps代码中添加以下代码:

    import pandas as pd

  2. 需要使用独享调度资源组进行操作,详情请参考文档:在PyODPS节点中调用第三方包 https://help.aliyun.com/document_detail/99295.html 此回答整理自钉群“DataWorks交流群(答疑@机器人)”

  3. 楼主你好,看一下这个大概步骤流程: 1、进入数据开发页面,登录DataWorks控制台。 2、创建Python资源。 3、创建PyODPS 2节点。 4、打开PyODPS 2节点的编辑页面,右键单击目标Python资源名称,选择引用资源。 5、在PyODPS 2节点内输入引用第三方包的代码。 6、最后运行,运行日志区域查看结果。