在DataWorks上使用PyODPS执行SQL？[阿里云DataWorks]

在DataWorks上使用PyODPS执行SQL？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

2 条回复 A 作者 M 管理员

Star时光AM 2023-11-27 21:05:56 1
是的，您可以在DataWorks上使用PyODPS执行SQL。PyODPS是阿里云MaxCompute（原名ODPS）的Python SDK，它提供了与MaxCompute交互的功能。

以下是在DataWorks上使用PyODPS执行SQL的一般步骤：

创建MaxCompute数据开发节点：在DataWorks中创建一个MaxCompute数据开发节点，用于编写和执行PyODPS代码。

编写PyODPS代码：在MaxCompute数据开发节点中，使用PyODPS编写需要执行的SQL语句。例如，您可以使用odps包导入PyODPS，并使用odps.sql模块构建和执行SQL语句。

运行PyODPS代码：保存并提交PyODPS代码，然后运行该作业。DataWorks将启动一个MaxCompute作业来执行您的SQL语句。

查看结果：一旦作业运行完成，您可以在DataWorks中查看作业的执行结果、日志和统计信息。

注意事项：

在DataWorks中使用PyODPS之前，需要先将MaxCompute项目与DataWorks项目进行关联。

您需要在DataWorks中配置MaxCompute的访问权限，以便在PyODPS代码中进行连接和操作。

在编写PyODPS代码时，确保引入所需的模块和库，并按照PyODPS的语法和规范进行编码。

请参考阿里云DataWorks文档中的相关章节和示例，以获取更详细的操作指南和示例代码。

阿里云DataWorks文档：https://help.aliyun.com/product/45325.html
已喜欢已反对
xin在这AM 2023-11-27 21:05:56 2

您可以在PyODPS节点中执行SQL，详情请参见SQL。Dataworks上默认未开启instance tunnel，即instance.open_reader默认使用Result接口（最多一万条记录）。您可以通过reader.count获取记录数。如果您需要迭代获取全部数据，则需要关闭limit限制。您可以通过下列语句在全局范围内打开Instance Tunnel并关闭
limit限制。
options.tunnel.use_instance_tunnel = Trueoptions.tunnel.limit_instance_tunnel = False # 关闭limit限制，读取全部数据。with instance.open_reader() as reader:# 通过Instance Tunnel可读取全部数据。您也可以通过在open_reader上添加tunnel=True，实现仅对本次open_reader开启instance tunnel。同时，您还可以添加 limit=False，实现仅对本次关闭limit限制。
with instance.open_reader(tunnel=True, limit=False) as reader:# 本次open_reader使用Instance Tunnel接口，且能读取全部数据。说明若您未开启Instance Tunnel，可能导致获取数据格式错误，解决方法请参见Python SDK。
https://help.aliyun.com/document_detail/90444.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

已喜欢已反对

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

在DataWorks上使用PyODPS执行SQL？[阿里云DataWorks] 暂停朗读为您朗读

在DataWorks上使用PyODPS执行SQL？[阿里云DataWorks]