请问用python自定义maxcompute中的udf函数,比如现在有10条数据, __init__方法是函数调用的时候整体初始化一遍,还是每条数据进入的时候都初始化一遍,初始化10遍,还是以分发机器的个数为准,比如分发了2个机器,初始化2遍。
请问用python自定义maxcompute中的udf函数怎么用呢?[阿里云DataWorks]
「点点赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!
请问用python自定义maxcompute中的udf函数,比如现在有10条数据, __init__方法是函数调用的时候整体初始化一遍,还是每条数据进入的时候都初始化一遍,初始化10遍,还是以分发机器的个数为准,比如分发了2个机器,初始化2遍。
在MaxCompute中,您可以使用Python编写自定义函数(UDF)来实现您的业务逻辑。以下是一个简单的Python UDF示例,它接受一个字符串参数,返回字符串的长度:
在上述代码中,odps.udf 是MaxCompute Python UDF的Python库。 @dps.udf(“bigint->bigint”) 表示这是一个接受一个字符串参数并返回一个整数值的UDF。
“这里咨询看下哈 MaxCompute(ODPS)钉钉交流群: https://h5.dingtalk.com/invite-page/index.html?bizSource=source&corpId=dingb682fb31ec15e09f35c2f4657eb6378f&inviterUid=E3F28CD2308408A8&encodeDeptId=0054DC2B53AFE745此回答整理自钉群“DataWorks0群已满,新群请看群公告””