tongchenkeji 发表于:2023-5-14 20:06:250次点击 已关注取消关注 关注 私信 在机器学习PAI里可以接入clickhouse作为数据源吗?[阿里云机器学习PAI] 暂停朗读为您朗读 在机器学习PAI里可以接入clickhouse作为数据源吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 机器学习PAI# 云数据库 ClickHouse98# 人工智能平台 PAI1410# 机器学习深度学习1219
wljslmzAM 2023-11-28 2:42:31 1 可以的。 阿里云机器学习PAI支持通过MaxCompute或DataWorks接入ClickHouse作为数据源,具体步骤如下: 登录阿里云机器学习控制台,创建一个MaxCompute项目或者DataWorks工作流。 在MaxCompute或者DataWorks中创建一个ClickHouse数据源,并配置相应的连接信息。 在PAI中创建一个数据源,并将该数据源绑定到MaxCompute或DataWorks中的ClickHouse数据源上。 在PAI的数据开发工作区中,您就可以使用ClickHouse作为数据源,进行数据处理和机器学习的任务。 在使用ClickHouse作为数据源时,需要确保ClickHouse与PAI之间的网络连接是通畅的,并且需要注意ClickHouse的数据安全和隐私保护。
圆不溜秋的小猫猫AM 2023-11-28 2:42:31 2 这个好像没支持,现在离线是本地文件,hdfs, oss, MaxCompute,实时的话开源的有kafka,阿里云上的datahub这些,clickhouse好像还不支持,你是离线场景吗?此回答整理自钉群:“【EasyRec】推荐算法交流群”
可以的。
阿里云机器学习PAI支持通过MaxCompute或DataWorks接入ClickHouse作为数据源,具体步骤如下:
登录阿里云机器学习控制台,创建一个MaxCompute项目或者DataWorks工作流。
在MaxCompute或者DataWorks中创建一个ClickHouse数据源,并配置相应的连接信息。
在PAI中创建一个数据源,并将该数据源绑定到MaxCompute或DataWorks中的ClickHouse数据源上。
在PAI的数据开发工作区中,您就可以使用ClickHouse作为数据源,进行数据处理和机器学习的任务。
在使用ClickHouse作为数据源时,需要确保ClickHouse与PAI之间的网络连接是通畅的,并且需要注意ClickHouse的数据安全和隐私保护。
这个好像没支持,现在离线是本地文件,hdfs, oss, MaxCompute,实时的话开源的有kafka,阿里云上的datahub这些,clickhouse好像还不支持,你是离线场景吗?此回答整理自钉群:“【EasyRec】推荐算法交流群”