DataWorks首次数据同步全量到maxcompute，如何重新写到数据原本的业务日期的分区？[阿里云MaxCompute]

DataWorks首次数据同步全量到maxcompute，如何重新写到数据原本的业务日期的分区？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

2 条回复 A 作者 M 管理员

Star时光AM 2023-11-27 17:59:04 1
在初次使用DataWorks从Hive向MaxCompute进行全量同步时，可以选择指定一个初始日期作为全量的时间边界，并将该日期前后的数据分别写入不同的分区，具体步骤如下：

创建一个脚本文件，使用MapReduce函数实现对Hive表中的数据进行分桶操作，并根据业务日期字段划分不同的桶，分别写入MaxCompute的不同分区。

将上述脚本文件提交给DataWorks进行调度执行，实现全量数据同步至MaxCompute的目标分区。

设置定时任务，定期执行该脚本文件，实现增量数据同步，并自动将新的增量数据写入正确的MaxCompute分区。
已喜欢已反对
sun20AM 2023-11-27 17:59:04 2
当您首次使用DataWorks将数据全量同步到MaxCompute后，如果希望重新写到数据原本的业务日期的分区，您可以按照以下步骤操作：

在DataWorks数据开发任务中，首先删除原有的同步节点。

根据您的业务需求，重新配置数据源和目标表信息。确保目标表中的分区字段与您的业务日期分区相匹配。

添加一个新的同步节点，并设置相关参数，如数据过滤条件、数据转换等。

提交并运行该数据开发任务，确保数据正确同步到MaxCompute的相应分区中。

在整个过程中，建议您仔细检查每一步的配置，确保数据的完整性和准确性。如果遇到问题，可以随时查看任务运行日志以获取更多详细信息。
已喜欢已反对

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

DataWorks首次数据同步全量到maxcompute，如何重新写到数据原本的业务日期的分区？[阿里云MaxCompute] 暂停朗读为您朗读

DataWorks首次数据同步全量到maxcompute，如何重新写到数据原本的业务日期的分区？[阿里云MaxCompute]