dataworks离线数据集成，源库或目标库是MC时，走的是Tunnel？还是走的是datax啊?[阿里云]

dataworks离线数据集成，源库或目标库是MC时，走的是Tunnel？还是走的是datax啊?

以下为热心网友提供的参考意见

在阿里云DataWorks中，当进行离线数据集成任务且源库或目标库是MaxCompute（MC）时，会使用DataX作为基础的数据同步工具。关于Tunnel和DataX的使用场景：

MaxCompute原生提供了Tunnel服务，它主要用于高效地进行大规模数据的上传和下载操作，提供了一种与Hadoop类似的文件系统接口来访问MaxCompute表数据。
DataWorks中的离线数据集成服务基于开源的DataX工具进行了深度定制和优化，支持多种异构数据源之间的数据迁移。对于MaxCompute作为源库或目标库的任务，DataWorks可能不是直接调用Tunnel API，而是通过封装DataX的MaxCompute Reader/Writer插件来实现数据读写功能，这样可以更好地适应复杂的数据集成需求，并利用DataX提供的稳定性和可靠性。

因此，在DataWorks中进行MaxCompute与其他数据源之间的离线数据集成时，实际上是通过DataX来完成数据同步工作，而非直接使用Tunnel。

以下为热心网友提供的参考意见

DataWorks数据集成在离线同步场景下支持各种类型和网络环境下的数据同步，包括数据库、数仓、NoSQL数据库、文件存储、消息队列等近50多种不同异构数据源之间的数据同步。当源库或目标库是MC时，DataWorks离线数据集成会通过DataX这个阿里云 DataWorks数据集成的开源版本来进行数据的读取和写入。DataX被广泛应用于阿里巴巴集团内，实现了多种异构数据源之间高效的数据同步功能。因此，源库或目标库是MC时，走的是DataX而非Tunnel。

以下为热心网友提供的参考意见

离线是datax 底层实际是执行的tunnel ，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

dataworks离线数据集成，源库或目标库是MC时，走的是Tunnel？ 还是走的是datax啊?[阿里云]

dataworks离线数据集成，源库或目标库是MC时，走的是Tunnel？还是走的是datax啊?[阿里云]