=====这是一个广告位,招租中,联系qq 78315851====
2 条回复 A 作者 M 管理员
  1. OSS数据源为您提供读取和写入OSS的双向通道,本文为您介绍DataWorks的OSS数据同步的能力支持情况。https://help.aliyun.com/zh/dataworks/user-guide/oss-data-source?spm=a2c4g.11186623.0.i179
    OSS Reader实现了从OSS读取数据并转为数据集成协议的功能,OSS本身是无结构化数据存储。对于数据集成而言,OSS Reader支持的功能如下。

  2. 是的,DataWorks支持使用OSS Reader ORC或Parquet文件读取OSS中的数据。OSS Reader ORC和Parquet文件是两种常见的大容量存储格式,可以提高读取速度和效率。这两种格式都是基于列式存储,而不是行式存储,从而节省磁盘空间并加快查询速度。以下是使用这两种格式读取OSS数据的基本步骤:

    1. 在DataWorks中配置OSS Reader ORC或Parquet格式的读取参数。
    2. 将数据写入OSS,使其符合上述格式的要求。
    3. 启动任务,使用上述格式读取数据。