DataWorks怎么读取ElasticSearch索引中的_id?[阿里云DataWorks]

DataWorks怎么读取ElasticSearch索引中的_id?

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

1 条回复 A 作者 M 管理员

叶秋学长AM 2023-11-27 21:10:27 1
在DataWorks中，您可以使用ODPS writer来读取Elasticsearch索引中的_id。具体来说，您需要在ODPS writer的配置中指定Elasticsearch索引的名称和字段名称，以便ODPS writer能够正确地读取Elasticsearch索引中的_id。例如，您可以在ODPS writer的配置中添加以下内容：

{ "access_key_id": "your_access_key_id", "access_key_secret": "your_access_key_secret", "project_name": "your_project_name", "table_name": "your_table_name", "endpoint": "http://your_endpoint", "index_name": "your_index_name", "type_name": "your_type_name", "field_names": [ "id", "name", "age" ]}

在上面的配置中，"index_name"参数指定了Elasticsearch索引的名称，"type_name"参数指定了Elasticsearch索引中的数据类型，"field_names"参数指定了需要读取的Elasticsearch字段的名称。在ODPS writer读取Elasticsearch索引中的数据时，它会将_id字段解析为ODPS表中的"ID"字段，将其他字段解析为ODPS表中对应的字段。总之，您可以使用ODPS writer来读取Elasticsearch索引中的_id，只需要在ODPS writer的配置中指定Elasticsearch索引的名称和字段名称即可。
已喜欢已反对

Elasticsearch Reader会获取Server端shard信息用于数据同步，需要确保在任务同步中Server端的shards处于存活状态，否则会存在数据不一致风险。

基本配置：


{    "order":{        "hops":[            {                "from":"Reader",                "to":"Writer"            }        ]    },    "setting":{        "errorLimit":{            "record":"0" //错误记录数。        },        "jvmOption":"",        "speed":{            "concurrent":3,//并发数            "throttle":true,//                     "mbps":"12",//限流        }    },    "steps":[        {            "category":"reader",            "name":"Reader",            "parameter":{                "column":[ //读取列。                    "id",                    "name"                ],                "endpoint":"", //服务地址。                "index":"",  //索引。                "password":"",  //密码。                "scroll":"",  //scroll标志。                "search":"",  //查询query参数，与Elasticsearch的query内容相同，使用_search api，重命名为search。                "type":"default",                "username":""  //用户名。            },            "stepType":"elasticsearch"        },        {            "stepType": "elasticsearch",            "parameter": {                "column": [ //写入列                    {                        "name": "id",                        "type": "integer"                    }，                    {                        "name": "name",                        "type": "text"                    }                ],                "index": "test",   //写入索引                 "indexType": "",   //写入索引类型，es7不填                "actionType": "index",  //写入方式                "cleanup": false,         //是否重建索引                "datasource": "test",   //数据源名称                "primaryKeyInfo": {     //主键取值方式                    "fieldDelimiterOrigin": ",",                    "column": [                        "id"                    ],                    "type": "specific",                    "fieldDelimiter": ","                },                "dynamic": false,  //动态映射                "batchSize": 1024   //批量写文档数            },            "name": "Writer",            "category": "writer"        }    ],    "type":"job",    "version":"2.0" //版本号。}

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DataWorks怎么读取ElasticSearch索引中的_id?[阿里云DataWorks] 暂停朗读为您朗读

DataWorks怎么读取ElasticSearch索引中的_id?[阿里云DataWorks]