创建集群并执行作业
功能介绍
创建一个MRS集群,并在集群中提交一个作业。该接口不兼容Sahara。
支持同一时间并发创建10个集群。
使用接口前,您需要先获取如表1所示的资源信息。
资源 |
获取途径 |
---|---|
VPC |
请参见虚拟私有云《接口参考》中的操作指导。 |
子网 |
请参见虚拟私有云《接口参考》中的操作指导。 |
密钥对 |
请参见弹性云服务器《接口参考》中的操作指导。 |
区域 |
区域和可用分区信息,具体请参考终端节点。 |
服务版本信息 |
MRS目前支持MRS 2.1.1、MRS 3.0.5、MRS 3.1.0版本。 |
组件信息 |
|
URI
名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
project_id |
是 |
String |
项目编号。获取方法,请参见获取项目ID。 |
请求参数
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
cluster_version |
是 |
String |
集群版本。 取值范围:
|
cluster_name |
是 |
String |
集群名称,不允许相同。 只能由字母、数字、中划线和下划线组成,并且长度为1~64个字符。 |
master_node_num |
是 |
Integer |
Master节点数量。启用集群高可用功能时配置为2,不启用集群高可用功能时配置为1。MRS 3.x版本暂时不支持该参数配置为1。 |
core_node_num |
是 |
Integer |
Core节点数量。 取值范围:[1~500] Core节点默认的最大值为500,如果用户需要的Core节点数大于500,请申请扩大配额。 |
billing_type |
是 |
Integer |
集群的计费模式。 |
data_center |
是 |
String |
集群区域信息,具体请参考终端节点。 |
vpc |
是 |
String |
子网所在VPC名称。 通过VPC管理控制台获取名称:
在“虚拟私有云”页面的列表中即可获取VPC名称。 |
master_node_size |
是 |
String |
Master节点的实例规格,例如:c3.4xlarge.2.linux.bigdata。MRS当前支持主机规格的配型由CPU+内存+Disk共同决定。 该参数建议从MRS控制台的集群创建页面获取对应区域对应版本所支持的规格。 |
core_node_size |
是 |
String |
Core节点的实例规格,例如:c3.4xlarge.2.linux.bigdata。该参数建议从MRS控制台的集群创建页面获取对应区域对应版本所支持的规格。 |
component_list |
是 |
Array of component_list objects |
服务组件安装列表信息。具体参数请参考表4。 |
available_zone_id |
是 |
String |
可用分区ID。 |
vpc_id |
是 |
String |
子网所在VPC ID。 通过VPC管理控制台获取ID:
在“虚拟私有云”页面的列表中即可获取VPC ID。 |
subnet_id |
是 |
String |
子网ID。 通过VPC管理控制台获取子网ID:
“subnet_id”和“subnet_name”必须至少填写一个,当这两个参数同时配置但是不匹配同一个子网时,集群会创建失败,请仔细填写参数。推荐使用“subnet_id”。 |
subnet_name |
是 |
String |
子网名称。 通过VPC管理控制台获取子网名称:
“subnet_id”和“subnet_name”必须至少填写一个,当这两个参数同时配置但是不匹配同一个子网时,集群会创建失败,请仔细填写参数。当仅填写“subnet_name”一个参数且VPC下存在同名子网时,创建集群时以VPC平台第一个名称的子网为准。推荐使用“subnet_id”。 |
security_groups_id |
否 |
String |
集群安全组的ID。
|
add_jobs |
否 |
Array of add_jobs objects |
创建集群时可同时提交作业,当前版本暂时只支持新增一个作业。具体参数请参考表5。 |
volume_size |
否 |
Integer |
Master和Core节点数据磁盘存储空间。为增大数据存储容量,创建集群时可同时添加磁盘。可以根据如下应用场景合理选择磁盘存储空间大小:
取值范围:100GB~32000GB,传值只需填数字,不需要带单位GB。 不建议使用该参数,详情请参考volume_type参数的说明。 |
volume_type |
否 |
String |
Master和Core节点的磁盘存储类别,目前支持SATA、SAS、SSD和GPSSD。磁盘参数可以使用volume_type和volume_size表示,也可以使用多磁盘相关的参数表示。volume_type和volume_size这两个参数如果与多磁盘参数同时出现,系统优先读取volume_type和volume_size参数。建议使用多磁盘参数。
|
master_data_volume_type |
否 |
String |
该参数为多磁盘参数,表示Master节点数据磁盘存储类别,目前支持SATA、SAS、SSD和GPSSD。 |
master_data_volume_size |
否 |
Integer |
该参数为多磁盘参数,表示Master节点数据磁盘存储空间。为增大数据存储容量,创建集群时可同时添加磁盘。 取值范围:100GB~32000GB,传值只需填数字,不需要带单位GB。 |
master_data_volume_count |
否 |
Integer |
该参数为多磁盘参数,表示Master节点数据磁盘个数。取值只能是1。 |
core_data_volume_type |
否 |
String |
该参数为多磁盘参数,表示Core节点数据磁盘存储类别,目前支持SATA、SAS、SSD和GPSSD。 |
core_data_volume_size |
否 |
Integer |
该参数为多磁盘参数,表示Core节点数据磁盘存储空间。为增大数据存储容量,创建集群时可同时添加磁盘。 取值范围:100GB~32000GB,传值只需填数字,不需要带单位GB。 |
core_data_volume_count |
否 |
Integer |
该参数为多磁盘参数,表示Core节点数据磁盘个数。 取值范围:1~10 |
task_node_groups |
否 |
Array of task_node_groups objects |
Task节点列表信息。具体参数请参考表6。 |
bootstrap_scripts |
否 |
Array of bootstrap_script objects |
配置引导操作脚本信息。具体参数请参考表8。 |
node_public_cert_name |
否 |
String |
密钥对名称。用户可以使用密钥对方式登录集群节点。当“login_mode”配置为“1”时,请求消息体中包含node_public_cert_name字段。 |
cluster_admin_secret |
否 |
String |
配置MRS Manager管理员用户的密码。
|
cluster_master_secret |
是 |
String |
配置访问集群节点的root密码。当“login_mode”配置为“0”时,请求消息体中包含cluster_master_secret字段。 密码设置约束如下:
|
safe_mode |
是 |
Integer |
MRS集群运行模式。
|
tags |
否 |
Array of tag objects |
集群的标签信息。具体参数请参考表9
|
cluster_type |
否 |
Integer |
集群类型。
默认值为0:分析集群。 |
log_collection |
否 |
Integer |
集群创建失败时,是否收集失败日志。 默认设置为1,将创建OBS桶仅用于MRS集群创建失败时的日志收集。 枚举值:
|
enterprise_project_id |
否 |
String |
企业项目ID。 创建集群时,给集群绑定企业项目ID。 默认设置为0,表示为default企业项目。 |
login_mode |
否 |
Integer |
集群登录方式。默认设置为1。
枚举值:
|
node_groups |
否 |
Array of NodeGroupV11 objects |
节点列表信息。具体参数请参考表10。 说明:如下参数和该参数任选一组进行配置即可。 master_node_num、master_node_size、core_node_num、core_node_size、master_data_volume_type、master_data_volume_size、master_data_volume_count、core_data_volume_type、core_data_volume_size、core_data_volume_count、volume_type、volume_size、task_node_groups。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
job_type |
是 |
Integer |
作业类型码。
|
job_name |
是 |
String |
作业名称,只能由字母、数字、中划线和下划线组成,并且长度为1~64个字符。
说明:
不同作业的名称允许相同,但不建议设置相同。 |
jar_path |
否 |
String |
执行程序Jar包或sql文件地址,需要满足如下要求:
|
arguments |
否 |
String |
程序执行的关键参数,该参数由用户程序内的函数指定,MRS只负责参数的传入。 最多为150000字符,不能包含;|&>'<$特殊字符,可为空。 |
input |
否 |
String |
数据输入地址。
文件可存储于HDFS或者OBS中,不同的文件系统对应的路径存在差异。
最多为1023字符,不能包含;|&>'<$特殊字符,可为空。 |
output |
否 |
String |
数据输出地址。
文件可存储于HDFS或者OBS中,不同的文件系统对应的路径存在差异。
如果该路径不存在,系统会自动创建。 最多为1023字符,不能包含;|&>'<$特殊字符,可为空。 |
job_log |
否 |
String |
作业日志存储地址,该日志信息记录作业运行状态。
文件可存储于HDFS或者OBS中,不同的文件系统对应的路径存在差异。
最多为1023字符,不能包含;|&>'<$特殊字符,可为空。 |
shutdown_cluster |
否 |
Boolean |
作业执行完成后,是否删除集群。
|
file_action |
否 |
String |
数据导入导出。
|
submit_job_once_cluster_run |
是 |
Boolean |
此处应设置为true。 |
hql |
否 |
String |
HQL脚本语句。 |
hive_script_path |
是 |
String |
sql程序路径,仅Spark Script和Hive Script作业需要使用此参数。需要满足如下要求:
|
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
node_num |
是 |
Integer |
Task节点节点数量,取值范围0~500,Core与Task节点总数最大为500个。 |
node_size |
是 |
String |
Task节点的实例规格,例如:c6.4xlarge.4.linux.mrs。 该参数建议从MRS控制台的集群创建页面获取对应区域对应版本所支持的规格。 |
data_volume_type |
是 |
String |
Task节点数据磁盘存储类别,支持如下磁盘:
|
data_volume_count |
是 |
Integer |
Task节点数据磁盘存储数目 取值范围:0~10 |
data_volume_size |
是 |
Integer |
Task节点数据磁盘存储大小 取值范围:100GB~32000GB 传值只需填数字,不需要带单位GB。 |
auto_scaling_policy |
否 |
auto_scaling_policy object |
弹性伸缩规则信息。详细说明请参见表7。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
auto_scaling_enable |
是 |
Boolean |
当前自动伸缩规则是否开启。 |
min_capacity |
是 |
Integer |
指定该节点组的最小保留节点数。 取值范围:[0~500] |
max_capacity |
是 |
Integer |
指定该节点组的最大节点数。 取值范围:[0~500] |
resources_plans |
否 |
Array of resources_plan objects |
资源计划列表,详细说明请参见表12。若该参数为空表示不启用资源计划。 当启用弹性伸缩时,资源计划与自动伸缩规则需至少配置其中一种。 |
exec_scripts |
否 |
Array of scale_script objects |
弹性伸缩自定义自动化脚本列表。详细说明请参见表15。若该参数为空表示不启用钩子脚本。 |
rules |
否 |
Array of rules objects |
自动伸缩的规则列表,详细说明请参见表13。 当启用弹性伸缩时,资源计划与自动伸缩规则需至少配置其中一种。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
name |
是 |
String |
引导操作脚本的名称,同一个集群的引导操作脚本名称不允许相同。 只能由数字、英文字符、空格、中划线和下划线组成,且不能以空格开头。 可输入的字符串长度为1~64个字符。 |
uri |
是 |
String |
引导操作脚本的路径。设置为OBS桶的路径或虚拟机本地的路径。
|
parameters |
否 |
String |
引导操作脚本参数。 |
nodes |
是 |
Array of strings |
引导操作脚本所执行的节点类型,包含Master、Core和Task三种类型。 节点类型必须为小写字母。 |
active_master |
否 |
Boolean |
引导操作脚本是否只运行在主Master节点上。 缺省值为false,表示引导操作脚本可运行在所有Master节点上。 |
before_component_start |
否 |
Boolean |
引导操作脚本执行的时间。目前支持“组件启动前”和“组件启动后”两种类型。 缺省值为false,表示引导操作脚本在组件启动后执行。 |
fail_action |
是 |
String |
引导操作脚本执行失败后,是否继续执行后续脚本和创建集群。
缺省值为errorout,表示终止操作。
说明:
建议您在调试阶段设置为“继续”,无论此引导操作是否执行成功,则集群都能继续安装和启动。 |
action_stages |
否 |
Array of strings |
选择引导操作脚本执行的时间。
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
key |
是 |
String |
键。
|
value |
是 |
String |
值。
|
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
group_name |
是 |
String |
节点组名。
|
node_num |
是 |
Integer |
节点节点数量,配置为0,取值范围0~500,Core与Task节点总数最大为500个。 |
node_size |
是 |
String |
节点的实例规格,例如:。 该参数建议从MRS控制台的集群创建页面获取对应区域对应版本所支持的规格。 |
root_volume_size |
是 |
String |
节点系统磁盘存储大小。 |
root_volume_type |
是 |
String |
节点系统磁盘存储类别,目前支持如下磁盘:
|
data_volume_type |
是 |
String |
节点数据磁盘存储类别,目前支持如下磁盘:
|
data_volume_count |
是 |
Integer |
节点数据磁盘存储数目 取值范围:0~10 |
data_volume_size |
是 |
Integer |
节点数据磁盘存储大小 取值范围:100GB~32000GB |
auto_scaling_policy |
否 |
auto_scaling_policy object |
当“group_name”配置为“task_node_analysis_group”或“task_node_streaming_group”时该参数有效,表示弹性伸缩规则信息。详细说明请参见表11。 具体参数请参考表7。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
master_node_num |
是 |
Integer |
Master节点数量。启用集群高可用功能时配置为2,不启用集群高可用功能时配置为1。 MRS 3.x版本暂时不支持该参数配置为1。 |
master_node_size |
是 |
String |
Master节点的实例规格,例如:。MRS当前支持主机规格的配型由CPU+内存+Disk共同决定。 该参数建议从MRS控制台的集群创建页面获取对应区域对应版本所支持的规格。 |
core_node_num |
是 |
Integer |
Core节点数量。 取值范围:[1~500] Core节点默认的最大值为500,如果用户需要的Core节点数大于500,请。 |
core_node_size |
是 |
String |
Core节点的实例规格,例如:。 该参数建议从MRS控制台的集群创建页面获取对应区域对应版本所支持的规格。 |
master_data_volume_type |
否 |
String |
该参数为多磁盘参数,表示Master节点数据磁盘存储类别,目前支持SATA、SAS和SSD。 |
master_data_volume_size |
否 |
Integer |
该参数为多磁盘参数,表示Master节点数据磁盘存储空间。为增大数据存储容量,创建集群时可同时添加磁盘。 取值范围:100GB~32000GB |
master_data_volume_count |
否 |
Integer |
该参数为多磁盘参数,表示Master节点数据磁盘个数。 取值只能是1 |
core_data_volume_type |
否 |
String |
该参数为多磁盘参数,表示Core节点数据磁盘存储类别,目前支持SATA、SAS和SSD。 |
core_data_volume_size |
否 |
Integer |
该参数为多磁盘参数,表示Core节点数据磁盘存储空间。为增大数据存储容量,创建集群时可同时添加磁盘。 取值范围:100GB~32000GB |
core_data_volume_count |
否 |
Integer |
该参数为多磁盘参数,表示Core节点数据磁盘个数。 取值范围:1~10 |
volume_type |
否 |
String |
Master和Core节点的磁盘存储类别,目前支持SATA、SAS和SSD。磁盘参数可以使用volume_type和volume_size表示,也可以使用多磁盘相关的参数表示。volume_type和volume_size这两个参数如果与多磁盘参数同时出现,系统优先读取volume_type和volume_size参数。建议使用多磁盘参数。
|
volume_size |
否 |
Integer |
Master和Core节点数据磁盘存储空间。为增大数据存储容量,创建集群时可同时添加磁盘。 取值范围:100GB~32000GB 不建议使用该参数,详情请参考volume_type参数的说明。 |
task_node_groups |
否 |
Array |
Task节点列表信息。参数说明请参见表6。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
period_type |
是 |
String |
资源计划的周期类型,当前只允许以下类型: daily |
start_time |
是 |
String |
资源计划的起始时间,格式为“hour:minute”,表示时间在0:00-23:59之间。 |
end_time |
是 |
String |
资源计划的结束时间,格式与“start_time”相同,不早于start_time表示的时间,且与start_time间隔不小于30min。 |
min_capacity |
是 |
Integer |
资源计划内该节点组的最小保留节点数。 取值范围:[0~500] |
max_capacity |
是 |
Integer |
资源计划内该节点组的最大保留节点数。 取值范围:[0~500] |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
name |
是 |
String |
弹性伸缩规则的名称。 只能由字母、数字、中划线和下划线组成,并且长度为1~64个字符。 在一个节点组范围内,不允许重名。 |
description |
否 |
String |
弹性伸缩规则的说明。 最大长度为1024字符。 |
adjustment_type |
是 |
String |
弹性伸缩规则的调整类型,只允许以下类型:
|
cool_down_minutes |
是 |
Integer |
触发弹性伸缩规则后,该集群处于冷却状态(不再执行弹性伸缩操作)的时长,单位为分钟。 取值范围[0~10080],10080为一周的分钟数。 |
scaling_adjustment |
是 |
Integer |
单次调整集群节点的个数。 取值范围[1~100] |
trigger |
是 |
trigger object |
描述该规则触发条件,详细说明请参见表14。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
metric_name |
是 |
String |
指标名称。 该触发条件会依据该名称对应指标的值来进行判断。 最大长度为64个字符。 支持的指标名称请参考表16。 |
metric_value |
是 |
String |
指标阈值。 触发该条件的指标阈值,只允许输入整数或者带两位小数的数,metric_name对应的指标数值类型和有效取值范围,请参考表16。 |
comparison_operator |
否 |
String |
指标判断逻辑运算符,包括:
|
evaluation_periods |
是 |
Integer |
判断连续满足指标阈值的周期数(一个周期为5分钟)。 取值范围[1~288] |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
name |
是 |
String |
弹性伸缩自定义自动化脚本的名称,同一个集群的自定义自动化脚本名称不允许相同。 只能由数字、英文字符、空格、中划线和下划线组成,且不能以空格开头。 可输入的字符串长度为1~64个字符。 |
uri |
是 |
String |
自定义自动化脚本的路径。设置为OBS桶的路径或虚拟机本地的路径。
|
parameters |
否 |
String |
自定义自动化脚本参数。
|
nodes |
是 |
Array of string |
自定义自动化脚本所执行的节点类型,包含Master、Core和Task三种类型。 |
active_master |
否 |
Boolean |
自定义自动化脚本是否只运行在主Master节点上。 缺省值为false,表示自定义自动化脚本可运行在所有Master节点上。 |
action_stage |
是 |
String |
脚本执行时机。 支持以下四个阶段:
|
fail_action |
是 |
String |
自定义自动化脚本执行失败后,是否继续执行后续脚本和创建集群。
|
集群类型 |
指标名称 |
数值类型 |
说明 |
---|---|---|---|
流式集群 |
StormSlotAvailable |
整型 |
Storm组件的可用slot数。 取值范围为[0~2147483646]。 |
StormSlotAvailablePercentage |
百分比 |
Storm组件可用slot百分比。是可用slot数与总slot数的比值。 取值范围为[0~100]。 |
|
StormSlotUsed |
整型 |
Storm组件的已用slot数。 取值范围为[0~2147483646]。 |
|
StormSlotUsedPercentage |
百分比 |
Storm组件已用slot百分比。是已用slot数与总slot数的比值。 取值范围为[0~100]。 |
|
StormSupervisorMemAverageUsage |
整形 |
Storm组件Supervisor的内存平均使用量。 取值范围为[0~2147483646]。 |
|
StormSupervisorMemAverageUsagePercentage |
百分比 |
Storm组件Supervisor进程使用的内存占系统总内存的平均百分比。 取值范围[0 ~ 100]。 |
|
StormSupervisorCPUAverageUsagePercentage |
百分比 |
Storm组件Supervisor进程使用的CPU占系统总CPU的平均百分比。 取值范围[0 ~ 6000]。 |
|
分析集群 |
YARNAppPending |
整型 |
YARN组件挂起的任务数。 取值范围为[0~2147483646]。 |
YARNAppPendingRatio |
比率 |
YARN组件挂起的任务数比例。是YARN挂起的任务数与YARN运行中的任务数比值。 取值范围为[0~2147483646]。 |
|
YARNAppRunning |
整型 |
YARN组件运行中的任务数。 取值范围为[0~2147483646]。 |
|
YARNContainerAllocated |
整型 |
YARN组件中已分配的container个数。 取值范围为[0~2147483646]。 |
|
YARNContainerPending |
整型 |
YARN组件挂起的container个数。 取值范围为[0~2147483646]。 |
|
YARNContainerPendingRatio |
比率 |
YARN组件挂起的container比率。是挂起的container数与运行中的container数的比值。 取值范围为[0~2147483646]。 |
|
YARNCPUAllocated |
整型 |
YARN组件已分配的虚拟CPU核心数。 取值范围为[0~2147483646]。 |
|
YARNCPUAvailable |
整型 |
YARN组件可用的虚拟CPU核心数。 取值范围为[0~2147483646]。 |
|
YARNCPUAvailablePercentage |
百分比 |
YARN组件可用虚拟CPU核心数百分比。是可用虚拟CPU核心数与总虚拟CPU核心数比值。 取值范围为[0~100]。 |
|
YARNCPUPending |
整型 |
YARN组件挂起的虚拟CPU核心数。 取值范围为[0~2147483646]。 |
|
YARNMemoryAllocated |
整型 |
YARN组件已分配内存大小。单位为MB。 取值范围为[0~2147483646]。 |
|
YARNMemoryAvailable |
整型 |
YARN组件可用内存大小。单位为MB。 取值范围为[0~2147483646]。 |
|
YARNMemoryAvailablePercentage |
百分比 |
YARN组件可用内存百分比。是YARN组件可用内存大小与YARN组件总内存大小的比值。 取值范围为[0~100]。 |
|
YARNMemoryPending |
整型 |
YARN组件挂起的内存大小。 取值范围为[0~2147483646]。 |
响应参数
状态码: 200
参数名 |
参数类型 |
说明 |
---|---|---|
cluster_id |
String |
集群创建成功后系统返回的集群ID值。 |
result |
Boolean |
操作结果。
|
msg |
String |
系统提示信息,可为空。 |
请求示例
- 创建开启“集群高可用”功能的集群(使用node_groups参数组)
POST https://{endpoint}/v1.1/{project_id}/run-job-flow { "billing_type": 12, "data_center": , "available_zone_id": , "cluster_name": "mrs_HEbK", "cluster_version": "MRS 3.1.0", "safe_mode": 0, "cluster_type": 0, "component_list": [ { "component_name": "Hadoop" }, { "component_name": "Spark2x" }, { "component_name": "HBase" }, { "component_name": "Hive" }, { "component_name": "Tez" }, { "component_name": "Hue" }, { "component_name": "Flink" } ], "vpc": "vpc-4b1c", "vpc_id": "4a365717-67be-4f33-80c5-98e98a813af8", "subnet_id": "67984709-e15e-4e86-9886-d76712d4e00a", "subnet_name": "subnet-4b44", "security_groups_id": "4820eace-66ad-4f2c-8d46-cf340e3029dd", "tags": [{ "key": "key1", "value": "value1" }, { "key": "key2", "value": "value2" }], "node_groups": [{ "group_name": "master_node_default_group", "node_num": 2, "node_size": "", "root_volume_size": 480, "root_volume_type": "SATA", "data_volume_type": "SATA", "data_volume_count": 1, "data_volume_size": 600 }, { "group_name": "core_node_analysis_group", "node_num": 3, "node_size": "", "root_volume_size": 480, "root_volume_type": "SATA", "data_volume_type": "SATA", "data_volume_count": 1, "data_volume_size": 600 }, { "group_name": "task_node_analysis_group", "node_num": 2, "node_size": "", "root_volume_size": 480, "root_volume_type": "SATA", "data_volume_type": "SATA", "data_volume_count": 0, "data_volume_size": 600, "auto_scaling_policy": { "auto_scaling_enable": true, "min_capacity": 1, "max_capacity": "3", "resources_plans": [{ "period_type": "daily", "start_time": "9:50", "end_time": "10:20", "min_capacity": 2, "max_capacity": 3 }, { "period_type ": "daily", "start_time ": "10:20", "end_time ": "12:30", "min_capacity ": 0, "max_capacity ": 2 }], "exec_scripts": [{ "name": "before_scale_out", "uri": "s3a://XXX/zeppelin_install.sh ", "parameters": "${mrs_scale_node_num} ${mrs_scale_type} xxx", "nodes": ["master", "core", "task"], "active_master": "true", "action_stage": "before_scale_out", "fail_sction": "continue" }, { "name": "after_scale_out", "uri": "s3a://XXX/storm_rebalance.sh", "parameters": "${mrs_scale_node_hostnames} ${mrs_scale_node_ips}", "nodes": ["master", "core", "task"], "active_master": "true", "action_stage": "after_scale_out", "fail_action": "continue" }], "rules": [{ "name": "default-expand-1", "adjustment_type": "scale_out", "cool_down_minutes": 5, "scaling_adjustment": 1, "trigger": { "metric_name": "YARNMemoryAvailablePercentage", "metric_value": "25", "comparison_operator": "LT", "evaluation_periods": 10 } }, { "name": "default-shrink-1", "adjustment_type": "scale_in", "cool_down_minutes": 5, "scaling_adjustment": 1, "trigger": { "metric_name": "YARNMemoryAvailablePercentage", "metric_value": "70", "comparison_operator": "GT", "evaluation_periods": 10 } }] } } ], "login_mode": 1, "cluster_master_secret": "", "cluster_admin_secret": "", "log_collection": 1, "add_jobs": [{ "job_type": 1, "job_name": "tenji111", "jar_path": "s3a://bigdata/program/hadoop-mapreduce-examples-xxx.jar", "arguments": "wordcount", "input": "s3a://bigdata/input/wd_1k/", "output": "s3a://bigdata/output/", "job_log": "s3a://bigdata/log/", "shutdown_cluster": true, "file_action": "", "submit_job_once_cluster_run": true, "hql": "", "hive_script_path": "" }], "bootstrap_scripts": [{ "name": "Modify os config", "uri": "s3a://XXX/modify_os_config.sh", "parameters": "param1 param2", "nodes": ["master", "core", "task"], "active_master": "false", "before_component_start": "true", "start_time" : "1667892101", "state" : "IN_PROGRESS", "fail_action": "continue" "action_stages" : [ "BEFORE_COMPONENT_FIRST_START", "BEFORE_SCALE_IN" ] }, { "name": "Install zepplin", "uri": "s3a://XXX/zeppelin_install.sh", "parameters": "", "nodes": ["master"], "active_master": "true", "before_component_start": "false", "start_time" : "1667892101", "state" : "IN_PROGRESS", "fail_action": "continue" "action_stages" : [ "AFTER_SCALE_IN", "AFTER_SCALE_OUT" ] }] }
- 创建开启“集群高可用”功能的集群(不使用node_groups参数组)
POST https://{endpoint}/v1.1/{project_id}/run-job-flow { "billing_type": 12, "data_center": , "master_node_num": 2, "master_node_size": "", "core_node_num": 3, "core_node_size": "", "available_zone_id": , "cluster_name": "newcluster", "vpc": "vpc1", "vpc_id": "5b7db34d-3534-4a6e-ac94-023cd36aaf74", "subnet_id": "815bece0-fd22-4b65-8a6e-15788c99ee43", "subnet_name": "subnet", "security_groups_id": "845bece1-fd22-4b45-7a6e-14338c99ee43", "tags": [ { "key": "key1", "value": "value1" }, { "key": "key2", "value": "value2" } ], "cluster_version": "MRS 3.1.0", "cluster_type": 0, "master_data_volume_type": "SATA", "master_data_volume_size": 600, "master_data_volume_count": 1, "core_data_volume_type": "SATA", "core_data_volume_size": 600, "core_data_volume_count": 2, "node_public_cert_name": "SSHkey-bba1", "safe_mode": 0, "log_collection": 1, "task_node_groups": [ { "node_num": 2, "node_size": "", "data_volume_type": "SATA", "data_volume_count": 1, "data_volume_size": 600, "auto_scaling_policy": { "auto_scaling_enable": true, "min_capacity": "1", "max_capacity": "3", "resources_plans": [{ "period_type": "daily", "start_time": "9:50", "end_time": "10:20", "min_capacity": "2", "max_capacity": "3" },{ "period_type": "daily", "start_time": "10:20", "end_time": "12:30", "min_capacity": "0", "max_capacity": "2" }], "exec_scripts": [{ "name": "before_scale_out", "uri": "s3a://XXX/zeppelin_install.sh", "parameters": "${mrs_scale_node_num}${mrs_scale_type}xxx", "nodes": [ "master", "core", "task" ], "active_master": "true", "action_stage": "before_scale_out", "fail_action": "continue" },{ "name": "after_scale_out", "uri": "s3a://XXX/storm_rebalance.sh", "parameters": "${mrs_scale_node_hostnames}${mrs_scale_node_ips}", "nodes": [ "master", "core", "task" ], "active_master": "true", "action_stage": "after_scale_out", "fail_action": "continue" }], "rules": [ { "name": "default-expand-1", "adjustment_type": "scale_out", "cool_down_minutes": 5, "scaling_adjustment": 1, "trigger": { "metric_name": "YARNMemoryAvailablePercentage", "metric_value": "25", "comparison_operator": "LT", "evaluation_periods": 10 } }, { "name": "default-shrink-1", "adjustment_type": "scale_in", "cool_down_minutes": 5, "scaling_adjustment": 1, "trigger": { "metric_name": "YARNMemoryAvailablePercentage", "metric_value": "70", "comparison_operator": "GT", "evaluation_periods": 10 } } ] } } ], "component_list": [ { "component_name": "Hadoop" }, { "component_name": "Spark2x" }, { "component_name": "HBase" }, { "component_name": "Hive" }, { "component_name": "Presto" }, { "component_name": "Tez" }, { "component_name": "Hue" }, { "component_name": "Flink" } ], "add_jobs": [ { "job_type": 1, "job_name": "tenji111", "jar_path": "s3a://bigdata/program/hadoop-mapreduce-examples-XXX.jar", "arguments": "wordcount", "input": "s3a://bigdata/input/wd_1k/", "output": "s3a://bigdata/output/", "job_log": "s3a://bigdata/log/", "shutdown_cluster": false, "file_action": "", "submit_job_once_cluster_run": true, "hql": "", "hive_script_path": "" } ], "bootstrap_scripts": [ { "name":"Modifyosconfig", "uri":"s3a://XXX/modify_os_config.sh", "parameters":"param1 param2", "nodes":[ "master", "core", "task" ], "active_master":"false", "before_component_start":"true", "fail_action":"continue" }, { "name":"Install zepplin", "uri":"s3a://XXX/zeppelin_install.sh", "parameters":"", "nodes":[ "master" ], "active_master":"true", "before_component_start":"false", "fail_action":"continue" } ] }
- 关闭“集群高可用”功能创建最小规格集群(使用node_groups参数组)
POST https://{endpoint}/v1.1/{project_id}/run-job-flow { "billing_type": 12, "data_center": , "available_zone_id": , "cluster_name": "mrs_HEbK", "cluster_version": "MRS 3.1.0", "safe_mode": 0, "cluster_type": 0, "component_list": [ { "component_name": "Hadoop" }, { "component_name": "Spark2x" }, { "component_name": "HBase" }, { "component_name": "Hive" }, { "component_name": "Tez" }, { "component_name": "Hue" }, { "component_name": "Flink" } ], "vpc": "vpc-4b1c", "vpc_id": "4a365717-67be-4f33-80c5-98e98a813af8", "subnet_id": "67984709-e15e-4e86-9886-d76712d4e00a", "subnet_name": "subnet-4b44", "security_groups_id": "4820eace-66ad-4f2c-8d46-cf340e3029dd", "tags": [{ "key": "key1", "value": "value1" }, { "key": "key2", "value": "value2" }], "node_groups": [{ "group_name": "master_node_default_group", "node_num": 1, "node_size": "", "root_volume_size": 480, "root_volume_type": "SATA", "data_volume_type": "SATA", "data_volume_count": 1, "data_volume_size": 600 }, { "group_name": "core_node_analysis_group", "node_num": 1, "node_size": "", "root_volume_size": 480, "root_volume_type": "SATA", "data_volume_type": "SATA", "data_volume_count": 1, "data_volume_size": 600 } ], "login_mode": 1, "cluster_master_secret": "", "cluster_admin_secret": "", "log_collection": 1, "add_jobs": [{ "job_type": 1, "job_name": "tenji111", "jar_path": "s3a://bigdata/program/hadoop-mapreduce-examples-xxx.jar", "arguments": "wordcount", "input": "s3a://bigdata/input/wd_1k/", "output": "s3a://bigdata/output/", "job_log": "s3a://bigdata/log/", "shutdown_cluster": true, "file_action": "", "submit_job_once_cluster_run": true, "hql": "", "hive_script_path": "" }], "bootstrap_scripts": [{ "name": "Modify os config", "uri": "s3a://XXX/modify_os_config.sh", "parameters": "param1 param2", "nodes": ["master", "core", "task"], "active_master": "false", "before_component_start": "true", "fail_action": "continue" }, { "name": "Install zepplin", "uri": "s3a://XXX/zeppelin_install.sh", "parameters": "", "nodes": ["master"], "active_master": "true", "before_component_start": "false", "fail_action": "continue" }] }
- 关闭“集群高可用”功能创建最小规格集群(不使用node_groups参数组)
POST https://{endpoint}/v1.1/{project_id}/run-job-flow { "billing_type": 12, "data_center": , "master_node_num": 1 "master_node_size": "", "core_node_num": 1, "core_node_size": "", "available_zone_id": , "cluster_name": "newcluster", "vpc": "vpc1", "vpc_id": "5b7db34d-3534-4a6e-ac94-023cd36aaf74", "subnet_id": "815bece0-fd22-4b65-8a6e-15788c99ee43", "subnet_name": "subnet", "security_groups_id": "", "tags": [ { "key": "key1", "value":"value1" }, { "key": "key2", "value": "value2" } ], "cluster_version": "MRS 3.1.0", "cluster_type": 0, "master_data_volume_type": "SATA", "master_data_volume_size": 600, "master_data_volume_count": 1, "core_data_volume_type": "SATA", "core_data_volume_size": 600, "core_data_volume_count": 1, "login_mode": 1, "node_public_cert_name": "SSHkey-bba1", "safe_mode": 0, "cluster_admin_secret":"******", "log_collection": 1, "component_list": [ { "component_name": "Hadoop" }, { "component_name": "Spark2x" }, { "component_name": "HBase" }, { "component_name": "Hive" }, { "component_name": "Tez" }, { "component_name": "Hue" }, { "component_name": "Flink" } ], "add_jobs": [ { "job_type": 1, "job_name": "tenji111", "jar_path": "s3a://bigdata/program/hadoop-mapreduce-examples-XXX.jar", "arguments": "wordcount", "input": "s3a://bigdata/input/wd_1k/", "output": "s3a://bigdata/output/", "job_log": "s3a://bigdata/log/", "shutdown_cluster": false, "file_action": "", "submit_job_once_cluster_run": true, "hql": "", "hive_script_path": "" } ], "bootstrap_scripts": [ { "name":"Install zepplin", "uri":"s3a://XXX/zeppelin_install.sh", "parameters":"", "nodes":[ "master" ], "active_master":"false", "before_component_start":"false", "fail_action":"continue" } ] }
响应示例
状态码: 200
创建集群成功。
{ "cluster_id" : "da1592c2-bb7e-468d-9ac9-83246e95447a", "result" : true, "msg" : "" }
错误码
请参见错误码。