更新时间:2024-10-18 GMT+08:00

自动建表映射规则

配置字段映射时,数据源支持的数据类型请参见表1,以确保数据完整导入到目的端。

表1 支持的数据类型

数据连接类型

数据类型说明

MySQL

请参见MySQL数据库作为源端时目的端自动建表支持的数据类型

MySQL数据库作为源端时目的端自动建表支持的数据类型

源端为MySQL数据库,目的端为Hudi时,支持自动建表的数据类型如下:

表2 开源MySQL数据库作为源端时支持的数据类型

类别

类型

简要释义

Hudi

字符串

CHAR(M)

固定长度的字符串是以长度为1到255之间个字符长度(例如:CHAR(5)),存储右空格填充到指定的长度。

限定长度不是必需的,它会默认为1。

STRING

VARCHAR(M)

可变长度的字符串是以长度为1到255之间字符数(高版本的MySQL超过255); 例如: VARCHAR(25).

创建VARCHAR类型字段时,必须定义长度。

STRING

数值

DECIMAL(M,D)

非压缩浮点数不能是无符号的。在解包小数,每个小数对应于一个字节。

定义显示长度(M)和小数(D)的数量是必需的。 NUMERIC是DECIMAL的同义词。

DECIMAL

NUMBERIC

与 DECIMAL 相同

不支持

INTEGER

一个正常大小的整数,可以带符号。如果是有符号的,它允许的范围是从-2147483648到2147483647。

如果是无符号,允许的范围是从0到4294967295。 可以指定多达11位的宽度。

INT

INTEGER UNSIGNED

INTEGER 的无符号形式

BIGINT

INT

与INTEGER相同

INT

INT UNSIGNED

与INTEGER UNSIGNED相同

BIGINT

BIGINT

一个大的整数,可以带符号。如果有符号,允许范围为-9223372036854775808到9223372036854775807。如果无符号,允许的范围是从0到18446744073709551615. 可以指定最多20位的宽度。

BIGINT

BIGINT UNSIGNED

BIGINT的无符号形式

DECIMAL(20, 0)

MEDIUMINT

一个中等大小的整数,可以带符号。如果有符号,允许范围为-8388608至8388607。

如果无符号,允许的范围是从0到16777215,可以指定最多9位的宽度。

INT

MEDIUMINT UNSIGNED

MEDIUMINT的无符号形式

BIGINT

TINYINT

一个非常小的整数,可以带符号。如果是有符号,它允许的范围是从-128到127。

如果是无符号,允许的范围是从0到255,可以指定多达4位数的宽度。

INT

TINYINT UNSIGNED

TINYINT的无符号形式

INT

BOOLEAN

MySQL的bool实际上就是tinyint(1)

BOOLEAN

SMALLINT

一个小的整数,可以带符号。如果有符号,允许范围为-32768至32767。

如果无符号,允许的范围是从0到65535,可以指定最多5位的宽度。

INT

SMALLINT UNSIGNED

SMALLINT的无符号形式

INT

REAL

同DOUBLE

不支持

FLOAT(M,D)

不能使用无符号的浮点数字。可以定义显示长度(M)和小数位数(D)。这不是必需的,并且默认为10,2。其中2是小数的位数,10是数字(包括小数)的总数。小数精度可以到24个浮点。

FLOAT

DOUBLE(M,D)

不能使用无符号的双精度浮点数。可以定义显示长度(M)和小数位数(D)。 这不是必需的,

默认为16,4,其中4是小数的位数。小数精度可以达到53位的DOUBLE。 REAL是DOUBLE同义词。

DOUBLE

DOUBLE PRECISION

与DOUBLE相似

DOUBLE

BIT(M)

存储位值的BIT类型。BIT(M)可以存储多达M位的值,M的范围在1到64之间。

不支持

日期时间

DATE

以YYYY-MM-DD格式的日期,在1000-01-01和9999-12-31之间。 例如,1973年12月30日将被存储为1973-12-30。

DATE

TIME

用于存储时、分、秒信息

STRING

DATETIME

日期和时间组合以YYYY-MM-DD HH:MM:SS格式,在1000-01-01 00:00:00 到9999-12-31 23:59:59之间。例如,1973年12月30日下午3:30,会被存储为1973-12-30 15:30:00。

TIMESTAMP

TIMESTAMP

1970年1月1日午夜之间的时间戳,到2037的某个时候。这看起来像前面的DATETIME格式,无需只是数字之间的连字符; 1973年12月30日下午3点30分将被存储为19731230153000(YYYYMMDDHHMMSS)。

TIMESTAMP

YEAR(M)

以2位或4位数字格式来存储年份。如果长度指定为2(例如YEAR(2)),年份就可以为1970至2069(70-69)。如果长度指定为4,年份范围是1901-2155,默认长度为4。

STRING

多媒体(二进制)

BINARY(M)

字节数为M,允许长度为0-M的变长二进制字符串,字节数为值得长度加1

不支持

VARBINARY(M)

字节数为M,允许长度为0-M的定长二进制字符串

不支持

TEXT

字段的最大长度是65535个字符。 TEXT是“二进制大对象”,并用来存储大的二进制数据,如图像或其他类型的文件。

STRING

TINYTEXT

0-255字节短文本二进制字符串

STRING

MEDIUMTEXT

0-167772154字节中等长度文本二进制字符串

STRING

LONGTEXT

0-4294967295字节极大长度文本二进制字符串

STRING

BLOB

字段的最大长度是65535个字符。 BLOB是“二进制大对象”,并用来存储大的二进制数据,如图像或其他类型的文件。BLOB大小写敏感。

不支持

TINYBLOB

0-255字节短文本二进制字符串

不支持

MEDIUMBLOB

0-167772154字节中等长度文本二进制字符串

不支持

LONGBLOB

0-4294967295字节极大长度文本二进制字符串

不支持

特殊类型

SET

SET是一个字符串对象,可以有零或多个值,其值来自表创建时规定的允许的一列值。指定包括多个SET成员的SET列值时各成员之间用逗号(‘,’)间隔开。这样SET成员值本身不能包含逗号。

-

JSON

-

STRING

ENUM

当定义一个ENUM,要创建它的值的列表,这些是必须用于选择的项(也可以是NULL)。例如,如果想要字段包含“A”或“B”或“C”,那么可以定义为ENUM为 ENUM(“A”,“B”,“C”)也只有这些值(或NULL)才能用来填充这个字段。

不支持