更新时间:2024-05-07 GMT+08:00
分享

字段设计规范

  • 字段设计应使用推荐类型。

    字段设计需使用推荐字段,如果需要使用禁用、不推荐的字段类型,建议联系技术支持进行评估。

    这些数据类型不推荐或禁止的原因是业务使用场景较少,未大规模商用。

    对于业务上有迫切字段类型要求的,联系技术支持,提交需求。

    表1 数据库数据类型最佳实践

    数据类型

    说明

    是否推荐

    UUID

    不同集群可能产生相同UUID

    禁止,建议业务直接采用中间件平台提供的分布式ID

    序列整型

    即自增列,包括SMALLSERIAL,SERIAL,BIGSERIAL

    禁止

    整数类型

    TINYINT, SMALLINT, INTEGER, BIGINT

    推荐

    任意精度类型

    NUMERIC/DECIMAL

    推荐

    浮点类型

    REAL/FLOAT4,DOUBLE PRECISION/FLOAT8,FLOAT

    推荐

    布尔类型

    BOOLEAN

    推荐

    定长字符

    CHAR(n)

    推荐

    变长字符

    VARCHAR(n),NVARCHAR2(n)

    VARCHAR/TEXT

    推荐

    时间类型

    DATE, TIME, TIMESTAMP, SMALLDATETIME, INTERVAL, REALTIME

    推荐

    TIMETZ,TIMESTAMPTZ

    不推荐

    二进制类型

    BYTEA(变长二进制类型)

    推荐

    CLOB(字符大对象),BLOB(二进制大对象),RAW(变长十六进制)

    禁止

    位串类型

    BIT(n), VARBIT(n)

    推荐

    特殊字符类型

    NAME,"CHAR",通常供数据库系统内部使用

    禁止

    JSON类型

    JSON类型目前不支持操作符

    禁止

    自定义类型

    可用于定义枚举EMU等类型

    禁止

    HLL数据类型

    建议直接使用HLL相关函数,减少性能影响

    禁止

    货币类型

    MONEY 存储带有固定小数精度的货币金额

    禁止

    几何类型

    POINT, LSEG, BOX, PATH, POLYGON, CIRCLE

    禁止

    网络地址类型

    存储IPv4 IPv6 MAC地址数据类型

    禁止

    文本搜索类型

    用于支持全文检索

    禁止

  • 合理选用字符串数据类型。优先使用变长字符类VARCHAR。只有该字段输入确定为固定字符则使用定长字符类型,或需要自动补充空格,才使用CHAR(n)。

    典型的定长字段类型,例如“sex”字段,仅允许输入“f”或“m”一个字节长度的字符。这类字段建议使用定长数据类型(如CHAR(n))。

    如果不存在此特点,或者后续可能扩展需要输入更长的字符,请优先使用变长字符类型(如VARCHAR, TEXT),且不建议指定变长类型的长度

    原因如下:

    • 定长字段会对不够长度的输入数据补充空格,然后存入数据库中,产生不必要的存储空间浪费。
    • 如果定义为定长字符类型,后续扩展长度,需要对全表进行扫描重写,性能开销大,影响在线业务。

    对于指定固定长度的变长字段,每次插入时会检查是否长度越界,带来性能开销。

  • 字符类型字段不应存储数字类型的数据。

    如果对存储在字符类型字段中的数据进行数值计算,或者与数值进行比较操作(如置于过滤条件中),会带来不必要的数据类型转换的开销,同时该字段上的索引可能失效,影响查询性能。

  • 字符类型字段不应存储时间或日期类数据。

    如果对存储在字符类型字段中的数据与日期类数据进行计算或比较操作(如置于过滤条件中),会带来不必要的数据类型转换的开销,同时该字段上的索引可能失效,影响查询性能。

  • 对于明确不存在NULL值的字段加上NOT NULL约束。

    对于NOT NULL字段,优化器在某些场景下会进行特殊优化,可较大提升查询性能。

  • 相关联字段的数据类型应保持一致。

    在进行关联操作时,如果字段类型不一致,会带来数据类型转换开销。

  • 大字段(例如varchar(1000)、varchar(4000))不建议超过8个。
  • 字段定义时建议同时创建COMMENT注释信息,以便于未来维护。

    不同类型字段说明、取值范围及使用方法请参考数据类型章节。

  • 用于WHERE条件过滤和关联的字段都应设置NOT NULL约束。

    对于NOT NULL字段,优化器在某些场景下会进行特殊优化,可较大提升查询性能。

  • 不建议对表预留字段。大部分场景下可支持快速新增、删除表字段,或者修改字段的DEFAULT值。

    新增列必须符合以下要求,否则会带来全表更新开销,影响在线业务。

    • 数据类型为以下类型中的一种:BOOL, BYTEA, SMALLINT, BIGINT, SMALLINT, INTEGER, NUMERIC, FLOAT, DOUBLE PRECISION, CHAR, VARCHAR, TEXT, TIMESTAMPTZ, TIMESTAMP, DATE, TIME, TIMETZ, INTERVAL;
    • 新增列的DEFAULT值长度不超过128个字节;
    • 新增列DEFAULT值不包含volatile函数;
    • 新增列设置有DEFAULT值,且DEFAULT值不为NULL。

    如果不确定是否满足条件,请联系数据库技术人员进行评估。

  • 尽量使用高效的数值类数据类型。在满足业务精度的情况下,选择的优先级从高到低依次为整数、浮点数、NUMERIC。
  • 合理设置数值字段的数据类型,根据取值范围选择合适的数值类型,尽量少用NUMERIC/DECIMAL类型。

    NUMERIC和DECIMAL等价,NUMERIC(或DECIMAL)数据类型操作对CPU消耗较高。

    表2 数值类数据类型存储空间及取值范围

    类型

    存储空间/Byte

    最小值

    最大值

    TINYINT

    1

    0

    255

    SMALLINT

    2

    -32768

    32767

    INTEGER

    4

    -2,147,483,648

    2,147,483,647

    BIGINT

    8

    -9,223,372,036,854,775,808

    9,223,372,036,854,775,807

    REAL/FLOAT4

    4

    6位十进制数字精度

    DOUBLE PRECISION/FLOAT8

    8

    15位十进制数字精度

分享:

    相关文档

    相关产品