- 最新动态
- 功能总览
- 服务公告
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- GaussDB(DWS)使用流程
- 准备工作
- 创建GaussDB(DWS)集群
- 连接GaussDB(DWS)集群
- 创建GaussDB(DWS)数据库和用户
- 迁移业务数据至GaussDB(DWS)集群
- GaussDB(DWS)集群数据安全与加密
- GaussDB(DWS)集群管理
-
GaussDB(DWS)集群运维
- 在监控面板(DMS)查看GaussDB(DWS)集群监控
- 在Cloud Eye查看GaussDB(DWS)集群监控
- 监控并诊断GaussDB(DWS)集群TopSQL
-
查看GaussDB(DWS)集群告警
- 告警管理简介
- 告警规则
- 订阅告警通知
-
告警处理
- DWS_2000000001 DWS集群节点CPU使用率超阈值
- DWS_2000000006 DWS集群节点数据盘使用率超阈值
- DWS_2000000009 DWS集群节点数据盘I/O利用率超阈值
- DWS_2000000012 DWS集群节点数据盘时延超阈值
- DWS_2000000016 DWS集群查询语句触发下盘量超阈值
- DWS_2000000017 DWS集群查询语句堆积数量超阈值
- DWS_2000000018 DWS集群默认资源池队列阻塞
- DWS_2000000020 DWS集群的SQL探针耗时超阈值
- DWS_2000000023 DWS集群中存在持有锁过长的vacuum full操作
- DWS_2000000027 DWS集群节点实例内存使用率超阈值
- DWS_2000000028 DWS集群节点动态内存使用率超阈值
- DWS_2000000029 DWS集群资源池磁盘使用率超阈值
- DWS_2000000030 DWS集群会话数量使用率超阈值
- DWS_2000000031 DWS集群活跃会话数量使用率超阈值
- DWS_2000000032 DWS集群数据库死锁数量超阈值
- DWS_2000000033 DWS集群数据库会话使用率超阈值
- 查看并订阅GaussDB(DWS)集群事件
- GaussDB(DWS)常用运维命令集
- 备份与恢复GaussDB(DWS)集群
- GaussDB(DWS)集群节点扩缩容
- GaussDB(DWS)集群规格变更
- GaussDB(DWS)集群容灾管理
- GaussDB(DWS)集群升级
- GaussDB(DWS)集群日志管理
- GaussDB(DWS)集群状态异常操作
- Vacuum回收GaussDB(DWS)空间
- 授权GaussDB(DWS)集群运维账号
-
最佳实践
- 导入导出
- 数据迁移
- 数据分析
- 存算分离
- 数据开发
- 数据库管理
- 性能调优
- 集群管理
- 数据迁移与同步
-
开发指南
-
标准数仓开发指南(9.1.0.x)
- 使用前必读
- GaussDB(DWS)开发设计建议
- 创建和管理GaussDB(DWS)数据库对象
- Oracle、Teradata和MySQL语法兼容性差异
- GaussDB(DWS)数据库安全管理
- 查询GaussDB(DWS)数据
- GaussDB(DWS)排序规则
- GaussDB(DWS)用户自定义函数
- GaussDB(DWS)存储过程
- 使用PostGIS Extension
- 使用JDBC或ODBC进行GaussDB(DWS)二次开发
- GaussDB(DWS)资源监控
- GaussDB(DWS)性能调优
-
GaussDB(DWS)系统表和系统视图
- 系统表和系统视图概述
-
系统表
- GS_BLOCKLIST_QUERY
- GS_BLOCKLIST_SQL
- GS_OBSSCANINFO
- GS_RESPOOL_RESOURCE_HISTORY
- GS_WLM_INSTANCE_HISTORY
- GS_WLM_OPERATOR_INFO
- GS_WLM_SESSION_INFO
- GS_WLM_USER_RESOURCE_HISTORY
- PG_AGGREGATE
- PG_AM
- PG_AMOP
- PG_AMPROC
- PG_ATTRDEF
- PG_ATTRIBUTE
- PG_AUTHID
- PG_AUTH_HISTORY
- PG_AUTH_MEMBERS
- PG_BLOCKLISTS
- PG_CAST
- PG_CLASS
- PG_COLLATION
- PG_CONSTRAINT
- PG_CONVERSION
- PG_DATABASE
- PG_DB_ROLE_SETTING
- PG_DEFAULT_ACL
- PG_DEPEND
- PG_DESCRIPTION
- PG_ENUM
- PG_EXCEPT_RULE
- PG_EXTERNAL_NAMESPACE
- PG_EXTENSION
- PG_EXTENSION_DATA_SOURCE
- PG_FINE_DR_INFO
- PG_FOREIGN_DATA_WRAPPER
- PG_FOREIGN_SERVER
- PG_FOREIGN_TABLE
- PG_INDEX
- PG_INHERITS
- PG_JOB_INFO
- PG_JOBS
- PG_LANGUAGE
- PG_LARGEOBJECT
- PG_LARGEOBJECT_METADATA
- PG_MATVIEW
- PG_NAMESPACE
- PG_OBJECT
- PG_OBSSCANINFO
- PG_OPCLASS
- PG_OPERATOR
- PG_OPFAMILY
- PG_PARTITION
- PG_PLTEMPLATE
- PG_PROC
- PG_PUBLICATION
- PG_PUBLICATION_NAMESPACE
- PG_PUBLICATION_REL
- PG_RANGE
- PG_REDACTION_COLUMN
- PG_REDACTION_POLICY
- PG_RELFILENODE_SIZE
- PG_RLSPOLICY
- PG_RESOURCE_POOL
- PG_REWRITE
- PG_SECLABEL
- PG_SHDEPEND
- PG_SHDESCRIPTION
- PG_SHSECLABEL
- PG_STATISTIC
- PG_STATISTIC_EXT
- PG_STAT_OBJECT
- PG_SUBSCRIPTION
- PG_SYNONYM
- PG_TABLESPACE
- PG_TRIGGER
- PG_TS_CONFIG
- PG_TS_CONFIG_MAP
- PG_TS_DICT
- PG_TS_PARSER
- PG_TS_TEMPLATE
- PG_TYPE
- PG_USER_MAPPING
- PG_USER_STATUS
- PG_WORKLOAD_ACTION
- PGXC_CLASS
- PGXC_GROUP
- PGXC_NODE
- PLAN_TABLE_DATA
- SNAPSHOT
- TABLES_SNAP_TIMESTAMP
- 性能视图快照系统表
-
系统视图
- ALL_ALL_TABLES
- ALL_CONSTRAINTS
- ALL_CONS_COLUMNS
- ALL_COL_COMMENTS
- ALL_DEPENDENCIES
- ALL_IND_COLUMNS
- ALL_IND_EXPRESSIONS
- ALL_INDEXES
- ALL_OBJECTS
- ALL_PROCEDURES
- ALL_SEQUENCES
- ALL_SOURCE
- ALL_SYNONYMS
- ALL_TAB_COLUMNS
- ALL_TAB_COMMENTS
- ALL_TABLES
- ALL_USERS
- ALL_VIEWS
- DBA_DATA_FILES
- DBA_USERS
- DBA_COL_COMMENTS
- DBA_CONSTRAINTS
- DBA_CONS_COLUMNS
- DBA_IND_COLUMNS
- DBA_IND_EXPRESSIONS
- DBA_IND_PARTITIONS
- DBA_INDEXES
- DBA_OBJECTS
- DBA_PART_INDEXES
- DBA_PART_TABLES
- DBA_PROCEDURES
- DBA_SEQUENCES
- DBA_SOURCE
- DBA_SYNONYMS
- DBA_TAB_COLUMNS
- DBA_TAB_COMMENTS
- DBA_TAB_PARTITIONS
- DBA_TABLES
- DBA_TABLESPACES
- DBA_TRIGGERS
- DBA_VIEWS
- DUAL
- GET_ALL_TSC_INFO
- GET_TSC_INFO
- GLOBAL_COLUMN_TABLE_IO_STAT
- GLOBAL_REDO_STAT
- GLOBAL_REL_IOSTAT
- GLOBAL_ROW_TABLE_IO_STAT
- GLOBAL_STAT_DATABASE
- GLOBAL_TABLE_CHANGE_STAT
- GLOBAL_TABLE_STAT
- GLOBAL_WORKLOAD_SQL_COUNT
- GLOBAL_WORKLOAD_SQL_ELAPSE_TIME
- GLOBAL_WORKLOAD_TRANSACTION
- GS_ALL_CONTROL_GROUP_INFO
- GS_BLOCKLIST_QUERY
- GS_BLOCKLIST_SQL
- GS_CLUSTER_RESOURCE_INFO
- GS_COLUMN_TABLE_IO_STAT
- GS_OBS_READ_TRAFFIC
- GS_OBS_WRITE_TRAFFIC
- GS_INSTR_UNIQUE_SQL
- GS_NODE_STAT_RESET_TIME
- GS_OBS_LATENCY
- GS_QUERY_MONITOR
- GS_QUERY_RESOURCE_INFO
- GS_REL_IOSTAT
- GS_RESPOOL_RUNTIME_INFO
- GS_RESPOOL_RESOURCE_INFO
- GS_RESPOOL_MONITOR
- GS_ROW_TABLE_IO_STAT
- GS_SESSION_CPU_STATISTICS
- GS_SESSION_MEMORY_STATISTICS
- GS_SQL_COUNT
- GS_STAT_DB_CU
- GS_STAT_SESSION_CU
- GS_TABLE_CHANGE_STAT
- GS_TABLE_STAT
- GS_TOTAL_NODEGROUP_MEMORY_DETAIL
- GS_USER_MONITOR
- GS_USER_TRANSACTION
- GS_VIEW_DEPENDENCY
- GS_VIEW_DEPENDENCY_PATH
- GS_VIEW_INVALID
- GS_WAIT_EVENTS
- GS_WLM_OPERATOR_INFO
- GS_WLM_OPERATOR_HISTORY
- GS_WLM_OPERATOR_STATISTICS
- GS_WLM_SESSION_INFO
- GS_WLM_SESSION_HISTORY
- GS_WLM_SESSION_STATISTICS
- GS_WLM_SQL_ALLOW
- GS_WORKLOAD_SQL_COUNT
- GS_WORKLOAD_SQL_ELAPSE_TIME
- GS_WORKLOAD_TRANSACTION
- MPP_TABLES
- PG_AVAILABLE_EXTENSION_VERSIONS
- PG_AVAILABLE_EXTENSIONS
- PG_BULKLOAD_STATISTICS
- PG_COMM_CLIENT_INFO
- PG_COMM_DELAY
- PG_COMM_STATUS
- PG_COMM_RECV_STREAM
- PG_COMM_SEND_STREAM
- PG_COMM_QUERY_SPEED
- PG_CONTROL_GROUP_CONFIG
- PG_CURSORS
- PG_EXT_STATS
- PG_GET_INVALID_BACKENDS
- PG_GET_SENDERS_CATCHUP_TIME
- PG_GLOBAL_TEMP_ATTACHED_PIDS
- PG_GROUP
- PG_INDEXES
- PG_JOB
- PG_JOB_PROC
- PG_JOB_SINGLE
- PG_LIFECYCLE_DATA_DISTRIBUTE
- PG_LOCKS
- PG_LWLOCKS
- PG_NODE_ENV
- PG_OS_THREADS
- PG_POOLER_STATUS
- PG_PREPARED_STATEMENTS
- PG_PREPARED_XACTS
- PG_PUBLICATION_TABLES
- PG_QUERYBAND_ACTION
- PG_REPLICATION_SLOTS
- PG_ROLES
- PG_RULES
- PG_RUNNING_XACTS
- PG_SECLABELS
- PG_SEQUENCES
- PG_SESSION_WLMSTAT
- PG_SESSION_IOSTAT
- PG_SETTINGS
- PG_SHADOW
- PG_SHARED_MEMORY_DETAIL
- PG_STATS
- PG_STAT_ACTIVITY
- PG_STAT_ALL_INDEXES
- PG_STAT_ALL_TABLES
- PG_STAT_BAD_BLOCK
- PG_STAT_BGWRITER
- PG_STAT_DATABASE
- PG_STAT_DATABASE_CONFLICTS
- PG_STAT_GET_MEM_MBYTES_RESERVED
- PG_STAT_USER_FUNCTIONS
- PG_STAT_USER_INDEXES
- PG_STAT_USER_TABLES
- PG_STAT_REPLICATION
- PG_STAT_SYS_INDEXES
- PG_STAT_SYS_TABLES
- PG_STAT_XACT_ALL_TABLES
- PG_STAT_XACT_SYS_TABLES
- PG_STAT_XACT_USER_FUNCTIONS
- PG_STAT_XACT_USER_TABLES
- PG_STATIO_ALL_INDEXES
- PG_STATIO_ALL_SEQUENCES
- PG_STATIO_ALL_TABLES
- PG_STATIO_SYS_INDEXES
- PG_STATIO_SYS_SEQUENCES
- PG_STATIO_SYS_TABLES
- PG_STATIO_USER_INDEXES
- PG_STATIO_USER_SEQUENCES
- PG_STATIO_USER_TABLES
- PG_THREAD_WAIT_STATUS
- PG_TABLES
- PG_TDE_INFO
- PG_TIMEZONE_ABBREVS
- PG_TIMEZONE_NAMES
- PG_TOTAL_MEMORY_DETAIL
- PG_TOTAL_SCHEMA_INFO
- PG_TOTAL_USER_RESOURCE_INFO
- PG_USER
- PG_USER_MAPPINGS
- PG_VIEWS
- PG_WLM_STATISTICS
- PGXC_BULKLOAD_PROGRESS
- PGXC_BULKLOAD_INFO
- PGXC_BULKLOAD_STATISTICS
- PGXC_COLUMN_TABLE_IO_STAT
- PGXC_COMM_CLIENT_INFO
- PGXC_COMM_DELAY
- PGXC_COMM_RECV_STREAM
- PGXC_COMM_SEND_STREAM
- PGXC_COMM_STATUS
- PGXC_COMM_QUERY_SPEED
- PGXC_DEADLOCK
- PGXC_DISK_CACHE_STATS
- PGXC_DISK_CACHE_ALL_STATS
- PGXC_DISK_CACHE_PATH_INFO
- PGXC_GET_STAT_ALL_TABLES
- PGXC_GET_STAT_ALL_PARTITIONS
- PGXC_GET_TABLE_SKEWNESS
- PGXC_GLOBAL_TEMP_ATTACHED_PIDS
- PGXC_GTM_SNAPSHOT_STATUS
- PGXC_INSTANCE_TIME
- PGXC_LOCKWAIT_DETAIL
- PGXC_INSTR_UNIQUE_SQL
- PGXC_LOCK_CONFLICTS
- PGXC_LWLOCKS
- PGXC_MEMORY_DEBUG_INFO
- PGXC_NODE_ENV
- PGXC_NODE_STAT_RESET_TIME
- PGXC_OBS_IO_SCHEDULER_STATS
- PGXC_OBS_IO_SCHEDULER_PERIODIC_STATS
- PGXC_OS_RUN_INFO
- PGXC_OS_THREADS
- PGXC_POOLER_STATUS
- PGXC_PREPARED_XACTS
- PGXC_REDO_STAT
- PGXC_REL_IOSTAT
- PGXC_REPLICATION_SLOTS
- PGXC_RESPOOL_RUNTIME_INFO
- PGXC_RESPOOL_RESOURCE_INFO
- PGXC_RESPOOL_RESOURCE_HISTORY
- PGXC_ROW_TABLE_IO_STAT
- PGXC_RUNNING_XACTS
- PGXC_SETTINGS
- PGXC_SESSION_WLMSTAT
- PGXC_STAT_ACTIVITY
- PGXC_STAT_BAD_BLOCK
- PGXC_STAT_BGWRITER
- PGXC_STAT_DATABASE
- PGXC_STAT_OBJECT
- PGXC_STAT_REPLICATION
- PGXC_STAT_TABLE_DIRTY
- PGXC_STAT_WAL
- PGXC_SQL_COUNT
- PGXC_TABLE_CHANGE_STAT
- PGXC_TABLE_STAT
- PGXC_THREAD_WAIT_STATUS
- PGXC_TOTAL_MEMORY_DETAIL
- PGXC_TOTAL_SCHEMA_INFO
- PGXC_TOTAL_SCHEMA_INFO_ANALYZE
- PGXC_TOTAL_USER_RESOURCE_INFO
- PGXC_USER_TRANSACTION
- PGXC_VARIABLE_INFO
- PGXC_WAIT_DETAIL
- PGXC_WAIT_EVENTS
- PGXC_WLM_OPERATOR_HISTORY
- PGXC_WLM_OPERATOR_INFO
- PGXC_WLM_OPERATOR_STATISTICS
- PGXC_WLM_SESSION_INFO
- PGXC_WLM_SESSION_HISTORY
- PGXC_WLM_SESSION_STATISTICS
- PGXC_WLM_TABLE_DISTRIBUTION_SKEWNESS
- PGXC_WLM_USER_RESOURCE_HISTORY
- PGXC_WLM_WORKLOAD_RECORDS
- PGXC_WORKLOAD_SQL_COUNT
- PGXC_WORKLOAD_SQL_ELAPSE_TIME
- PGXC_WORKLOAD_TRANSACTION
- PLAN_TABLE
- PV_FILE_STAT
- PV_INSTANCE_TIME
- PV_MATVIEW_DETAIL
- PV_OS_RUN_INFO
- PV_SESSION_MEMORY
- PV_SESSION_MEMORY_DETAIL
- PV_SESSION_STAT
- PV_SESSION_TIME
- PV_TOTAL_MEMORY_DETAIL
- PV_REDO_STAT
- PV_RUNTIME_ATTSTATS
- PV_RUNTIME_RELSTATS
- REDACTION_COLUMNS
- REDACTION_POLICIES
- REMOTE_TABLE_STAT
- SHOW_TSC_INFO
- SHOW_ALL_TSC_INFO
- USER_COL_COMMENTS
- USER_CONSTRAINTS
- USER_CONS_COLUMNS
- USER_INDEXES
- USER_IND_COLUMNS
- USER_IND_EXPRESSIONS
- USER_IND_PARTITIONS
- USER_JOBS
- USER_OBJECTS
- USER_PART_INDEXES
- USER_PART_TABLES
- USER_PROCEDURES
- USER_SEQUENCES
- USER_SOURCE
- USER_SYNONYMS
- USER_TAB_COLUMNS
- USER_TAB_COMMENTS
- USER_TAB_PARTITIONS
- USER_TABLES
- USER_TRIGGERS
- USER_VIEWS
- V$SESSION
- V$SESSION_LONGOPS
- GaussDB(DWS)数据库GUC参数
- GaussDB(DWS)开发者术语表
-
标准数仓开发指南(8.1.3.x)
- 使用前必读
- GaussDB(DWS)开发设计规范
- 创建和管理GaussDB(DWS)数据库对象
- Oracle、Teradata和MySQL语法兼容性差异
- GaussDB(DWS)数据库安全管理
- 查询GaussDB(DWS)数据
- GaussDB(DWS)排序规则
- GaussDB(DWS)用户自定义函数
- GaussDB(DWS)存储过程
- 使用PostGIS Extension
- 使用JDBC或ODBC进行GaussDB(DWS)二次开发
- GaussDB(DWS)资源监控
- GaussDB(DWS)性能调优
-
GaussDB(DWS)系统表和系统视图
- 系统表和系统视图概述
-
系统表
- GS_OBSSCANINFO
- GS_RESPOOL_RESOURCE_HISTORY
- GS_WLM_INSTANCE_HISTORY
- GS_WLM_OPERATOR_INFO
- GS_WLM_SESSION_INFO
- GS_WLM_USER_RESOURCE_HISTORY
- PG_AGGREGATE
- PG_AM
- PG_AMOP
- PG_AMPROC
- PG_ATTRDEF
- PG_ATTRIBUTE
- PG_AUTHID
- PG_AUTH_HISTORY
- PG_AUTH_MEMBERS
- PG_CAST
- PG_CLASS
- PG_COLLATION
- PG_CONSTRAINT
- PG_CONVERSION
- PG_DATABASE
- PG_DB_ROLE_SETTING
- PG_DEFAULT_ACL
- PG_DEPEND
- PG_DESCRIPTION
- PG_ENUM
- PG_EXTENSION
- PG_EXTENSION_DATA_SOURCE
- PG_FOREIGN_DATA_WRAPPER
- PG_FOREIGN_SERVER
- PG_FOREIGN_TABLE
- PG_INDEX
- PG_INHERITS
- PG_JOBS
- PG_LANGUAGE
- PG_LARGEOBJECT
- PG_LARGEOBJECT_METADATA
- PG_NAMESPACE
- PG_OBJECT
- PG_OBSSCANINFO
- PG_OPCLASS
- PG_OPERATOR
- PG_OPFAMILY
- PG_PARTITION
- PG_PLTEMPLATE
- PG_PROC
- PG_RANGE
- PG_REDACTION_COLUMN
- PG_REDACTION_POLICY
- PG_RELFILENODE_SIZE
- PG_RLSPOLICY
- PG_RESOURCE_POOL
- PG_REWRITE
- PG_SECLABEL
- PG_SHDEPEND
- PG_SHDESCRIPTION
- PG_SHSECLABEL
- PG_STATISTIC
- PG_STATISTIC_EXT
- PG_SYNONYM
- PG_TABLESPACE
- PG_TRIGGER
- PG_TS_CONFIG
- PG_TS_CONFIG_MAP
- PG_TS_DICT
- PG_TS_PARSER
- PG_TS_TEMPLATE
- PG_TYPE
- PG_USER_MAPPING
- PG_USER_STATUS
- PG_WORKLOAD_ACTION
- PGXC_CLASS
- PGXC_GROUP
- PGXC_NODE
- PLAN_TABLE_DATA
- SNAPSHOT
- TABLES_SNAP_TIMESTAMP
- 性能视图快照系统表
-
系统视图
- ALL_ALL_TABLES
- ALL_CONSTRAINTS
- ALL_CONS_COLUMNS
- ALL_COL_COMMENTS
- ALL_DEPENDENCIES
- ALL_IND_COLUMNS
- ALL_IND_EXPRESSIONS
- ALL_INDEXES
- ALL_OBJECTS
- ALL_PROCEDURES
- ALL_SEQUENCES
- ALL_SOURCE
- ALL_SYNONYMS
- ALL_TAB_COLUMNS
- ALL_TAB_COMMENTS
- ALL_TABLES
- ALL_USERS
- ALL_VIEWS
- DBA_DATA_FILES
- DBA_USERS
- DBA_COL_COMMENTS
- DBA_CONSTRAINTS
- DBA_CONS_COLUMNS
- DBA_IND_COLUMNS
- DBA_IND_EXPRESSIONS
- DBA_IND_PARTITIONS
- DBA_INDEXES
- DBA_OBJECTS
- DBA_PART_INDEXES
- DBA_PART_TABLES
- DBA_PROCEDURES
- DBA_SEQUENCES
- DBA_SOURCE
- DBA_SYNONYMS
- DBA_TAB_COLUMNS
- DBA_TAB_COMMENTS
- DBA_TAB_PARTITIONS
- DBA_TABLES
- DBA_TABLESPACES
- DBA_TRIGGERS
- DBA_VIEWS
- DUAL
- GLOBAL_COLUMN_TABLE_IO_STAT
- GLOBAL_REDO_STAT
- GLOBAL_REL_IOSTAT
- GLOBAL_ROW_TABLE_IO_STAT
- GLOBAL_STAT_DATABASE
- GLOBAL_TABLE_CHANGE_STAT
- GLOBAL_TABLE_STAT
- GLOBAL_WORKLOAD_SQL_COUNT
- GLOBAL_WORKLOAD_SQL_ELAPSE_TIME
- GLOBAL_WORKLOAD_TRANSACTION
- GS_ALL_CONTROL_GROUP_INFO
- GS_CLUSTER_RESOURCE_INFO
- GS_COLUMN_TABLE_IO_STAT
- GS_INSTR_UNIQUE_SQL
- GS_NODE_STAT_RESET_TIME
- GS_REL_IOSTAT
- GS_RESPOOL_RUNTIME_INFO
- GS_RESPOOL_RESOURCE_INFO
- GS_ROW_TABLE_IO_STAT
- GS_SESSION_CPU_STATISTICS
- GS_SESSION_MEMORY_STATISTICS
- GS_SQL_COUNT
- GS_STAT_DB_CU
- GS_STAT_SESSION_CU
- GS_TABLE_CHANGE_STAT
- GS_TABLE_STAT
- GS_TOTAL_NODEGROUP_MEMORY_DETAIL
- GS_USER_TRANSACTION
- GS_VIEW_DEPENDENCY
- GS_VIEW_DEPENDENCY_PATH
- GS_VIEW_INVALID
- GS_WAIT_EVENTS
- GS_WLM_OPERATOR_INFO
- GS_WLM_OPERATOR_HISTORY
- GS_WLM_OPERATOR_STATISTICS
- GS_WLM_SESSION_INFO
- GS_WLM_SESSION_HISTORY
- GS_WLM_SESSION_STATISTICS
- GS_WLM_SQL_ALLOW
- GS_WORKLOAD_SQL_COUNT
- GS_WORKLOAD_SQL_ELAPSE_TIME
- GS_WORKLOAD_TRANSACTION
- MPP_TABLES
- PG_AVAILABLE_EXTENSION_VERSIONS
- PG_AVAILABLE_EXTENSIONS
- PG_BULKLOAD_STATISTICS
- PG_COMM_CLIENT_INFO
- PG_COMM_DELAY
- PG_COMM_STATUS
- PG_COMM_RECV_STREAM
- PG_COMM_SEND_STREAM
- PG_COMM_QUERY_SPEED
- PG_CONTROL_GROUP_CONFIG
- PG_CURSORS
- PG_EXT_STATS
- PG_GET_INVALID_BACKENDS
- PG_GET_SENDERS_CATCHUP_TIME
- PG_GROUP
- PG_INDEXES
- PG_JOB
- PG_JOB_PROC
- PG_JOB_SINGLE
- PG_LIFECYCLE_DATA_DISTRIBUTE
- PG_LOCKS
- PG_NODE_ENV
- PG_OS_THREADS
- PG_POOLER_STATUS
- PG_PREPARED_STATEMENTS
- PG_PREPARED_XACTS
- PG_QUERYBAND_ACTION
- PG_REPLICATION_SLOTS
- PG_ROLES
- PG_RULES
- PG_RUNNING_XACTS
- PG_SECLABELS
- PG_SESSION_WLMSTAT
- PG_SESSION_IOSTAT
- PG_SETTINGS
- PG_SHADOW
- PG_SHARED_MEMORY_DETAIL
- PG_STATS
- PG_STAT_ACTIVITY
- PG_STAT_ALL_INDEXES
- PG_STAT_ALL_TABLES
- PG_STAT_BAD_BLOCK
- PG_STAT_BGWRITER
- PG_STAT_DATABASE
- PG_STAT_DATABASE_CONFLICTS
- PG_STAT_GET_MEM_MBYTES_RESERVED
- PG_STAT_USER_FUNCTIONS
- PG_STAT_USER_INDEXES
- PG_STAT_USER_TABLES
- PG_STAT_REPLICATION
- PG_STAT_SYS_INDEXES
- PG_STAT_SYS_TABLES
- PG_STAT_XACT_ALL_TABLES
- PG_STAT_XACT_SYS_TABLES
- PG_STAT_XACT_USER_FUNCTIONS
- PG_STAT_XACT_USER_TABLES
- PG_STATIO_ALL_INDEXES
- PG_STATIO_ALL_SEQUENCES
- PG_STATIO_ALL_TABLES
- PG_STATIO_SYS_INDEXES
- PG_STATIO_SYS_SEQUENCES
- PG_STATIO_SYS_TABLES
- PG_STATIO_USER_INDEXES
- PG_STATIO_USER_SEQUENCES
- PG_STATIO_USER_TABLES
- PG_THREAD_WAIT_STATUS
- PG_TABLES
- PG_TDE_INFO
- PG_TIMEZONE_ABBREVS
- PG_TIMEZONE_NAMES
- PG_TOTAL_MEMORY_DETAIL
- PG_TOTAL_SCHEMA_INFO
- PG_TOTAL_USER_RESOURCE_INFO
- PG_USER
- PG_USER_MAPPINGS
- PG_VIEWS
- PG_WLM_STATISTICS
- PGXC_BULKLOAD_PROGRESS
- PGXC_BULKLOAD_STATISTICS
- PGXC_COLUMN_TABLE_IO_STAT
- PGXC_COMM_CLIENT_INFO
- PGXC_COMM_DELAY
- PGXC_COMM_RECV_STREAM
- PGXC_COMM_SEND_STREAM
- PGXC_COMM_STATUS
- PGXC_COMM_QUERY_SPEED
- PGXC_DEADLOCK
- PGXC_GET_STAT_ALL_TABLES
- PGXC_GET_STAT_ALL_PARTITIONS
- PGXC_GET_TABLE_SKEWNESS
- PGXC_GTM_SNAPSHOT_STATUS
- PGXC_INSTANCE_TIME
- PGXC_LOCKWAIT_DETAIL
- PGXC_INSTR_UNIQUE_SQL
- PGXC_LOCK_CONFLICTS
- PGXC_NODE_ENV
- PGXC_NODE_STAT_RESET_TIME
- PGXC_OS_RUN_INFO
- PGXC_OS_THREADS
- PGXC_PREPARED_XACTS
- PGXC_REDO_STAT
- PGXC_REL_IOSTAT
- PGXC_REPLICATION_SLOTS
- PGXC_RESPOOL_RUNTIME_INFO
- PGXC_RESPOOL_RESOURCE_INFO
- PGXC_RESPOOL_RESOURCE_HISTORY
- PGXC_ROW_TABLE_IO_STAT
- PGXC_RUNNING_XACTS
- PGXC_SETTINGS
- PGXC_SESSION_WLMSTAT
- PGXC_STAT_ACTIVITY
- PGXC_STAT_BAD_BLOCK
- PGXC_STAT_BGWRITER
- PGXC_STAT_DATABASE
- PGXC_STAT_REPLICATION
- PGXC_STAT_TABLE_DIRTY
- PGXC_SQL_COUNT
- PGXC_TABLE_CHANGE_STAT
- PGXC_TABLE_STAT
- PGXC_THREAD_WAIT_STATUS
- PGXC_TOTAL_MEMORY_DETAIL
- PGXC_TOTAL_SCHEMA_INFO
- PGXC_TOTAL_SCHEMA_INFO_ANALYZE
- PGXC_USER_TRANSACTION
- PGXC_VARIABLE_INFO
- PGXC_WAIT_DETAIL
- PGXC_WAIT_EVENTS
- PGXC_WLM_OPERATOR_HISTORY
- PGXC_WLM_OPERATOR_INFO
- PGXC_WLM_OPERATOR_STATISTICS
- PGXC_WLM_SESSION_INFO
- PGXC_WLM_SESSION_HISTORY
- PGXC_WLM_SESSION_STATISTICS
- PGXC_WLM_WORKLOAD_RECORDS
- PGXC_WORKLOAD_SQL_COUNT
- PGXC_WORKLOAD_SQL_ELAPSE_TIME
- PGXC_WORKLOAD_TRANSACTION
- PLAN_TABLE
- PV_FILE_STAT
- PV_INSTANCE_TIME
- PV_OS_RUN_INFO
- PV_SESSION_MEMORY
- PV_SESSION_MEMORY_DETAIL
- PV_SESSION_STAT
- PV_SESSION_TIME
- PV_TOTAL_MEMORY_DETAIL
- PV_REDO_STAT
- REDACTION_COLUMNS
- REDACTION_POLICIES
- REMOTE_TABLE_STAT
- USER_COL_COMMENTS
- USER_CONSTRAINTS
- USER_CONS_COLUMNS
- USER_INDEXES
- USER_IND_COLUMNS
- USER_IND_EXPRESSIONS
- USER_IND_PARTITIONS
- USER_JOBS
- USER_OBJECTS
- USER_PART_INDEXES
- USER_PART_TABLES
- USER_PROCEDURES
- USER_SEQUENCES
- USER_SOURCE
- USER_SYNONYMS
- USER_TAB_COLUMNS
- USER_TAB_COMMENTS
- USER_TAB_PARTITIONS
- USER_TABLES
- USER_TRIGGERS
- USER_VIEWS
- V$SESSION
- V$SESSION_LONGOPS
- GaussDB(DWS)数据库GUC参数
- GaussDB(DWS)开发者术语表
- 实时数仓开发指南(9.1.0.x)
- 实时数仓开发指南(8.1.3.x)
- 历史版本
-
标准数仓开发指南(9.1.0.x)
-
SQL语法参考
-
SQL语法参考(9.1.0.x)
- GaussDB(DWS) SQL概述
- 与PostgreSQL的差异
- 关键字
- 数据类型
- 常量与宏
-
函数和操作符
- 字符处理函数和操作符
- 二进制字符串函数和操作符
- 位串函数和操作符
- 数字操作函数和操作符
- 时间、日期处理函数和操作符
- SEQUENCE函数
- 数组函数和操作符
- 逻辑操作符
- 比较操作符
- 模式匹配操作符
- 聚集函数
- 窗口函数
- 类型转换函数
- JSON/JSONB函数和操作符
- 安全函数
- 条件表达式函数
- 范围函数和操作符
- 数据脱敏函数
- 位图函数和操作符
- UUID函数
- 文本检索函数和操作符
- HLL函数和操作符
- 返回集合的函数
- 几何函数和操作符
- 网络地址函数和操作符
- 系统信息函数
- 系统管理函数
- 备份恢复控制函数
- 数据库对象函数
- 残留文件管理函数
- 统计信息函数
- 触发器函数
- XML函数
- 调用栈记录函数
- Hudi系统函数
- 漏斗函数和留存函数
- EXTERNAL SCHEMA系统函数
- 存算分离函数
- 表达式
- 类型转换
- 全文检索
- 系统操作
- 事务管理
-
DDL语法
- DDL语法一览表
- ALTER BLOCK RULE
- ALTER DATABASE
- ALTER EXCEPT RULE
- ALTER EXTERNAL SCHEMA
- ALTER FOREIGN TABLE (GDS导入导出)
- ALTER FOREIGN TABLE (For HDFS or OBS)
- ALTER FUNCTION
- ALTER GROUP
- ALTER INDEX
- ALTER LARGE OBJECT
- ALTER MATERIALIZED VIEW
- ALTER PUBLICATION
- ALTER REDACTION POLICY
- ALTER RESOURCE POOL
- ALTER ROLE
- ALTER SUBSCRIPTION
- ALTER ROW LEVEL SECURITY POLICY
- ALTER SCHEMA
- ALTER SEQUENCE
- ALTER SERVER
- ALTER SESSION
- ALTER SYNONYM
- ALTER SYSTEM KILL SESSION
- ALTER TABLE
- ALTER TABLE PARTITION
- ALTER TEXT SEARCH CONFIGURATION
- ALTER TEXT SEARCH DICTIONARY
- ALTER TRIGGER
- ALTER TYPE
- ALTER USER
- ALTER VIEW
- CLEAN CONNECTION
- CLOSE
- CLUSTER
- COMMENT
- CREATE BARRIER
- CREATE BLOCK RULE
- CREATE DATABASE
- CREATE EXCEPT RULE
- CREATE EXTERNAL SCHEMA
- CREATE FOREIGN TABLE (GDS导入导出)
- CREATE FOREIGN TABLE (SQL on OBS or Hadoop)
- CREATE FOREIGN TABLE (OBS导入导出)
- CREATE FUNCTION
- CREATE GROUP
- CREATE INDEX
- CREATE MATERIALIZED VIEW
- CREATE PROCEDURE
- CREATE PUBLICATION
- CREATE REDACTION POLICY
- CREATE ROW LEVEL SECURITY POLICY
- CREATE RESOURCE POOL
- CREATE ROLE
- CREATE SCHEMA
- CREATE SEQUENCE
- CREATE SERVER
- CREATE SUBSCRIPTION
- CREATE SYNONYM
- CREATE TABLE
- CREATE TABLE AS
- CREATE TABLE PARTITION
- CREATE TEXT SEARCH CONFIGURATION
- CREATE TEXT SEARCH DICTIONARY
- CREATE TRIGGER
- CREATE TYPE
- CREATE USER
- CREATE VIEW
- CURSOR
- DISCARD
- DROP BLOCK RULE
- DROP DATABASE
- DROP EXCEPT RULE
- DROP FOREIGN TABLE
- DROP FUNCTION
- DROP GROUP
- DROP INDEX
- DROP MATERIALIZED VIEW
- DROP OWNED
- DROP PUBLICATION
- DROP REDACTION POLICY
- DROP ROW LEVEL SECURITY POLICY
- DROP PROCEDURE
- DROP RESOURCE POOL
- DROP ROLE
- DROP SCHEMA
- DROP SEQUENCE
- DROP SERVER
- DROP SUBSCRIPTION
- DROP SYNONYM
- DROP TABLE
- DROP TEXT SEARCH CONFIGURATION
- DROP TEXT SEARCH DICTIONARY
- DROP TRIGGER
- DROP TYPE
- DROP USER
- DROP VIEW
- FETCH
- MOVE
- REFRESH MATERIALIZED VIEW
- REINDEX
- RENAME TABLE
- RESET
- SET
- SET CONSTRAINTS
- SET ROLE
- SET SESSION AUTHORIZATION
- SHOW
- TRUNCATE
- VACUUM
- DML语法
- DCL语法
- DQL语法
- TCL语法
-
SQL语法参考(8.1.3.x)
- GaussDB(DWS) SQL概述
- 与PostgreSQL的差异
- 关键字
- 数据类型
- 常量与宏
- 函数和操作符
- 表达式
- 类型转换
- 全文检索
- 系统操作
- 事务管理
-
DDL语法
- DDL语法一览表
- ALTER DATABASE
- ALTER FOREIGN TABLE (GDS导入导出)
- ALTER FOREIGN TABLE (For HDFS or OBS)
- ALTER FUNCTION
- ALTER GROUP
- ALTER INDEX
- ALTER LARGE OBJECT
- ALTER REDACTION POLICY
- ALTER RESOURCE POOL
- ALTER ROLE
- ALTER ROW LEVEL SECURITY POLICY
- ALTER SCHEMA
- ALTER SEQUENCE
- ALTER SERVER
- ALTER SESSION
- ALTER SYNONYM
- ALTER SYSTEM KILL SESSION
- ALTER TABLE
- ALTER TABLE PARTITION
- ALTER TEXT SEARCH CONFIGURATION
- ALTER TEXT SEARCH DICTIONARY
- ALTER TRIGGER
- ALTER TYPE
- ALTER USER
- ALTER VIEW
- CLEAN CONNECTION
- CLOSE
- CLUSTER
- COMMENT
- CREATE BARRIER
- CREATE DATABASE
- CREATE FOREIGN TABLE (GDS导入导出)
- CREATE FOREIGN TABLE (SQL on OBS or Hadoop)
- CREATE FOREIGN TABLE (OBS导入导出)
- CREATE FUNCTION
- CREATE GROUP
- CREATE INDEX
- CREATE REDACTION POLICY
- CREATE ROW LEVEL SECURITY POLICY
- CREATE PROCEDURE
- CREATE RESOURCE POOL
- CREATE ROLE
- CREATE SCHEMA
- CREATE SEQUENCE
- CREATE SERVER
- CREATE SYNONYM
- CREATE TABLE
- CREATE TABLE AS
- CREATE TABLE PARTITION
- CREATE TEXT SEARCH CONFIGURATION
- CREATE TEXT SEARCH DICTIONARY
- CREATE TRIGGER
- CREATE TYPE
- CREATE USER
- CREATE VIEW
- CURSOR
- DROP DATABASE
- DROP FOREIGN TABLE
- DROP FUNCTION
- DROP GROUP
- DROP INDEX
- DROP OWNED
- DROP REDACTION POLICY
- DROP ROW LEVEL SECURITY POLICY
- DROP PROCEDURE
- DROP RESOURCE POOL
- DROP ROLE
- DROP SCHEMA
- DROP SEQUENCE
- DROP SERVER
- DROP SYNONYM
- DROP TABLE
- DROP TEXT SEARCH CONFIGURATION
- DROP TEXT SEARCH DICTIONARY
- DROP TRIGGER
- DROP TYPE
- DROP USER
- DROP VIEW
- FETCH
- MOVE
- REINDEX
- RENAME TABLE
- RESET
- SET
- SET CONSTRAINTS
- SET ROLE
- SET SESSION AUTHORIZATION
- SHOW
- TRUNCATE
- VACUUM
- DML语法
- DCL语法
- DQL语法
- TCL语法
- 历史版本
-
SQL语法参考(9.1.0.x)
-
工具指南
- 工具简介
- 工具下载
- gsql
- Data Studio
- GDS
-
DSC
- 前言
- DSC简介
- 使用DSC
- Teradata语法迁移
-
MySQL语法迁移
- 支持的关键词和特性
- 数据类型
- 函数和表达式
-
表(可选参数、操作)
- ALGORITHM
- ALTER TABLE RENAME
- AUTO_INCREMENT
- AVG_ROW_LENGTH
- BLOCK_SIZE
- CHARSET
- CHECKSUM
- CLUSTERED KEY
- COLLATE
- COMMENT
- CONNECTION
- DEFAULT
- DELAY_KEY_WRITE
- DISTRIBUTE BY
- DIRECTORY
- ENGINE
- FOREIGN_KEY_CHECKS
- IF NOT EXISTS
- INDEX_ALL
- INSERT_METHOD
- KEY_BLOCK_SIZE
- LOCK
- MAX_ROWS
- MIN_ROWS
- PACK_KEYS
- PARTITION BY
- PASSWORD
- ROW_FORMAT
- STATS_AUTO_RECALC
- STATS_PERSISTENT
- STATS_SAMPLE_PAGES
- UNION
- WITH AS
- CHANGE修改列
- CHECK约束
- DROP删除表
- LIKE 表克隆
- MODIFY修改列
- TRUNCATE 删除表
- ROUNDROBIN表
- RENAME 重命名表名
- 设置与清除列默认值
- 字段名重命名
- 行列存压缩
- 添加与删除列
- 索引
- 注释
- 数据库
- 数据操作语句(DML)
- 事务管理和数据库管理
- SQL-Server语法迁移
- Oracle语法迁移
- Netezza语法迁移
- DSC常见问题
- 故障处理
- 术语表
- DataCheck
- DWS-Connector
- 服务端工具
-
API参考
- 使用前必读
- API概述
- 如何调用API
- 快速入门
-
API说明
- 可用区
-
集群管理
- 创建集群
- V2创建集群
- 创建逻辑集群
- 物理集群转换到逻辑集群
- 查询集群列表
- 查询逻辑集群列表
- 查询逻辑集群任务信息
- 查询逻辑集群磁盘信息
- 查询节点列表
- 查询逻辑集群可用ring环节点信息
- 查询集群拓扑ring环节点信息
- 查询集群详情
- 查询节点类型
- 删除集群
- 删除逻辑集群
- 编辑逻辑集群
- 重启逻辑集群
- 切换逻辑集群开关
- 删除空闲节点
- 从空闲节点扩容
- 恢复重分布
- 暂停重分布
- 重启集群
- 扩容集群
- 重置密码
- 创建集群前检查
- 集群缩容
- 下发重分布
- 查询重分布详情
- 查询专属分布式存储池列表
- 查询资源统计信息列表
- 主备恢复
- 解除只读
- 磁盘扩容
- 修改运维时间窗
- 查询集群CN节点
- 批量增加CN节点
- 批量删除CN节点
- 查询集群参数组
- 查询集群参数配置
- 修改集群参数配置
- 快照统计信息
- 查询合适的缩容数
- 查询参数修改审计记录
- 保存集群描述信息
- 查询单个实例
- 启动集群
- 停止集群
- 快照管理
- 事件管理
- 数据源
- 审计日志
- 资源管理
- 告警管理
- 连接管理
- 标签管理
- 配额管理
- 容灾管理
- 任务管理
- 主机监控
- 数据库权限管理
- 日志管理
- 升级管理
- 应用示例
- 权限及授权项说明
- 附录
- SDK参考
- 场景代码示例
-
错误码参考
- 控制台错误码
-
错误码(8.2.0及以下版本)
- 管理控制台错误码
-
数据仓库错误码
- SQL标准错误码说明
- 第三方库错误码说明
- GAUSS-00001 -- GAUSS-00100
- GAUSS-00101 -- GAUSS-00200
- GAUSS-00201 -- GAUSS-00300
- GAUSS-00301 -- GAUSS-00400
- GAUSS-00401 -- GAUSS-00500
- GAUSS-00501 -- GAUSS-00600
- GAUSS-00601 -- GAUSS-00700
- GAUSS-00701 -- GAUSS-00800
- GAUSS-00801 -- GAUSS-00900
- GAUSS-00901 -- GAUSS-01000
- GAUSS-01001 -- GAUSS-01100
- GAUSS-01101 -- GAUSS-01200
- GAUSS-01201 -- GAUSS-01300
- GAUSS-01301 -- GAUSS-01400
- GAUSS-01401 -- GAUSS-01500
- GAUSS-01501 -- GAUSS-01600
- GAUSS-01601 -- GAUSS-01700
- GAUSS-01701 -- GAUSS-01800
- GAUSS-01801 -- GAUSS-01900
- GAUSS-01901 -- GAUSS-02000
- GAUSS-02001 -- GAUSS-02100
- GAUSS-02101 -- GAUSS-02200
- GAUSS-02201 -- GAUSS-02300
- GAUSS-02301 -- GAUSS-02400
- GAUSS-02401 -- GAUSS-02500
- GAUSS-02501 -- GAUSS-02600
- GAUSS-02601 -- GAUSS-02700
- GAUSS-02701 -- GAUSS-02800
- GAUSS-02801 -- GAUSS-02900
- GAUSS-02901 -- GAUSS-03000
- GAUSS-03001 -- GAUSS-03100
- GAUSS-03101 -- GAUSS-03200
- GAUSS-03201 -- GAUSS-03300
- GAUSS-03301 -- GAUSS-03400
- GAUSS-03401 -- GAUSS-03500
- GAUSS-03501 -- GAUSS-03600
- GAUSS-03601 -- GAUSS-03700
- GAUSS-03701 -- GAUSS-03800
- GAUSS-03801 -- GAUSS-03900
- GAUSS-03901 -- GAUSS-04000
- GAUSS-04001 -- GAUSS-04100
- GAUSS-04101 -- GAUSS-04200
- GAUSS-04201 -- GAUSS-04300
- GAUSS-04301 -- GAUSS-04400
- GAUSS-04401 -- GAUSS-04500
- GAUSS-04501 -- GAUSS-04600
- GAUSS-04601 -- GAUSS-04700
- GAUSS-04701 -- GAUSS-04800
- GAUSS-04901 -- GAUSS-04999
- GAUSS-05101 -- GAUSS-05200
- GAUSS-05201 -- GAUSS-05800
- GAUSS-05801 -- GAUSS-05900
- GAUSS-05901 -- GAUSS-05999
- GAUSS-06101 -- GAUSS-06200
- GAUSS-50000 -- GAUSS-50999
- GAUSS-51000 -- GAUSS-51999
- GAUSS-52000 -- GAUSS-52999
- GAUSS-53000 -- GAUSS-53999
- OE000
- 8.2.1及以上版本
-
常见问题
- Top问题汇总
- 帮助与支持
- 产品咨询
- 数据库连接
- 数据迁移
-
数据库使用
- 如何调整GaussDB(DWS)分布列?
- 如何查看和设置GaussDB(DWS)数据库的字符集编码格式
- 如何处理GaussDB(DWS)建表时date类型字段自动转换为timestamp类型的问题?
- GaussDB(DWS)是否需要定时对常用的表做VACUUM FULL和ANALYZE操作?
- 如何导出GaussDB(DWS)某张表结构?
- GaussDB(DWS)是否有高效的删除表数据的方法?
- 如何查看GaussDB(DWS)外部表信息?
- 如果GaussDB(DWS)建表时没有指定分布列,数据会怎么存储?
- 如何将GaussDB(DWS)联结查询的null结果替换成0?
- 如何查看GaussDB(DWS)表是行存还是列存?
- GaussDB(DWS)列存表的常用信息查询
- GaussDB(DWS)查询时索引失效场景解析
- 如何使用GaussDB(DWS)自定义函数改写CRC32()函数
- GaussDB(DWS)以pg_toast_temp*或pg_temp*开头的Schema是什么?
- GaussDB(DWS)查询时结果不一致的常见场景和解决方法
- GaussDB(DWS)哪些系统表不能做VACUUM FULL
- GaussDB(DWS)语句处于idle in transaction状态常见场景
- GaussDB(DWS)如何实现行转列及列转行?
- GaussDB(DWS)唯一约束和唯一索引有什么区别?
- GaussDB(DWS)函数和存储过程有什么区别?
- GaussDB(DWS)字符截取函数substrb()、substr()及substring()的用法及差异
- 如何删除GaussDB(DWS)重复的表数据?
-
集群管理
- 如何清理与回收GaussDB(DWS)存储空间?
- 为什么GaussDB(DWS)扩容后已使用存储容量比扩容前减少了很多?
- GaussDB(DWS)的磁盘空间/容量是如何统计的?
- GaussDB(DWS)添加云监控服务的告警规则时会话数阈值如何设置?
- 如何判断GaussDB(DWS)集群是x86还是ARM架构?
- GaussDB(DWS)扩容检查不通过怎么办?
- GaussDB(DWS)增加CN和扩容集群分别在什么场景下使用?
- GaussDB(DWS)经典变更规格与弹性变更规格、扩容、缩容分别在什么场景下使用?
- GaussDB(DWS)在CPU核数、内存相同的情况下,小规格多节点与大规格三节点集群如何选择?
- GaussDB(DWS) SSD云盘和SSD本地盘的区别?
- GaussDB(DWS)热数据存储和冷数据存储的区别?
- GaussDB(DWS)缩容按钮置灰如何处理?
- 账户与权限
- 数据库性能
- 备份恢复
-
故障排除
- 数据库连接管理
- JDBC/ODBC类
-
数据导入/导出
- 使用COPY FROM导入时报错“invalid byte sequence for encoding "UTF8": 0x00”
- GDS导入/导出类问题
- 创建GDS外表失败,提示不支持ROUNDROBIN
- 通过CDM将MySQL数据导入GaussDB(DWS)时出现字段超长,数据同步失败
- 执行创建OBS外表的SQL语句时,提示Access Denied
- GDS导入失败后,磁盘占用空间增大
- GDS导入数据时,脚本执行报错:out of memory
- 使用GDS传输数据的过程中,报错:connection failure error
- 使用DataArts Studio服务创建GaussDB(DWS)外表时不支持中文,如何处理
- 数据库参数修改
- 账号/权限/密码
-
集群性能
- 锁等待检测
- 执行SQL时出现表死锁,提示LOCK_WAIT_TIMEOUT锁等待超时
- 执行SQL时报错:abort transaction due to concurrent update
- 磁盘使用率高&集群只读处理方案
- SQL执行很慢,性能低,有时长时间运行未结束
- 数据倾斜导致SQL执行慢,大表SQL执行无结果
- VACUUM FULL一张表后,表文件大小无变化
- 删除表数据后执行了VACUUM,但存储空间并没有释放
- 执行VACUUM FULL命令时报错:Lock wait timeout
- VACUUM FULL执行慢
- 表数据膨胀导致SQL查询慢,用户前台页面数据加载不出
- 集群报错内存溢出
- 带自定义函数的语句不下推
- 列存表更新失败或多次更新后出现表膨胀
- 列存表多次插入后出现表膨胀
- 往GaussDB(DWS)写数据慢,客户端数据会有积压
- 分析查询效率异常降低的问题
- 未收集统计信息导致查询性能差
- 执行计划中有NestLoop导致SQL语句执行慢
- 未分区剪枝导致SQL查询慢
- 行数估算过小,优化器选择走NestLoop导致性能下降
- 语句中存在“in 常量”导致SQL执行无结果
- 单表点查询性能差
- 动态负载管理下的CCN排队
- 数据膨胀磁盘空间不足,导致性能降低
- 列存小CU多导致的性能慢问题
- 降低I/O的处理方案
- 高CPU系统性能调优方案
- 降低内存的处理方案
- 集群异常
-
数据库使用
- 插入或更新数据时报错,提示分布键不能被更新
- VARCHAR(n)存储中文字符,提示value too long for type character varying?
- SQL语句中字段名大小写敏感问题
- 删除表时报错:cannot drop table test because other objects depend on it
- 多个表同时进行MERGE INTO UPDATE时,执行失败
- session_timeout设置导致JDBC业务报错
- DROP TABLE失败
- 使用string_agg函数查询执行结果不稳定
- 查询表大小时报错“could not open relation with OID xxx”
- DROP TABLE IF EXISTS语法误区
- 不同用户查询同表显示数据不同
- 修改索引只调用索引名提示索引不存在
- 执行CREATE SCHEMA语句时,报错SCHEMA已存在
- 删除数据库失败,提示有session正在连接
- 在Java中,读取character类型的表字段时返回类型为什么是byte?
- 执行表分区操作时,报错:start value of partition "xxx" NOT EQUAL up-boundary of last partition
- 重建索引失败
- 视图查询时执行失败
- 全局SQL查询
- 如何判断表是否执行过UPDATE或DELETE
- 执行业务报错“Can't fit xid into page”
- 执行业务报错:unable to get a stable set of rows in the source table
- DWS元数据不一致-分区索引异常
- 对系统表gs_wlm_session_info执行TRUNCATE命令报错
- 分区表插入数据报错:inserted partition key does not map to any table partition
- 范围分区表添加新分区报错upper boundary of adding partition MUST overtop last existing partition
- 查询表报错:missing chunk number %d for toast value %u in pg_toast_XXXX
- 向表中插入数据报错:duplicate key value violates unique constraint "%s"
- 执行业务报错could not determine which collation to use for string hashing
- 使用GaussDB(DWS) 的ODBC驱动,SQL查询结果中字符类型的字段内容会被截断
- 执行Plan Hint的Scan方式不生效
- 数据类型转换出现报错:invalid input syntax for xxx
- 使用substring截取带中文的数据时出现乱码
- 业务报错:UNION types %s and %s cannot be matched
- 更新报错ERROR:Non-deterministic UPDATE
- 插入数据报错:null value in column '%s' violates not-null constraint
- 业务报错:unable to get a stable set of rows in the source table
- Oracle/TD/MySQL兼容模式下查询结果不一致
- 视频帮助
- 性能白皮书
- 文档下载
- 通用参考
链接复制成功!
CREATE FOREIGN TABLE (GDS导入导出)
创建GDS外表。
功能描述
在当前数据库创建一个GDS外表,用于数据并行导入导出。GDS外表分为只读外表和只写外表,分别用于数据并行导入和并行导出,缺省为只读外表。
注意事项
- 外表由命令执行者所有;
- GDS外表不需要显式指定分布方式,默认支持ROUNDROBIN分布方式;
- 对于GDS外表指定任何约束(列约束、表约束等)均不生效。
- GDS导入导出支持的文件格式:TEXT、CSV和FIXED。
语法格式
1 2 3 4 5 6 7 8 9 |
CREATE FOREIGN TABLE [ IF NOT EXISTS ] table_name ( [ { column_name type_name POSITION(offset,length) | LIKE source_table } [, ...] ] ) SERVER gsmpp_server OPTIONS ( { option_name ' value ' } [, ...] ) [ { WRITE ONLY | READ ONLY }] [ WITH error_table_name | LOG INTO error_table_name] [REMOTE LOG 'name'] [PER NODE REJECT LIMIT 'value'] [ TO { GROUP groupname | NODE ( nodename [, ... ] ) } ]; |
参数概览
创建外表语法提供了多个参数,常用参数分类如下。
- 必需参数
- table_name
- column_name
- type_name
- SERVER gsmpp_server
- OPTIONS可选参数
- 外表的数据源位置参数location
- 数据格式参数
- format
- header(仅支持CSV,FIXED格式)
- fileheader(仅支持CSV,FIXED格式)
- out_filename_prefix
- delimiter
- quote(仅支持CSV格式)
- escape(仅支持CSV格式)
- null
- noescaping(仅支持TEXT格式)
- encoding
- dataencoding (仅支持latin1数据库)
- eol
- conflict_delimiter
- file_type
- auto_create_pipe
- del_pipe
- gds_compress
- preserve_blanks(仅支持FIXED格式)
- blank_number_str_to_null
- 容错性参数
- 性能参数
- 可选参数
参数说明
- IF NOT EXISTS
如果已经存在相同名称的表,不会抛出一个错误,而会发出一个通知,告知表关系已存在。
- table_name
外表的表名。
取值范围:字符串,要符合标识符的命名规范。
- column_name
外表中的字段名。
取值范围:字符串,要符合标识符的命名规范。
- type_name
字段的数据类型。
- POSITION(offset,length)
在固定长度模式中,定义每一个字段在数据文件中的位置。
offset为该字段在数据源文件中的起始位置,length为该字段的长度。
取值范围:offset取值不能小于0字节,单位为字节。
每条记录的长度不能大于1GB,文件中没有出现的列默认以空值代替。
- SERVER gsmpp_server
外表的server名字。对于GDS外表,其server是初始数据库默认创建的,即gsmpp_server。
- OPTIONS ( { option_name ' value ' } [, ...] )
用于指定外表数据的各类参数。
- location
外表的数据源位置,目前支持URL方式的描述。多个URL使用‘|’分隔。
gds目前可以支持导出的时候自动创建外表定义的目录。 如外表location定义“gsfs:// 192.168.0.91:5000/2019/09”执行导出任务的时候,如果gds数据目录下的子目录“2019/09”不存在则会自动的创建该子目录,不需要用户手动创建外表中指定的目录。
- 对于使用GDS从远端服务器并行导入时的只读外表(默认为只读)的URL末尾必须指定文件的匹配模式或者文件名。
例如: gsfs://192.168.0.90:5000/*或者file:///data/data.txt或者gsfs:// 192.168.0.90:5000/* | gsfs:// 192.168.0.91:5000/*
- 对于使用GDS并行导出到远端服务器时的只写外表,URL不需要指定文件名。当导出数据文件存储位置为远端URL时,例如gsfs:// 192.168.0.90:5000/,则数据源位置可指定多个,此时:若导出数据文件存储位置数量小于等于数据节点数量时,使用此外部表执行导出任务,数据将被平均分配至各数据源位置;若导出数据存储位置数量大于数据节点数量时,执行导出任务,数据将被平均分配给此位置列表中从前端开始等于数据节点数量的数据源位置下,剩余数据源位置仍会创建数据文件,但文件中不会有任何数据。
- 对于使用GDS从远端服务器并行导入时的只读外表,URL个数应小于DN个数,且不能使用多个location相同的URL。
- 当使用gsfss协议,即当URL为“gsfss://”开头,进行加密导入导出时,并发数量不能超过10。
- gds导出时location指定的文件路径“gsfs://127.0.0.1:7789/2019/09/”中的2019/09子目录会在执行导出任务的时候自动创建。
- 设置file_type为“pipe”时,GDS会根据URL中最后一个字符是否为“/”来判断导入导出的目标是管道文件还是目录。如:
- gsfs://192.168.0.90:5000/a/b,GDS会将b识别成一个管道文件。
- gsfs://192.168.0.90:5000/a/b/,GDS将b识别成一个目录,并在b目录下创建管道文件。
- 对于使用GDS从远端服务器并行导入时的只读外表(默认为只读)的URL末尾必须指定文件的匹配模式或者文件名。
- format
取值范围:CSV、TEXT、FIXED,缺省值为TEXT。
- CSV格式的文件,对一些转义序列按照普通字符串进行处理,因此可以有效处理数据列中的换行符。
- TEXT格式的文件,可以有效处理一些转义序列,因此无法正确处理数据列中的换行符。
- FIXED格式的文件,适用于每条数据的数据列都比较固定的数据,长度不足的列会添加空格补齐。
- 转义序列指的是反斜杠开头的字符串,包括:\b(退格)、\f(换页)、\n(换行)、\r(回车)、\t(横向制表)、\v(纵向制表)、\数字(八进制编码)、\x数字(十六进制编码)。TEXT格式可以按照本身含义进行处理,其他格式只能按照普通字符串进行处理。
- 定长格式(FIXED)定义如下。当为FIXED时,必须为每一列指定POSITION。
- 每条记录的每个字段长度相同。
- 长度不足的字段以空格填充,数字类型字段左对齐,字符字段右对齐。
- 字段和字段之间没有分隔符。
- header
指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。header只能用于CSV,FIXED格式的文件中。
在导入数据时,如果header选项为on,则数据文件中第一行会被识别为标题行,会忽略此行。如果header为off,而数据文件中第一行会被识别为数据。
在导出数据时,如果header选项为on,则需要指定fileheader。fileheader用来指定导出头文件的格式。如果header为off,则导出数据文件不包含标题行。
取值范围:true/on,false/off。缺省值为false/off。
- fileheader
指定导出数据要包含的标题行定义的文件,文件一般只包含一行用来描述每一列数据信息的字符串。
例如:在包含商品信息的数据前加标题行,定义文件如下
The information of products.\n
- 标题行定义文件仅在header为on或true的情况下有效,且需要提前写好备用。
- 在Remote导出模式下,定义文件必须放在GDS的工作目录(即启动gds时指定的-d路径)下。
- 定义文件只能包含一行标题信息,并以换行符结尾,多余的行将被丢弃(标题信息不能包含换行符)。
- 定义文件包括换行符在内长度不超过1M。
- out_filename_prefix
指定write only外表导出时,GDS端生成导出数据文件的文件名前缀。
file_type设置为pipe时,会生成“dbName_schemaName_foreignTableName.pipe”的管道文件。
如果out_filename_prefix和location中都指定了管道名,则以location中指定的管道文件名为准。
- 指定文件名前缀需合法,符合GDS部署物理环境使用的文件系统的约束,否则出现文件创建失败:
- 指定的导出文件名前缀中不含有非法字符,其中非法字符包含但不限于'/', '?', '*', ':', '|', '\\', '<', '>', '@', '#', '$', '&', '(', ')', '+', '-',允许的字符范围为[a-z]*[A-Z]*[0-9]*和'_'
- 指定的导出文件名前缀中不可以是一些Windows和linux预留的特性字段,其中包括但不限于:
"con","aux","nul","prn","com0","com1","com2","com3","com4","com5","com6","com7","com8","com9","lpt0","lpt1","lpt2","lpt3","lpt4","lpt5","lpt6","lpt7","lpt8","lpt9"
- 指定的导出文件名前缀,与GDS -d目录和“.dat”或者“.pipe”拼接为绝对路径后必须符合GDS所在部署文件系统的文件名长度要求。
- 指定的导出文件名前缀,需要可以被数据文件的最终接收方正确解析识别(包括但不限于GDS再次导入库中),对于造成文件名解析问题的指定选项,需要用户识别。
- 在多文件同时导出的高并发导出场景下,请确认并发的导出任务不要使用同一个文件名前缀设定,否则从操作系统/文件系统层面可能会出现导出文件的覆盖和丢失。
- 指定文件名前缀需合法,符合GDS部署物理环境使用的文件系统的约束,否则出现文件创建失败:
- delimiter
指定数据文件行数据的字段分隔符,不指定则使用默认分隔符,TEXT格式的默认分隔符是水平制表符(tab),CSV格式的默认分隔符为“,”,FIXED格式没有分隔符。
- 分隔符不能是\r和\n。
- 分隔符不能和null参数相同,CSV格式数据的分隔符不能和quote参数相同。
- TEXT格式数据的分隔符不能包含: \.abcdefghijklmnopqrstuvwxyz0123456789。
- 数据文件中单行数据长度需<1GB,如果分隔符较长且数据列较多的情况下,会影响导出有效数据的长度。
- 分隔符推荐使用多字符(例如'$^&')和不可见字符(例如0x07、0x08、0x1b等)。
- 建议TEXT格式下多字符分隔符中的字符不要完全相同,例如不建议使用delimiter '---' 。
取值范围:
支持多字符分隔符,但分隔符不能超过10个字节。
- quote
用于设置将CSV格式数据源文件中的什么字符识别为引号字符。缺省值为双引号。
- quote参数不能和分隔符、null参数相同。
- quote参数只能是单字节的字符。
- 推荐不可见字符作为quote,例如0x07,0x08,0x1b等。
- escape
用来指定CSV格式的数据源文件中,什么字符为逃逸字符。逃逸字符只能指定为单字节字符。
缺省值和quote相同。
- null
取值范围:
- 在TEXT格式下缺省值是\N。
- CSV格式下缺省值是一个没有引号的空字符串。
- blank_number_str_to_null
用来指定数据文件中数值类型(INT1OID、INT2OID、INT4OID、INT8OID、FLOAT4OID、FLOAT8OID)不定数量的空格转换为NULL值。该参数仅8.1.3、8.2.1.236、9.1.0及以上集群版本支持。
例如,设置该选项为true时,定义null '',null ' '(一个空格)、null ' '(二个空格)时都返回NULL值。
取值范围:true/false,默认值为false,表示不做转换。
- noescaping
noescaping参数只在TEXT格式下有效。
取值范围:true/on,false/off。缺省值为false/off。
- encoding
指定数据文件的编码格式名称,即需要以何编码格式对数据文件进行解析和校验/输出文件为何种编码格式。缺省值为当前数据库的默认客户端编码格式,即client_encoding。
导入外表此处强烈建议指定为文件的编码格式,或根据文件的字符集在导入前对client_encoding进行设置。否则可能会导致不必要的解析、校验错误以及其导致的导入报错回滚,甚至非法数据入库。导出外表同样希望指定此选项,以避免导出采用默认字符集设置时与预期不符。
在创建外表时此选项未指定,会在客户端给出对应Warning信息。
- 目前GDS导入外表不支持解析带有多种字符集编码格式混合的文件,GDS导出外表不支持写出带有多种字符集编码格式混合的文件。
- 常用的编码格式有UTF8、GBK、GB18030,其中GB18030有两个版本,GB18030和GB18030_2022。GB18030_2022,用于支持汉字最新的国家标准GB 18030-2022。
- dataencoding
用于指定数据在latin1数据库表中的实际编码,实现GDS导入导出时数据从dataencoding与encoding之间的转换。该参数仅8.2.0及以上集群版本支持。
取值范围:GBK、GB18030、GB18030_2022、UTF8
1. 该参数仅支持在latin1的库中使用。
2. 使用该参数时,encoding参数的取值范围也被限定在GBK、GB18030、GB18030_2022和UTF8之内。
典型场景:
- 将GB编码的文本数据导入到latin1库中并转换为UTF8编码,设置dataencoding为 'UTF8',encoding为 'GB'。
- 将latin1库中GB编码的数据导出为UTF8的数据文件,设置dataencoding为 'GB',encoding为 'UTF8'。
- fill_missing_fields
当数据导入时,若数据源文件中一行的最后一个字段缺失的处理方式。
取值范围:true/on,false/off。缺省值为false/off。
- 参数为true/on,当数据导入时,若数据源文件中一行数据的最后一个字段缺失,则把最后一个字段的值设置为NULL,不报错。
- 参数为false/off,如果最后一个字段缺失会显示如下错误信息。
missing data for column "tt"
- ignore_extra_data
若数据源文件比外表定义列数多,是否会忽略对多出的列。该参数只在数据导入过程中使用。
取值范围:true/on,false/off。缺省值为false/off。
- 参数为true/on,若数据源文件比外表定义列数多,则忽略行尾多出来的列。
- 参数为false/off,若数据源文件比外表定义列数多,会显示如下错误信息。
extra data after last expected column
如果行尾换行符丢失,使两行变成一行时,设置此参数为true将导致后一行数据被忽略掉。
- reject_limit
指定本次数据导入允许出现的数据格式错误个数,当导入过程中出现的数据格式错误未达到限定值时,本次数据导入可以成功。
此语法建议用PER NODE REJECT LIMIT 'value'替代。
数据格式错误是指缺少或者多出字段值,数据类型错误或者编码错误。对于非数据格式错误,一旦发生就将导致整个数据导入失败。
取值范围:正整型值、unlimited(无限制)。
不指定该参数时,有错误信息立即返回。
指定正整型参数时需要添加单引号。
- mode
指定数据导入过程中,数据导入策略。GaussDB(DWS)只支持Normal策略。
取值范围:
- Normal(缺省值):支持所有文件格式(包括CSV、TEXT、FIXED),数据导入需要在数据服务器上启动Gauss data service协助完成。
- eol
取值范围:支持多字符换行符,但换行符不能超过10个字节。常见的换行符,如\r、\n、\r\n(设成0x0D、0x0A、0x0D0A效果是相同的),其他字符或字符串,如$、#。
- eol参数一般用于TEXT格式的导入导出,不支持CSV格式和FIXED格式导入。为了兼容原有eol参数,仍然支持导出CSV格式和FIXED格式时指定eol参数为0x0D或0x0D0A。
- 导出FIXED格式时可指定eol参数为空串'',这样会将FIXED格式数据导出为一行,但是这种方式导出的数据不支持再通过同样的方式导入到DWS数据库中。
- eol参数不能和分隔符、null参数相同。
- eol参数不能包含:数字,字母和符号“.”。
- conflict_delimiter
此参数一般配合compatible_illegal_chars参数一起使用,当用户的数据文件中包含半个汉字字符的时候,并且这半个字符和分隔符会由于外表的编码和数据库编码不一致被编码成一个其他的汉字,导致分隔符被掩盖从而报错缺少字段。
如果用户不希望让这半个字符和分隔符编码成一个其他字符则可以使用此参数。
取值范围:true/on,false/off。缺省值为false/off。
- 参数为true/on,允许这半个字符和分隔符编码成一个其他字符。
- 参数为false/off,不允许这半个字符和分隔符编码成一个其他字符。
此参数默认关闭。由于场景较少出现,不建议打开。如果未能识别场景而打开此参数则会有入表信息错乱的风险。
例如:假设有一行GBK数据"3|+|膢+|20191212"要被导入到UTF8的数据库,用户自定义的字段分隔符为"|+|"。
这行GBK数据和十六进制对应关系如下
33 7C 2B 7C C4 7C 2B 7C 323031393132313
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
3 | + | ** | + | 20191212
当导入UTF8数据库时,数据库会发生如下转换。
GBK -> UTF8
33->33 (3)
7C->7C (|)
2B->2B (+)
7C->7C(|)
C47C-> E886A2(膢)
2B->2B(+)
7C->7C(|)
323031393132313-> 20191212
由于用户定义的字段分隔符号为"|+|",因此对该行数据分隔后获取的数据是3,膢+|20191212,
实际上用户可能要获得的是3,?,20191212。
"膢" 这个字符其实是一个用户不期望的半个字符,和用户定义的分隔符“|+|”中的“|”产生了冲突,导致数据错乱或者导入失败。
如果用户想要忽略这种字符可以使用conflict_delimiter配合compatible_illegal_chars参数将“C4”这个半个GBK字符准换成“?”导入UTF8数据库。
- file_type
取值范围:normal,pipe,interconn。缺省为normal。
- 参数为normal,表示导入或者导出的文件类型为普通文件。
- 参数为pipe,表示导入或者导出的文件类型为命名管道文件。
- 参数为interconn,表示当前的GDS外表用于互联互通压缩导入导出,该参数必须配合gds_compress参数使用,仅8.2.0及以上集群版本支持。
当file_type的参数为interconn时,gds需要升级到8.2.0及以上版本,否则会出现ERROR: un-support format报错。
- file_sequence
用于多任务GDS外表并行导入,提升单个文件的导入性能。该参数仅供数据导入使用。
格式为file_sequence '文件被拆分的总数-当前分片' 。例如:
file_sequence '3-1' 表示导入的文件在逻辑上被拆分成3份,当前外表导入的数据为第一个分片上的数据。
file_sequence '3-2' 表示导入的文件在逻辑上被拆分成3份,当前外表导入的数据为第二个分片上的数据。
file_sequence '3-3' 表示导入的文件在逻辑上被拆分成3份,当前外表导入的数据为第三个分片上的数据。
使用该参数需遵循以下约束:
- 文件被拆分的总数小于等于8。
- 当前分片小于等于文件被拆分的总数。
- 导入的文件仅支持CSV和text格式。
使用CSV格式进行并行导入时,在如下示例场景中会因为CSV本身的规则和GDS拆分逻辑冲突而导致其中的某些分片导入失败。
场景:csv文件中包含未转义的换行符,且该换行符被quote指定的字符所包含,并且该行数据处于逻辑分片的第一行。
示例:并行导入一个文件big.csv ,正确导入显示内容如下:
--id, username, address 10001,"customer1 name","Rose District" 10002,"customer2 name"," 23 Road Rose District NewCity" 10003,"customer3 name","NewCity"
文件被拆分成两份后,第一个分片显示内容如下:
10001,"customer1 name","Rose District" 10002,"customer2 name"," 23
第二个分片显示内容如下:
Road Rose District NewCity" 10003,"customer3 name","NewCity"
因为第二个分片第一行后面的换行符包含在一个双引号之间,导致GDS无法分辨该换行符是字段中的换行符还是行中的分隔符,因此第一个分片会成功导入两条数据,第二个分片导入失败。
- auto_create_pipe
取值范围:true/on,false/off。缺省值为true/on。
- 参数为true/on,表示允许GDS进程自动创建命名管道文件。
- 参数为false/off,表示用户需手动创建命名管道文件。
- 设置auto_create_pipe参数时,file_type必须设置为pipe或者interconn,否则不能成功创建外表。
- auto_create_pipe设置为false,执行导入导出时,若未指定管道文件,会打开“数据库名_模式名_外表名.pipe”文件;若已指定管道文件,会打开location参数中指定的管道文件。该命名管道文件在pipe-timeout参数设置的时间内没有被其他程序写入或者以写的方式打开,则导入导出任务报错超时。若发现该文件不是管道文件则导入导出任务直接报错。
- auto_create_pipe设置为true,执行导入导出时,若未指定管道文件,会打开“数据库名_模式名_外表名.pipe”文件;若该文件为普通文件类型,则导入导出任务报错。若为管道文件会自动删除该文件,并重新创建该命名管道文件。
- 管道文件导出时location参数可以指定导出的管道文件,如:location‘gsfs://127.0.0.1:7789/aa.pipe',当auto_create_pipe设置为true,GDS会自动在数据目录下创建“aa.pipe”管道文件。
- del_pipe
取值范围:true/on,false/off。缺省值为true/on。
- 参数为true/on,表示允许GDS进程自动删除命名管道文件。
- 参数为false/off,表示GDS进程不会删除命名管道文件。
设置del_pipe时,file_type必须设置为pipe或者interconn,否则不能成功创建外表。
- gds_compress
该参数用于降低用户使用GDS管道文件时集群之间互联互通的网络带宽,当前仅支持snappy算法。该参数仅8.2.0及以上集群版本支持。
取值范围:snappy。 当前仅支持snappy算法,表示GDS管道导入导出的数据是以snappy算法压缩和解压缩的。
- 设置该参数时,file_type参数必须为interconn,format必须为CSV, 默认不压缩。当前仅支持设置为snappy,使用该功能时需要保证本地集群,远端集群,GDS的版本至少在同一版本。
- 当file_type的参数为interconn时,gds需要升级到8.2.0及以上版本,否则会出现ERROR: un-support format报错。
- 该参数会降低集群间的网络带宽,但是会增加集群的CPU负载,用户可以根据实际情况选择是否开启该参数。
- 为了实现GDS互联互通外表迁移数据时,数据在网络层压缩传输,GDS外表必须支持该参数,用户不仅可以使用互联互通外表进行数据压缩迁移,也可以手动使用GDS外表实现数据在网络层压缩迁移,由于手动实现时需要用户设置参数较多,推荐使用互联互通外表的方案。
- 导入和导出端的外表必须都指定该参数。
- preserve_blanks
用于定长导入时,控制每列数据拖尾的空白字符(包括空格,\t,\v,\f)是否保留。该参数仅8.2.0.100及以上集群版本支持。
取值范围:true/on,false/off。缺省值为false/off。
- 参数为true/on,表示针对BYTEAOID、CHAROID、NAMEOID、TEXTOID、BPCHAROID、VARCHAROID、NVARCHAR2OID、CSTRINGOID对应类型的列数据,保留拖尾 \t,不进行修剪。
- 参数为false/off,表示针对所有数据类型的数据拖尾的空白字符(包括空格,\t,\v,\f)进行修剪。
- fix
指定每一行定长格式数据的长度。按字节计算。此语法仅对READ ONLY的外表有效。
取值范围:N >= POSITION指定的总长度(总长度即为表定义最后一个字段的offset与length的和)AND N < 1GB
- out_fix_alignment
定长导出中,指定BYTEAOID、CHAROID、NAMEOID、TEXTOID、BPCHAROID、VARCHAROID、NVARCHAR2OID、CSTRINGOID对应类型所在列的对齐方式。
取值范围:align_left、align_right
默认值:align_right
由于bytea数据类型要求十六进制格式(如"\XXXX")或八进制格式(如"\XXX\XXX\XXX"),导入时需要左对齐(即列数据以两种格式开头,而非空格)。因此若导出文件需要重新以GDS外表入库且数据长度小于外表formatter指定长度,导出时需要指定左对齐,否则会在入库的过程中报错。
- out_fix_num_alignment
定长导出中,指定数值类型TINYINT、SMALLINT、INTEGER、BINARY_INTEGER、BIGINT、NUMERIC[(p[,s])]、DECIMAL[(p[,s])]、NUMBER[(p[,s])]、REAL、FLOAT4、DOUBLE PRECISION、FLOAT8、FLOAT[(p)]、BINARY_DOUBLE、DEC[(p[,s])]、INTEGER[(p[,s])]、SMALLSERIAL、SERIAL、BIGSERIAL对应类型所在列的对齐方式。该选项仅9.1.0及以上集群版本支持。
取值范围:align_left、align_right
默认值:align_left
- date_format
导入对于DATE类型指定格式。此语法仅对READ ONLY的外表有效。
取值范围:合法DATE格式。可参考时间、日期处理函数和操作符。
对于指定为ORACLE兼容类型的数据库,则DATE类型内建为TIMESTAMP类型。在导入的时候,若需指定格式,可以参考下面的timestamp_format参数。
- time_format
导入对于TIME类型指定格式。此语法仅对READ ONLY的外表有效。
取值范围:合法TIME格式,不支持时区。可参考时间、日期处理函数和操作符。
- timestamp_format
导入对于TIMESTAMP类型指定格式。此语法仅对READ ONLY的外表有效。
取值范围:合法TIMESTAMP格式,不支持时区。可参考时间、日期处理函数和操作符。
- smalldatetime_format
导入对于SMALLDATETIME类型指定格式。此语法仅对READ ONLY的外表有效。
取值范围:合法SMALLDATETIME格式。可参考时间、日期处理函数和操作符。
- compatible_illegal_chars
导入导出非法字符容错参数。此语法对READ ONLY和WRITE ONLY的外表有效。
导出容错仅8.1.3.331及以上版本集群支持。
取值范围:true/on,false/off。缺省值为false/off。
- 参数为true/on,则导入导出时遇到非法字符进行容错处理,非法字符转换后入库或出库,不报错,不中断导入导出。
- 参数为false/off,导入导出时遇到非法字符进行报错,中断导入。
导入非法字符容错规则如下:
- 对于'\0',容错后转换为空格;
- 对于其他非法字符,容错后转换为问号;
- 如果compatible_illegal_chars为true/on标识导入时对于非法字符进行容错处理,如果NULL、DELIMITER、QUOTE、ESCAPE设置为空格或问号则会通过如"illegal chars conversion may confuse COPY escape 0x20"等报错信息提示用户修改可能引起混淆的参数,以避免导入错误。
- 需注意:导出外表容错参数开启后,非法字符数据导出被容错为问号,再次导入回DWS库中就会与原数据不一致。
- location
- READ ONLY
只读外表,该参数只供数据导入使用。
- WRITE ONLY
只写外表,该参数只供数据导出使用。
- WITH error_table_name
数据导入过程中出现的数据格式错误信息将被写入error_table_name指定的错误信息表中,可以在并行导入结束后查询此错误信息表,获取详细的错误信息。此参数只在设置了reject_limit参数时有效。
如果为了兼容postgres开源接口,此语法建议用LOG INTO代替。
取值范围:字符串,要符合标识符的命名规范。
- LOG INTO error_table_name
数据导入过程中出现的数据格式错误信息将被写入error_table_name指定的错误信息表中,可以在并行导入结束后查询此错误信息表,获取详细的错误信息。
若没有指定PER NODE REJECT LIMIT参数,则此参数不起作用。
取值范围:字符串,要符合标识符的命名规范。
- REMOTE LOG 'name'
数据导入过程中出现的数据格式错误信息将被写到GDS端以文件方式保存。name为错误数据文件的文件名前缀。
- PER NODE REJECT LIMIT 'value'
指定本次数据导入过程中每个DN实例上允许出现的数据格式错误的数量,如果有一个DN实例上的错误数量大于设定值,本次导入失败,报错退出。
此语法指定的是单个节点的错误容忍度。
数据格式错误是指缺少或者多出字段值,数据类型错误或者编码错误。对于非数据格式错误,一旦发生就将导致整个数据扫描失败。
取值范围:整型值,unlimited(无限),不指定该参数时,有错误信息立即返回。
- TO { GROUP groupname | NODE ( nodename [, ... ] ) }
TO GROUP目前不支持使用。TO NODE主要供内部扩容工具使用,一般用户不应使用。
示例
创建外表customer_ft,用来以TEXT格式导入GDS服务器10.10.123.234上的数据:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
CREATE FOREIGN TABLE customer_ft ( c_customer_sk integer , c_customer_id char(16) , c_current_cdemo_sk integer , c_current_hdemo_sk integer , c_current_addr_sk integer , c_first_shipto_date_sk integer , c_first_sales_date_sk integer , c_salutation char(10) , c_first_name char(20) , c_last_name char(30) , c_preferred_cust_flag char(1) , c_birth_day integer , c_birth_month integer , c_birth_year integer , c_birth_country varchar(20) , c_login char(13) , c_email_address char(50) , c_last_review_date char(10) ) SERVER gsmpp_server OPTIONS ( location 'gsfs://10.10.123.234:5000/customer1*.dat', FORMAT 'TEXT' , DELIMITER '|', encoding 'utf8', mode 'Normal') READ ONLY; |
创建外表foreign_HR_staffS_ft,用来以TEXT格式导入GDS服务器192.168.0.90和192.168.0.91上的数据,导入过程错误信息将记录到err_HR_staffS中。本次数据导入允许出现的数据格式错误个数为2。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
CREATE FOREIGN TABLE foreign_HR_staffS_ft ( staff_ID NUMBER(6) , FIRST_NAME VARCHAR2(20), LAST_NAME VARCHAR2(25), EMAIL VARCHAR2(25), PHONE_NUMBER VARCHAR2(20), HIRE_DATE DATE, employment_ID VARCHAR2(10), SALARY NUMBER(8,2), COMMISSION_PCT NUMBER(2,2), MANAGER_ID NUMBER(6), section_ID NUMBER(4) ) SERVER gsmpp_server OPTIONS (location 'gsfs://192.168.0.90:5000/* | gsfs://192.168.0.91:5000/*', format 'TEXT', delimiter E'\x08', null '',reject_limit '2') WITH err_HR_staffS_ft; |
建立外表,用来以CSV格式导入input_data目录下存放在各个节点名文件下的所有文件。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
CREATE FOREIGN TABLE foreign_HR_staffS_ft1 ( staff_ID NUMBER(6) , FIRST_NAME VARCHAR2(20), LAST_NAME VARCHAR2(25), EMAIL VARCHAR2(25), PHONE_NUMBER VARCHAR2(20), HIRE_DATE DATE, employment_ID VARCHAR2(10), SALARY NUMBER(8,2), COMMISSION_PCT NUMBER(2,2), MANAGER_ID NUMBER(6), section_ID NUMBER(4) ) SERVER gsmpp_server OPTIONS (location 'file:///input_data/*', format 'csv', quote E'\x08', mode 'private', delimiter ',') WITH err_HR_staffS_ft1; |
建立外表,用来以CSV格式导出数据到output_data目录下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
CREATE FOREIGN TABLE foreign_HR_staffS_ft2 ( staff_ID NUMBER(6) , FIRST_NAME VARCHAR2(20), LAST_NAME VARCHAR2(25), EMAIL VARCHAR2(25), PHONE_NUMBER VARCHAR2(20), HIRE_DATE DATE, employment_ID VARCHAR2(10), SALARY NUMBER(8,2), COMMISSION_PCT NUMBER(2,2), MANAGER_ID NUMBER(6), section_ID NUMBER(4) ) SERVER gsmpp_server OPTIONS (location 'file:///output_data/', format 'csv', quote E'\x08', delimiter '|', header 'on') WRITE ONLY; |