文档首页> > 产品术语

B

    • B

      表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。例如,一个表可能有3个字段:姓名、城市和国家。这个表就会有3列:一列代表姓名,一列代表城市,一列代表国家。表中的每一行包含3个字段的内容,姓名字段包含姓名,城市字段包含城市,国家字段包含国家。

      表空间

      包含表、索引、大对象、长数据等数据的逻辑存储结构。表空间在物理数据和逻辑数据间提供了抽象的一层,为所有的数据库对象分配存储空间。表空间创建好后,创建数据库对象时可以指定该对象所属的表空间。

      并发控制

      在多用户环境下同时执行多个事务并保证数据完整性的一个DBMS服务。并发控制是DWS提供的一种多线程管理机制,用来保证多线程环境下在数据库中执行的操作是安全的和一致的。

    C

      • C
        查询操作符

        也称为查询迭代算子(Iterator)或查询节点(Query Tree Node)。一个查询的执行可以分解为一个或多个查询操作符,是构成一个查询执行的最基本单位。常见的查询操作符包括表扫描(Scan),表关联(Join),表聚集(Aggregation)等。

        抽取转化装载

        描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。

        CU

        参见 压缩单元 (Compression Unit)

        存储过程

        存储过程(StoredProcedure)是在大型数据库系统中,一组为了完成特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名称并设置参数(如果该存储过程带有参数)来执行它。

      D

        E

          G

            • G
              高级包

              数据库提供的具有一定逻辑和功能的存储过程、函数,这些具备功能的存储过程、函数统称为高级包。

            J

              • J
                检查点

                将数据库内存中某一时刻的数据存到磁盘的机制。数据库定期将已提交的事务数据和未提交的事务数据存到磁盘,这些数据用来和Redo日志一起在数据库重启和崩溃时恢复数据库。

                节点

                DWS服务的一个基本计量单位,其中包含用户指定的计算和存储资源,并且部署DWS程序的虚拟机。

                结构化查询语言

                数据库的标准查询语言。它可以分为数据定义语言(DDL),数据操纵语言(DML)和数据控制语言(DCL)。

                集群

                DWS最小管理单元是集群,一个集群代表了一个独立运行的数据仓库,用户可以在DWS系统中对集群的生命周期进行管理。

              K

                • K
                  快照

                  快照是对一个数据仓库集群的一次全量数据备份,快照存储在OBS存储空间中。

                  快照恢复

                  创建好的快照支持在原有规格的新集群中进行恢复,当前仅支持在新创建的集群中进行恢复。

                L

                  • L
                    联机分析处理

                    数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。

                    字段的等效概念。在数据库中,表由一列或多列组成。

                  M

                    O

                      P

                        • P
                          Page

                          数据库关系对象结构中行存的最小内存单元。一个Page大小为默认为8KB。

                        R

                          • R
                            REDO日志

                            记录对数据库进行操作的日志,这些日志包含重新执行这些操作所需要的信息。当数据库故障时,可以利用REDO日志将数据库恢复到故障前的状态。

                          S

                            • S
                              事务

                              数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成,事务必须满足ACID原则。

                              数据仓库服务

                              数据仓库服务是一种基于公有云基础架构和平台的在线数据处理数据库,为用户提供海量数据挖掘和分析服务。

                              数据操作语言

                              负责对数据库对象运行数据访问工作的指令集。

                              数据定义语言

                              负责数据结构定义与数据库对象定义的语言。

                              数据分区

                              数据分区是指在一个数据库实例内部,将表按照划分为多个数据互不重叠的部分(Partition)。具体的分区方式可以有:范围分区(Range),它根据元组中指定字段的取值所处的范围映射到目标存储位置。

                              数据控制语言

                              设置或者更改数据库用户或角色权限的语句。

                              数据库

                              数据库是存储在一起的相关数据的集合,这些数据可以被访问,管理以及更新。同一视图中,数据库可以根据存储内容类型分为以下几类:数目类、全文本类、数字类及图像类。

                              数据库实例

                              一个数据库实例是一个进程以及它控制的数据库文件。在集群的一个物理节点上安装多个数据库实例,集群各节点上所安装的GTM、CM、CN、DN统称为实例。一个数据库实例也被称为一个逻辑节点。

                              数据字典

                              数据字典是一系列只读的表,用来提供数据库的信息。这些信息包括:数据库设计信息、存储过程信息、用户权限、用户统计数据、数据库进程信息、数据库增长统计数据和数据库性能统计数据。

                              SQL

                              参见 结构化查询语言 (Structure Query Language)

                              索引

                              数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。

                            T

                              • T
                                统计信息

                                数据库使用统计信息估算查询代价,以查找代价最小的查询计划,统计信息一般是数据库自动收集的,包括表级信息(元组数、页面数等)和列级信息(列的值域分布直方图)。

                              W

                                • W
                                  WAL

                                  参见 预写日志系统 (Write-ahead logging)

                                  无共享架构

                                  无共享架构是一种分布式计算架构,这种架构中不存在集中共享CPU、存储的状态,这种架构具有非常强的扩展性。

                                X

                                  • X
                                    系统表

                                    存储数据库元信息的表,元信息包括数据库中的用户表、索引、列、函数和数据类型等。

                                  Y

                                    • Y
                                      压缩单元

                                      列存表的最小存储单位。

                                      元数据

                                      用来定义数据的数据。主要是描述数据自身信息,包含源、大小、格式或其它数据特征。数据库字段中,元数据用于理解以及诠释数据仓库的内容。

                                      预写日志系统

                                      实现事务日志的标准方法,是指对数据文件(表和索引的载体)持久化修改之前必须先持久化相应的日志。

                                    Z

                                      • Z
                                        只读状态

                                        数据仓库进入只读状态后,只能响应所有的读操作。进入只读状态的情况有很多,在创建集群快照,或者集群存储容量超过总容量90%会进入只读状态。