A-E

    • B

      表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。例如,一个表可能有3个字段:姓名、城市和国家。这个表就会有3列:一列代表姓名,一列代表城市,一列代表国家。表中的每一行包含3个字段的内容,姓名字段包含姓名,城市字段包含城市,国家字段包含国家。

      表空间

      包含表、索引、大对象、长数据等数据的逻辑存储结构。表空间在物理数据和逻辑数据间提供了抽象的一层,为所有的数据库对象分配存储空间。表空间创建好后,创建数据库对象时可以指定该对象所属的表空间。

      并发控制

      在多用户环境下同时执行多个事务并保证数据完整性的一个DBMS服务。并发控制是DWS提供的一种多线程管理机制,用来保证多线程环境下在数据库中执行的操作是安全的和一致的。

    • C
      CU

      参见 压缩单元 (Compression Unit)

      查询操作符

      也称为查询迭代算子(Iterator)或查询节点(Query Tree Node)。一个查询的执行可以分解为一个或多个查询操作符,是构成一个查询执行的最基本单位。常见的查询操作符包括表扫描(Scan),表关联(Join),表聚集(Aggregation)等。

      抽取转化装载

      描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。

      存储过程

      存储过程(stored procedure)是在大型数据库系统中,一组为了完成特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名称并设置参数(如果该存储过程带有参数)来执行它。

    • D
      DCL

      参见 数据控制语言 (data control language)

      DDL

      参见 数据定义语言 (data definition language)

      DML

      参见 数据操作语言 (data manipulation language)

      DWS

      参见 数据仓库服务 (Data Warehouse Service)

      大规模并行处理

      利用多个机器构成集群的架构方式,也称为集群(Cluster)系统。

      低性能

      集群部分节点无法提供服务,性能受到影响。

      数据库中,一段指包含一个或多个区域的数据库中的一部分。区域是数据库的最小范围,由单元调用块组成。一个或多个段组成一个表空间。

    • E

    F-J

      • G
        GDS

        参见 数据并行加载工具 (General Data Service)

        高级包

        数据库提供的具有一定逻辑和功能的存储过程、函数,这些具备功能的存储过程、函数统称为高级包。

      • I
      • J
        检查点

        将数据库内存中某一时刻的数据存到磁盘的机制。数据库定期将已提交的事务数据和未提交的事务数据存到磁盘,这些数据用来和Redo日志一起在数据库重启和崩溃时恢复数据库。

        节点

        DWS服务的一个基本计量单位,其中包含用户指定的计算和存储资源,并且部署DWS程序的虚拟机。

        节点故障

        当集群中的某些节点发生故障而无法正常工作时,集群进入“节点故障”状态,但整个集群正常运行。

        结构化查询语言

        数据库的标准查询语言。它可以分为数据定义语言(DDL),数据操纵语言(DML)和数据控制语言(DCL)。

        集群

        DWS最小管理单元是集群,一个集群代表了一个独立运行的数据仓库,用户可以在DWS系统中对集群的生命周期进行管理。

      K-O

        • K
          快照

          快照是对一个数据仓库集群的一次全量数据备份,快照存储在OBS存储空间中。

          快照恢复

          创建好的快照支持在原有规格的新集群中进行恢复,当前仅支持在新创建的集群中进行恢复。

        • L
          联机分析处理

          使用多维结构为分析提供对数据的快速访问的技术。OLAP 的源数据通常存储在关系数据库的数据仓库中。

          字段的等效概念。在数据库中,表由一列或多列组成。

        • M
          MPP

          参见 大规模并行处理 (massively parallel processing)

          模式

          数据库对象集,包括逻辑结构,例如表、视图、序、存储过程、同义名、索引、集群及数据库链接。

        • O
          O2O

          参见 O2O营销模式 (Online to Offline)

          O2O营销模式

          O2O营销模式又称离线商务模式,是指线上营销线上购买带动线下经营和线下消费。O2O通过打折、提供信息、服务预订等方式,把线下商店的消息推送给互联网用户,从而将他们转换为自己的线下客户,这就特别适合必须到店消费的商品和服务,比如餐饮、健身、看电影和演出、美容美发等。2013年O2P营销模式出现,即本地化的O2O营销模式,正式将O2O营销模式带入了本地化进程当中。

          OLAP

          参见 联机分析处理 (Online Analytical Processing)

        P-T

          • P
            Page

            数据库关系对象结构中行存的最小内存单元。一个Page大小为默认为8KB。

          • R
            REDO日志

            记录对数据库进行操作的日志,这些日志包含重新执行这些操作所需要的信息。当数据库故障时,可以利用REDO日志将数据库恢复到故障前的状态。

          • S
            SQL

            参见 结构化查询语言 (Structure Query Language)

            事务

            数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成,事务必须满足ACID原则。

            数据并行加载工具

            General Data Service,数据并行加载工具。向DWS导入数据时,需要将此工具部署到源数据所在的服务器上,使DN可以通过该工具获取数据。

            数据仓库服务

            数据仓库服务是一种基于公有云基础架构和平台的在线数据处理数据库,为用户提供海量数据挖掘和分析服务。

            数据操作语言

            负责对数据库对象运行数据访问工作的指令集。

            数据定义语言

            负责数据结构定义与数据库对象定义的语言。

            数据分区

            数据分区是指在一个数据库实例内部,将表按照划分为多个数据互不重叠的部分(Partition)。具体的分区方式可以有:范围分区(Range),它根据元组中指定字段的取值所处的范围映射到目标存储位置。

            数据控制语言

            设置或者更改数据库用户或角色权限的语句。

            数据库

            数据库是存储在一起的相关数据的集合,这些数据可以被访问,管理以及更新。同一视图中,数据库可以根据存储内容类型分为以下几类:数目类、全文本类、数字类及图像类。

            数据库实例

            一个数据库实例是一个进程以及它控制的数据库文件。在集群的一个物理节点上安装多个数据库实例,集群各节点上所安装的GTM、CM、CN、DN统称为实例。一个数据库实例也被称为一个逻辑节点。

            数据字典

            数据字典是一系列只读的表,用来提供数据库的信息。这些信息包括:数据库设计信息、存储过程信息、用户权限、用户统计数据、数据库进程信息、数据库增长统计数据和数据库性能统计数据。

            索引

            数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。

          • T
            TPC-DS

            参见 TPC决策支撑标准 (TPC Benchmark DS)

            TPC决策支撑标准

            TPC-DS是事务处理性能委员会TPC(Transaction Processing Performance Council)提供的一个支撑决策的基准,其为决策支撑系统几个通用方面建模,包括查询和数据维护。作为通用决策支持系统,该基准对性能的评估具有代表性。有关该基准更详细的信息可参考http://www.tpc.org/tpcds/。

            统计信息

            数据库使用统计信息估算查询代价,以查找代价最小的查询计划,统计信息一般是数据库自动收集的,包括表级信息(元组数、页面数等)和列级信息(列的值域分布直方图)。

          U-Z

            • W
              WAL

              参见 预写日志系统 (Write-ahead logging)

              无共享架构

              无共享架构是一种分布式计算架构,这种架构中不存在集中共享CPU、存储的状态,这种架构具有非常强的扩展性。

              物联网

              物联网是互联网、传统电信网等信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络。

            • X
              系统表

              存储数据库元信息的表,元信息包括数据库中的用户表、索引、列、函数和数据类型等。

            • Y
              压缩单元

              列存表的最小存储单位。

              元数据

              用来定义数据的数据。主要是描述数据自身信息,包含源、大小、格式或其它数据特征。数据库字段中,元数据用于理解以及诠释数据仓库的内容。

              预写日志系统

              实现事务日志的标准方法,是指对数据文件(表和索引的载体)持久化修改之前必须先持久化相应的日志。

            • Z
              只读状态

              数据仓库进入只读状态后,只能响应所有的读操作。进入只读状态的情况有很多,在创建集群快照,或者集群存储容量超过总容量90%会进入只读状态。

              重分布失败

              当数据重新分配失败时,集群将进入“重分布失败”状态,但不会发生数据丢失。

              重分布中

              当检测到某些节点上的业务数据量明显大于其他节点时,集群进入“重分布中”状态。 在这种情况下,集群将自动重新分配所有节点上的数据。