数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库概念与特征 更多内容
  • 概念与功能

    概念功能 CodeArts支持哪些语言/环境/以及应用的开发? CodeArts支持在哪些Region使用? CodeArts中能否直观查看个人任务及其完成情况? CodeArts中如何查看成员的操作日志? CodeArts是否支持对本地代码进行检查、构建及部署? 能否将本地或

    来自:帮助中心

    查看更多 →

  • 特征选择

    特征选择 删除列 删除特征列的场景有很多,例如:两个特征呈线性变化关系,为减少模型训练的开销,删除其中一个特征列。 操作步骤如下所示。 单击界面右上角的图标,选择“数据处理 > 特征选择 > 删除列”,界面新增“删除列”内容。 对应参数说明,如表1所示。 表1 参数说明 参数 参数说明

    来自:帮助中心

    查看更多 →

  • 数据特征

    数据特征 数据分析 数据处理 特征工程 父主题: 预置算子说明

    来自:帮助中心

    查看更多 →

  • 特征操作

    筛选出有价值的特征列。将卡方值由小到大排序,筛选出TOPN的特征列: 特征标签列之间的偏离程度越大,卡方值越大,说明特征标签列不符 特征标签列之间的偏离程度越小,卡方值越小,说明特征列越接近于标签列 如果特征标签列完全相等,卡方值为0,说明特征标签列完全符合

    来自:帮助中心

    查看更多 →

  • 特征画像

    。这些类别,对应到后面的特征选择、算法推荐,会有不同的策略,有效提升模型的构建效率。 单击“选择数据”左下方的“特征画像”。 新增“特征画像”内容,如图1所示。 图1 特征画像 单击“特征画像”代码框左侧的图标,运行代码。 通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 筛选特征

    筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练

    来自:帮助中心

    查看更多 →

  • 特征转换

    特征转换 概述 将对应列的数据乘以相应的权重得到新的列,只支持数字列。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数 参数说明 input_columns_str

    来自:帮助中心

    查看更多 →

  • 什么是OLAP,什么是OLTP?

    OLAP为使用多维结构为分析提供对数据的快速访问的技术,OLAP 的源数据通常存储在关系数据库的 数据仓库 中。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 OLTP也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内

    来自:帮助中心

    查看更多 →

  • 特征工程

    单击“创建”,界面新增“Harddisk”特征工程。 等待特征工程的“环境信息”中的特征工程状态从“创建中”变更为“运行中”,即开发环境创建完成。 单击特征工程“操作”列的图标,进入JupyterLab环境的“Launcher”界面。 在左侧的代码目录中,可以看到系统自动为用户创建的特征工程同名的算法工

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程可对推荐系统的离线数据进行处理,它包含两个功能: 从离线数据中提取用户、物品画像和RES内部通用格式数据; 把RES内部通用格式数据处理成训练排序模型所需的训练数据、测试数据等。 功能对应,特征工程的两个任务分别是: 初始用户画像-物品画像-标准宽表生成 排序样本预处理

    来自:帮助中心

    查看更多 →

  • 特征操作接口

    RESTATE signature_type 否 String 特征类型。 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。 表4 MetadataAttributeRequest

    来自:帮助中心

    查看更多 →

  • 离散特征分析

    离散特征分析 概述 离散值特征分析通过每个离散特征的gini,entropy,gini gain,information gain,information gain ratio等和每个离散值对应的gini,entropy指标,方便对离散特征进行理解。 输入 参数 子参数 参数说明

    来自:帮助中心

    查看更多 →

  • 特征异常检测

    特征异常检测 概述 特征异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency) 箱型图用于检测连续值类特征的数据,根据四分位数检测异常特征。 AVF用于检测枚举值类特征的数据,根据枚举特征的取值频率及阈值检测异常特征。 箱型图异常检测

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 表1 数据仓库权限 权限 对应API接口 授权项(Action) IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库列表 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 获取数据仓库列表信息 获取数据仓库的数据列表 父主题: API

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据? 特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换的特征名 - scale_method 尺度变换的方法 "ln" item_spliter 离散型特征的,iterm之间的分割符 "," kv_spliter 离散型特征KV的分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了