中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据特征分析 更多内容
  • 特征工程

    用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 保留已有宽表 对结果保存路径中已有宽表数据的保留方式: 否,不保留任何已有的数据。

    来自:帮助中心

    查看更多 →

  • 特征操作接口

    RESTATE signature_type 否 String 特征类型。 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。 表4 MetadataAttributeRequest

    来自:帮助中心

    查看更多 →

  • 特征异常检测

    特征异常检测 概述 特征异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency) 箱型图用于检测连续值类特征数据,根据四分位数检测异常特征。 AVF用于检测枚举值类特征数据,根据枚举特征的取值频率及阈值检测异常特征。 箱型图异常检测

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换的特征名 - scale_method 尺度变换的方法 "ln" item_spliter 离散型特征的,iterm之间的分割符 "," kv_spliter 离散型特征KV的分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 数据采集与分析

    数据采集与分析 前提条件 已配置邮箱 服务器 ,具体操作请参见调测邮箱通知功能。 操作步骤 选择“运维管理 > 数据采集与分析 > 数据采集与分析”。 根据需要选择相应的功能使用,详情请参见表1。 表1 任务管理 任务 说明 操作方法 采集设备日志 采集和统计设备故障日志,以了解设备的状态以及运行情况。

    来自:帮助中心

    查看更多 →

  • 数据采集与分析

    数据采集与分析 数据采集与分析 父主题: 运维管理

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 根据条件查询采集信息中的图片(API名称:queryCollectPhotoDetail) 查询作业对象筛选的执行人数量(API名称:queryJobTaskExecutor) 根据条件查询所有场景ID(API名称:queryTaskPictureByCondition)

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    稀疏特征key和value的分隔符。 ":" 样例 数据样本 样例1 非稀疏数据 样例2 稀疏数据 配置流程 运行流程 参数设置 图1 样例1数据参数设置 图2 样例2数据参数设置 结果查看 图3 样例1数据运行结果 图4 样例2数据运行结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 箱型图 分桶统计 相关性分析 决策树分类特征重要性 决策树回归特征重要性 梯度提升树分类特征重要性 梯度提升树回归特征重要性 孤立森林 百分位 百分位统计 直方图 折线图 饼形图 散点图 随机森林分类特征重要性 随机森林回归特征重要性 全表统计 单样本t检验 直方图(多字段)

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 运营报表 订阅报表 父主题: 统计分析(新)

    来自:帮助中心

    查看更多 →

  • ClickHouse应用场景

    时长等使用数据进行收集,导入到云数据仓库ClickHouse中,构建用户特征分析宽表。利用云ClickHouse的优异查询性能,分析系统进行多维度、多模式分析时,可以在亚秒级内响应,快速分析出用户行为特征和规律,为精准营销和会员转化等业务提供有效支持。 企业经营分析。 在企业经

    来自:帮助中心

    查看更多 →

  • 数据湖分析

    数据分析 多源数据目录 父主题: Doris应用开发指导

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 使用Spark2x实现车联网车主驾驶行为分析 使用Hive加载HDFS数据分析图书评分情况 使用Hive加载OBS数据分析企业雇员信息 通过Flink作业处理OBS数据 通过Spark Streaming作业消费Kafka数据 通过Flume采集指定目录日志系统文件至HDFS

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 使用 DLI 进行车联网场景驾驶行为数据分析 使用DLI将 CS V数据转换为Parquet数据 使用DLI进行电商BI报表分析 使用DLI进行账单分析与优化 使用DLI Flink SQL进行电商实时业务数据分析 永洪BI对接DLI提交Spark作业 FineBI工具对接DLI

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 分发统计 播放统计

    来自:帮助中心

    查看更多 →

  • 数据分析

    查询该 域名 在相关服务范围的统计数据,不支持按“全球”查询。 操作步骤 登录华为云控制台,在控制台首页中选择“CDN与智能边缘 > 内容分发网络 CDN”,进入CDN控制台。 在左侧菜单栏中,选择“统计分析”。 在“统计分析”下拉菜单中选择“数据分析”。 CDN默认提供域名排行、区域/运营商排行功能。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了