中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据四大特征或4V特征 更多内容
  • 欠拟合的解决方法有哪些?

    弃用原来的算法,使用一个更加复杂的算法模型。例如用神经网络来替代线性回归,用随机森林来代替决策树。 增加更多的特征,使输入数据具有更强的表达能力。 特征挖掘十分重要,尤其是具有强表达能力的特征,可以抵过大量的弱表达能力的特征特征的数量并非重点,质量才是,总之强表达能力的特征最重要。 能否挖掘出

    来自:帮助中心

    查看更多 →

  • DLV的功能

    布、新冠疫情态势屏、新冠肺炎疫情实时播报、新冠肺炎疫情态势管控屏、某运输行业大数据平台、数据中心云监控。 预览 用户可以预览数据屏的即时数据,及时了解数据屏的呈现效果。 发布 用户开发完成一个数据屏后,通过发布功能向其他用户分享即时的历史版本的数据屏。

    来自:帮助中心

    查看更多 →

  • 基本概念

    等。 数据集 某业务下具有相同数据格式的数据逻辑集合。 特征操作 特征操作主要是对数据集进行特征处理。 在旧版体验式开发模式下,模型训练服务支持的特征操作有重命名、归一化、数值化、标准化、特征离散化、One-hot编码、数据变换、删除列、选择特征、卡方检验、信息熵、新增特征、PC

    来自:帮助中心

    查看更多 →

  • 功能介绍

    功能介绍 数据集 模型训练服务统一的数据集管理菜单,可本地导入10G以内大数据文件,对接数据集服务,导入已订阅的数据集。且支持在线查看代码、图片、音视频等多种格式的文件内容。 特征工程 特征工程是模型训练的必要过程,可以实现数据集的特征组合、筛选和转换,最大限度的从数据集中提取关键特征,供模型训练使用。

    来自:帮助中心

    查看更多 →

  • 近线作业

    起始位置:读取DIS数据的起始位置,latest表示从最新的数据开始读取,earliest表示从最旧的数据开始读取。 输出流位置:行为数据流处理后的输出配置。选择对应的DIS通道名称进行存放。输出流存放的数据属于流式训练作业的中间数据,用户无需获取发送数据到输出流绑定的数据通道,只需确保该通道仅供本作业作为输出流使用。

    来自:帮助中心

    查看更多 →

  • 产品功能

    产品功能 数据数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐

    来自:帮助中心

    查看更多 →

  • 数据采样

    数据采样 如果数据量太大,造成特征操作等待的时间长,用户可以通过采样功能减少特征处理的数据量,提升特征处理的速度。 数据采样提供如下两种方式,请根据实际情况进行选择: 随机采样:按照比例进行样本数据的随机采样。 分层采样:如果一个特征多个特征组合样本值的类型多样,为保证采样数据

    来自:帮助中心

    查看更多 →

  • 数据质量

    数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下:

    来自:帮助中心

    查看更多 →

  • AS

    在一个AS_Path列表中创建了一个多个拒绝模式的AS_Path规则后,需要创建一个.*规则,来允许所有其他路由通过。 * 之前的字符在目标对象中出现0次连续多次。 参考上例。 + 之前的字符在目标对象中出现1次连续多次。 65+表示6在AS_Path的首位,而5在AS_Path中出现一次多次,那么:

    来自:帮助中心

    查看更多 →

  • 算法工程处理的时候必须要先采样吗?

    算法工程处理的时候必须要先采样吗? 算法工程数据采样的目的是提升界面每个特征操作的速度。大数据量操作的时候建议先采样。数据采样后所有的特征操作,都只对采样后的数据进行处理,可以减少特征操作处理的数据量。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 排序策略

    batch:则仅针对当前批数据中出现的参数计算 说明: batch模式计算速度快于full模式。 隐向量长度 分解后的表示特征的向量的长度。默认10。 神经网络结构 神经网络的层数与每一层的神经元节点个数。默认400,400,400。 激活函数 神经网络中的激活函数,将一个(一组)神经元的值映射为一个输出值。

    来自:帮助中心

    查看更多 →

  • 数据导入

    的用户数据和物品数据整合成一条数据。 画像:画像分为用户画像和物品画像,分别用于存储用户输入的用户特征和物品特征。如果同一用户物品有多条记录,将会按照用户ID或者物品ID去重。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 已完成数据结构识别和人工复核确认。 操作步骤

    来自:帮助中心

    查看更多 →

  • 召回策略

    默认召回策略的名称 扩展功能 组合作业的资源选择数据源类型为“通用格式”时,会出现扩展功能选项。 创建“基于综合行为热度推荐”的召回策略时,当开启扩展功能,数据源类型仅支持通用格式。 该功能表名是否使用分组推荐功能,根据全局特征信息文件勾选的用户特征物品特征进行分组。 扩展功能开启: 扩展功能关闭:

    来自:帮助中心

    查看更多 →

  • 模型选择

    单击“模型选择”代码框左侧的图标,运行代码。 运行结果如下所示: 特征推荐:学件推荐的特征,除了一些通用的特征(最值、均值等),还有一部分是专门为类似KPI做的异常检测效果比较好的特征。通常采用滑窗的方式做异常检测。目前所有窗口的长度,是根据数据的周期性、样本数、周期的个数等数据特点推荐的。窗口的长度均可以修改,

    来自:帮助中心

    查看更多 →

  • 数据清洗

    合正则筛选规则的所有特征列。 列关系 去除空值和特征列的关系。 取值如下所示: all:如果一行数据,满足设置列中的所有特征列均为空值,则丢弃此行数据。 any:如果一行数据,满足设置列中的任一特征列有空值,则丢弃此行数据。 当前操作流 从下拉框中选择当前数据操作流的名字。 操作流变量名

    来自:帮助中心

    查看更多 →

  • 编辑模型信息

    在搜索栏中输入需要查询的模型数据关键字,单击“搜索”跳转模型列表界面,单击模型名称,进入模型详情页面。 单击“编辑”,修改模型的基础信息特征信息。 单击左上方模型名称下方的“编辑”按钮,可对模型的基本信息及特征信息进行修改,单击“确定”,修改成功。 在左下方选择需要编辑的特征属性页签,单击“

    来自:帮助中心

    查看更多 →

  • AS

    在一个AS_Path列表中创建了一个多个拒绝模式的AS_Path规则后,需要创建一个.*规则,来允许所有其他路由通过。 * 之前的字符在目标对象中出现0次连续多次。 参考上例。 + 之前的字符在目标对象中出现1次连续多次。 65+表示6在AS_Path的首位,而5在AS_Path中出现一次多次,那么:

    来自:帮助中心

    查看更多 →

  • 多模态检索

    描述:简要描述任务,不能包含“@^\#$%&*<>'|"/`”,输入长度不能超过256个字符。 视频文件:请选择视频库的路径。 单击“生成视频特征”,平台根据模型算法自动生成视频特性。生成新视频特征会覆盖原视频库信息,请谨慎操作。 当前一个用户只支持配置一个视频库。 视频检索 在左侧菜单栏中单击“智驾模型服务

    来自:帮助中心

    查看更多 →

  • 多云多活的客户群体有哪些?具有什么样的客户特征?

    多云多活的客户群体有哪些?具有什么样的客户特征? 首先多活容灾方案是水平方案,不会去选择用户。只是当前方案还不适合大规模推广,如果客户有诉求,可直接在华为云官方网站咨询或者找华为云一线销售咨询。 父主题: 多活容灾方案相关问题

    来自:帮助中心

    查看更多 →

  • 召回策略

    不开启取全部数据,开启则指定从数据源中取最近天数的行为数据计算相似度。 时间跨度(天) 用于指定从数据源中取最近多少天的行为数据计算相似度。默认取全部数据。 上传物品相似度 支持客户通过obs导入自定义的相似度信息。相似度文件格式为json, 其中subject为用户物品, re

    来自:帮助中心

    查看更多 →

  • 自定义场景简介

    召回策略 召回策略通过大数据计算深度训练生成推荐候选集。 召回策略 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、历史行为过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 过滤规则 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了