中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    apache开源大数据 更多内容
  • Kafka开源增强特性

    Kafka开源增强特性 Kafka开源增强特性 支持监控如下Topic级别的指标: Topic输入的字节流量 Topic输出的字节流量 Topic拒绝的字节流量 Topic每秒失败的fetch请求数 Topic每秒失败的Produce请求数 Topic每秒输入的消息条数 Topic每秒的fetch请求数

    来自:帮助中心

    查看更多 →

  • Flink开源增强特性

    Flink开源增强特性 Flink滑动窗口增强 Flink Job Pipeline增强 Flink Stream SQL Join Flink CEP in SQL 父主题: Flink

    来自:帮助中心

    查看更多 →

  • YARN开源增强特性

    方式。 支持异构集群和多资源池。 支持预留,以保证直接访问资源。 数据位置感知调度 从节点到作业的调度策略导致降低数据本地化命中率,潜在影响应用的执行性能。 从作业到节点的调度策略。可具有更精确的数据位置感知,数据本地化调度的作业命中率比较高。 基于机器负载的均衡调度 不支持 Superior

    来自:帮助中心

    查看更多 →

  • Oozie开源增强特性

    Oozie开源增强特性 Oozie开源增强特性:安全增强 支持Oozie权限管理,提供管理员与普通用户两种角色。 支持单点登录登出,HTTPS访问以及审计日志。 父主题: Oozie

    来自:帮助中心

    查看更多 →

  • 开源Kafka输出流

    开源Kafka输出流 功能描述 DLI 将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统,具有高吞吐量、内置分区、支持数据副本和容错的特性,适合在大规模消息处理场景中使用。 前提条件 Kafka服务

    来自:帮助中心

    查看更多 →

  • 快速搭建数据大屏

    在样式页面对组件的样式进行配置。 保存或保存并发布屏。 完成大屏制作之后,单击屏编辑页面右上侧的“保存并发布”或“保存”。 保存:保存屏之后,在屏页面屏不具有查看屏功能。 在保存的页面输入屏的名称。 图10 保存屏名称不能为空,只允许输入长度为1到32位由数字、中文

    来自:帮助中心

    查看更多 →

  • 什么是GeminiDB HBase兼容接口

    GeminiDB Cassandra接口推出了兼容Apache HBase接口特性,用户可以通过开源的HBase Java SDK或者HBase Shell等连接方式访问GeminiDB 数据库服务。在协议层面, 支持Apache HBase Driver直接连接,用户可以在不改

    来自:帮助中心

    查看更多 →

  • Tez

    成一个的DAG作业。 图1 Hive基于MapReduce提交任务和基于Tez提交任务流程图 Hive on MapReduce任务中包含多个MapReduce任务,每个任务都会将中间结果存储到HDFS上——前一个步骤中的reducer为下一个步骤中的mapper提供数据。Hive

    来自:帮助中心

    查看更多 →

  • 开源Kafka输出流

    开源Kafka输出流 功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统,具有高吞吐量、内置分区、支持数据副本和容错的特性,适合在大规模消息处理场景中使用。 前提条件 Kafka服务

    来自:帮助中心

    查看更多 →

  • HDFS开源增强特性

    Movement工具进行数据迁移。 因此,能够基于数据的age自动识别出老化的数据,并将它们迁移到价格低廉的存储介质(如Disk/Archive)上,会给用户节省很高的存储成本,提高数据管理效率。 HDFS Auto Data Movement工具是HDFS冷热数据迁移的核心,根据数据的使用频率

    来自:帮助中心

    查看更多 →

  • Spark开源增强特性

    Spark开源增强特性 跨源复杂数据的SQL查询优化 出于管理和信息收集的需要,企业内部会存储海量数据,包括数目众多的各种数据库、数据仓库等,此时会面临以下困境:数据源种类繁多,数据集结构化混合,相关数据存放分散等,这就导致了跨源复杂查询因传输效率低,耗时长。 当前开源Spark

    来自:帮助中心

    查看更多 →

  • Storm开源增强特性

    Storm开源增强特性 CQL CQL(Continuous Query Language),持续查询语言,是一种用于实时数据流上的查询语言,它是一种SQL-like的语言,相对于SQL,CQL中增加了(时序)窗口的概念,将待处理的数据保存在内存中,进行快速的内存计算,CQL的输

    来自:帮助中心

    查看更多 →

  • 什么是开源镜像站

    什么是开源镜像站 开源镜像站由华为云CodeArts团队开发及维护,致力于打造让软件开发更简单的一站式DevOps工具云服务。开源镜像站目前提供多种类别的软件安装源和ISO下载服务,覆盖包含Maven、npm、PyPI在内的8语言镜像,Ubuntu、CentOS、Debian等

    来自:帮助中心

    查看更多 →

  • Storm对外接口介绍

    Storm对外接口介绍 Storm-HDFS采用的接口同开源社区版本保持一致,详情参见:https://github.com/apache/storm/tree/v1.2.1/external/storm-hdfs。 Storm-HBase采用的接口同开源社区版本保持一致,详情参见:https://github

    来自:帮助中心

    查看更多 →

  • Storm接口介绍

    Storm采用的接口同开源社区版本保持一致,详情请参见: http://storm.apache.org/documentation/Home.html。 Storm-HDFS采用的接口同开源社区版本保持一致,详情参见: https://github.com/apache/storm/tree/v0

    来自:帮助中心

    查看更多 →

  • Spark开源命令支持说明

    id; 仅支持查看当前数据库下表的列信息。 支持 支持 返回查询语句的元数据信息 DESCRIBE QUERY SELECT age, sum(age) FROM testDB.testTable1 GROUP BY age; 不支持 支持 返回插入数据的元数据信息 DESCRIBE

    来自:帮助中心

    查看更多 →

  • Flume开源增强特性

    Flume开源增强特性 Flume开源增强特性 提升传输速度。可以配置将指定的行数作为一个Event,而不仅是一行,提高了代码的执行效率以及减少写入磁盘的次数。 传输超大二进制文件。Flume根据当前内存情况,自动调整传输超大二进制文件的内存占用情况,不会导致Out of Memory(OOM)的出现。

    来自:帮助中心

    查看更多 →

  • ZooKeeper开源增强特性

    自定义认证提供程序实现org.apache.zookeeper.server.auth.ExtAuthenticationProvider.getUserName(String)方法以获取用户名。 如果没有实现,从认证提供程序实例获取用户名将被跳过。 ZooKeeper开源增强特性:ZooKeeper

    来自:帮助中心

    查看更多 →

  • GitHub开源仓库Clone

    Files按钮,打开文件上传窗口,选择左侧的进入GitHub开源仓库Clone界面。 图1 上传文件图标 图2 进入GitHub开源仓库Clone界面 输入有效的GitHub开源仓库地址后会展示该仓库下的文件及文件夹,说明用户输入了有效的仓库地址,同时给出该仓库下所有的分支供选择,选择完成后单击“克隆”开始Clone仓库。

    来自:帮助中心

    查看更多 →

  • IoTDB开源增强特性

    IoTDB开源增强特性 IoTDB开源增强特性:可视化 可视化运维,包含安装、卸载、一键启动和停止、配置、客户端、监控、告警、健康检查、日志。 可视化权限管理,无需后台命令行操作,支持库表级别读写权限控制。 日志级别的可视化配置动态生效、可视化下载、可视化检索、审计日志等功能。 IoTDB开源增强特性:安全加固

    来自:帮助中心

    查看更多 →

  • Spark开源命令支持说明

    id; 仅支持查看当前数据库下表的列信息。 支持 支持 返回查询语句的元数据信息 DESCRIBE QUERY SELECT age, sum(age) FROM testDB.testTable1 GROUP BY age; 不支持 支持 返回插入数据的元数据信息 DESCRIBE

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了