| 
       Alluxio  | 
     
       alluxio-examples  | 
     
       使用Alluxio通过公共接口连接到存储系统示例程序。可实现写文件、读文件等功能。  | 
    
    
     | 
       Flink  | 
     
       flink-examples  | 
     
       该样例工程提供以下样例程序: 
      
       - DataStream程序
        
Flink构造DataStream的Java/Scala示例程序。本工程示例为基于业务要求分析用户日志数据,读取文本数据后生成相应的DataStream,然后筛选指定条件的数据,并获取结果。  
       - 向Kafka生产并消费数据程序
        
Flink向Kafka生产并消费数据的Java/Scala示例程序。在本工程中,假定某个Flink业务每秒就会收到1个消息记录,启动Producer应用向Kafka发送数据,然后启动Consumer应用从Kafka接收数据,对数据内容进行处理后并打印输出。  
       - 异步Checkpoint机制程序
        
Flink异步Checkpoint机制的Java/Scala示例程序。本工程中,程序使用自定义算子持续产生数据,产生的数据为一个四元组(Long,String,String,Integer)。数据经统计后,将统计结果打印到终端输出。每隔6秒钟触发一次checkpoint,然后将checkpoint的结果保存到HDFS中。  
       
       | 
    
    
     | 
       HBase  | 
     
       hbase-examples 
       | 
     
       HBase数据读写操作的应用开发示例。 
      通过调用HBase接口可实现创建用户表、导入用户数据、增加用户信息、查询用户信息及为用户表创建二级索引等功能。  | 
    
    
     | 
       HDFS  | 
     
       hdfs-examples  | 
     
       HDFS文件操作的Java示例程序。 
      本工程主要给出了创建HDFS文件夹、写文件、追加文件内容、读文件和删除文件/文件夹等相关接口操作示例。  | 
    
    
     | 
       Hive  | 
     
       hive-examples  | 
     
       该样例工程提供以下JDBC/HCatalog样例程序: 
       | 
    
    
     | 
       Impala  | 
     
       impala-examples  | 
     
       Impala JDBC处理数据Java示例程序。 
      本工程使用JDBC接口连接Impala,在Impala中执行相关数据操作。使用JDBC接口实现创建表、加载数据、查询数据等功能。  | 
    
    
     | 
       Kafka  | 
     
       kafka-examples  | 
     
       Kafka流式数据的处理Java示例程序。 
      本工程基于Kafka Streams完成单词统计功能,通过读取输入Topic中的消息,统计每条消息中的单词个数,从输出Topic消费数据,然后将统计结果以Key-Value的形式输出。  | 
    
    
     | 
       MapReduce  | 
     
       mapreduce-examples  | 
     
       MapReduce任务提交Java示例程序。 
      本工程提供了一个MapReduce统计数据的应用开发示例,实现数据分析、处理,并输出满足用户需要的数据信息。 
      另外以MapReduce访问HDFS、HBase、Hive为例,介绍如何编写MapReduce作业访问多个服务组件。帮助用户理解认证、配置加载等关键使用方式。  | 
    
    
     | 
       Presto  | 
     
       presto-examples  | 
     
       该样例工程提供以下JDBC/HCatalog样例程序: 
       | 
    
    
     | 
       OpenTSDB  | 
     
       opentsdb-examples  | 
     
       通过调用OpenTSDB接口可实现采集大规模集群中的监控类信息,并可实现数据的秒级查询。该样例程序主要实现写入数据、查询数据、删除数据等功能。  | 
    
    
     | 
       Spark  | 
     
       spark-examples  | 
     
       SparkHbasetoHbaseJavaExample  | 
     
       Spark从HBase读取数据再写入HBase的Java/Scala示例程序。 
      本示例工程中,Spark应用程序实现两个HBase表数据的分析汇总。  | 
    
    
     | 
       SparkHbasetoHbaseScalaExample  | 
    
    
     | 
       SparkHivetoHbaseJavaExample  | 
     
       Spark从Hive读取数据再写入到HBase的Java/Scala示例程序。 
      本示例工程中,Spark应用程序实现分析处理Hive表中的数据,并将结果写入HBase表。  | 
    
    
     | 
       SparkHivetoHbaseScalaExample  | 
    
    
     | 
       SparkJavaExample  | 
     
       Spark Core任务的Java/Python/Scala示例程序。 
      本工程应用程序实现从HDFS上读取文本数据并计算分析。  | 
    
    
     | 
       SparkPythonExample  | 
    
    
     | 
       SparkScalaExample  | 
    
    
     | 
       SparkLauncherJavaExample  | 
     
       使用Spark Launcher提交作业的Java/Scala示例程序。 
      本工程应用程序通过org.apache.spark.launcher.SparkLauncher类采用Java/Scala命令方式提交Spark应用。  | 
    
    
     | 
       SparkLauncherScalaExample  | 
    
    
     | 
       SparkOnHbaseJavaExample  | 
     
       Spark on HBase场景的Java/Scala示例程序。 
      本工程应用程序以数据源的方式去使用HBase,将数据以Avro格式存储在HBase中,并从中读取数据以及对读取的数据进行过滤等操作。  | 
    
    
     | 
       SparkOnHbaseScalaExample  | 
    
    
     | 
       SparkSQLJavaExample  | 
     
       Spark SQL任务的Java/Scala示例程序。 
      本工程应用程序实现从HDFS上读取文本数据并计算分析。  | 
    
    
     | 
       SparkSQLScalaExample  | 
    
    
     | 
       SparkStreamingJavaExample  | 
     
       Spark Streaming从Kafka接收数据并进行统计分析的Java/Scala示例程序。 
      本工程示例为基于业务要求分析用户日志数据,读取文本数据后生成相应的DataStream,然后筛选指定条件的数据,并获取结果。  | 
    
    
     | 
       SparkStreamingScalaExample  | 
    
    
     | 
       SparkStreamingKafka010JavaExample  | 
     
       Spark Streaming从Kafka接收数据并进行统计分析的Java/Scala示例程序。 
      本工程应用程序实时累加计算Kafka中的流数据,统计每个单词的记录总数。  | 
    
    
     | 
       SparkStreamingKafka010ScalaExample  | 
    
    
     | 
       SparkStreamingtoHbaseJavaExample  | 
     
       Spark Streaming读取Kafka数据并写入HBase的Java/Scala示例程序。 
      本工程应用程序每5秒启动一次任务,读取Kafka中的数据并更新到指定的HBase表中。  | 
    
    
     | 
       SparkStreamingtoHbaseScalaExample  | 
    
    
     | 
       SparkStructuredStreamingJavaExample  | 
     
       在Spark应用中,通过使用StructuredStreaming调用Kafka接口来获取单词记录,然后把单词记录分类统计,得到每个单词记录数。  | 
    
    
     | 
       SparkStructuredStreamingScalaExample  | 
    
    
     | 
       SparkThriftServerJavaExample  | 
     
       通过JDBC访问Spark SQL的Java/Scala示例程序。 
      本示例中,用户自定义JDBCServer的客户端,使用JDBC连接来进行表的创建、数据加载、查询和删除。  | 
    
    
     | 
       SparkThriftServerScalaExample  | 
    
    
     | 
       Storm  | 
     
       storm-examples  | 
     
       storm-common-examples  | 
     
       构造Storm拓扑和开发Spout/Bolt样例程序。可实现创建Spout、创建Bolt、创建Topology等功能。  | 
    
    
     | 
       storm-hbase-examples  | 
     
       MRS的Storm与HBase组件实现交互的示例程序。实现提交Storm拓扑将数据存储到HBase的WordCount表中。  | 
    
    
     | 
       storm-hdfs-examples  | 
     
       MRS的Storm与HDFS组件实现交互的示例程序。实现提交Storm拓扑数据存储到HDFS的功能。  | 
    
    
     | 
       storm-jdbc-examples  | 
     
       使用JDBC访问MRS Storm的样例程序。实现使用Storm拓扑向表中插入数据功能。  | 
    
    
     | 
       storm-kafka-examples  | 
     
       MRS的Storm与Kafka组件实现交互的示例程序。实现使用Storm拓扑向Kafka中发送数据并查看。  | 
    
    
     | 
       storm-obs-examples  | 
     
       MRS的Storm与OBS实现交互的示例程序。实现提交Storm拓扑数据存储到OBS功能。  |