| Alluxio | alluxio-examples | 使用Alluxio通过公共接口连接到存储系统示例程序。可实现写文件、读文件等功能。 |
| Flink | flink-examples | 该样例工程提供以下样例程序: - DataStream程序
Flink构造DataStream的Java/Scala示例程序。本工程示例为基于业务要求分析用户日志数据,读取文本数据后生成相应的DataStream,然后筛选指定条件的数据,并获取结果。 - 向Kafka生产并消费数据程序
Flink向Kafka生产并消费数据的Java/Scala示例程序。在本工程中,假定某个Flink业务每秒就会收到1个消息记录,启动Producer应用向Kafka发送数据,然后启动Consumer应用从Kafka接收数据,对数据内容进行处理后并打印输出。 - 异步Checkpoint机制程序
Flink异步Checkpoint机制的Java/Scala示例程序。本工程中,程序使用自定义算子持续产生数据,产生的数据为一个四元组(Long,String,String,Integer)。数据经统计后,将统计结果打印到终端输出。每隔6秒钟触发一次checkpoint,然后将checkpoint的结果保存到HDFS中。 |
| HBase | hbase-examples | HBase数据读写操作的应用开发示例。 通过调用HBase接口可实现创建用户表、导入用户数据、增加用户信息、查询用户信息及为用户表创建二级索引等功能。 |
| HDFS | hdfs-examples | HDFS文件操作的Java示例程序。 本工程主要给出了创建HDFS文件夹、写文件、追加文件内容、读文件和删除文件/文件夹等相关接口操作示例。 |
| Hive | hive-examples | 该样例工程提供以下JDBC/HCatalog样例程序: |
| Impala | impala-examples | Impala JDBC处理数据Java示例程序。 本工程使用JDBC接口连接Impala,在Impala中执行相关数据操作。使用JDBC接口实现创建表、加载数据、查询数据等功能。 |
| Kafka | kafka-examples | Kafka流式数据的处理Java示例程序。 本工程基于Kafka Streams完成单词统计功能,通过读取输入Topic中的消息,统计每条消息中的单词个数,从输出Topic消费数据,然后将统计结果以Key-Value的形式输出。 |
| MapReduce | mapreduce-examples | MapReduce任务提交Java示例程序。 本工程提供了一个MapReduce统计数据的应用开发示例,实现数据分析、处理,并输出满足用户需要的数据信息。 另外以MapReduce访问HDFS、HBase、Hive为例,介绍如何编写MapReduce作业访问多个服务组件。帮助用户理解认证、配置加载等关键使用方式。 |
| Presto | presto-examples | 该样例工程提供以下JDBC/HCatalog样例程序: |
| OpenTSDB | opentsdb-examples | 通过调用OpenTSDB接口可实现采集大规模集群中的监控类信息,并可实现数据的秒级查询。该样例程序主要实现写入数据、查询数据、删除数据等功能。 |
| Spark | spark-examples | SparkHbasetoHbaseJavaExample | Spark从HBase读取数据再写入HBase的Java/Scala示例程序。 本示例工程中,Spark应用程序实现两个HBase表数据的分析汇总。 |
| SparkHbasetoHbaseScalaExample |
| SparkHivetoHbaseJavaExample | Spark从Hive读取数据再写入到HBase的Java/Scala示例程序。 本示例工程中,Spark应用程序实现分析处理Hive表中的数据,并将结果写入HBase表。 |
| SparkHivetoHbaseScalaExample |
| SparkJavaExample | Spark Core任务的Java/Python/Scala示例程序。 本工程应用程序实现从HDFS上读取文本数据并计算分析。 |
| SparkPythonExample |
| SparkScalaExample |
| SparkLauncherJavaExample | 使用Spark Launcher提交作业的Java/Scala示例程序。 本工程应用程序通过org.apache.spark.launcher.SparkLauncher类采用Java/Scala命令方式提交Spark应用。 |
| SparkLauncherScalaExample |
| SparkOnHbaseJavaExample | Spark on HBase场景的Java/Scala示例程序。 本工程应用程序以数据源的方式去使用HBase,将数据以Avro格式存储在HBase中,并从中读取数据以及对读取的数据进行过滤等操作。 |
| SparkOnHbaseScalaExample |
| SparkSQLJavaExample | Spark SQL任务的Java/Scala示例程序。 本工程应用程序实现从HDFS上读取文本数据并计算分析。 |
| SparkSQLScalaExample |
| SparkStreamingJavaExample | Spark Streaming从Kafka接收数据并进行统计分析的Java/Scala示例程序。 本工程示例为基于业务要求分析用户日志数据,读取文本数据后生成相应的DataStream,然后筛选指定条件的数据,并获取结果。 |
| SparkStreamingScalaExample |
| SparkStreamingKafka010JavaExample | Spark Streaming从Kafka接收数据并进行统计分析的Java/Scala示例程序。 本工程应用程序实时累加计算Kafka中的流数据,统计每个单词的记录总数。 |
| SparkStreamingKafka010ScalaExample |
| SparkStreamingtoHbaseJavaExample | Spark Streaming读取Kafka数据并写入HBase的Java/Scala示例程序。 本工程应用程序每5秒启动一次任务,读取Kafka中的数据并更新到指定的HBase表中。 |
| SparkStreamingtoHbaseScalaExample |
| SparkStructuredStreamingJavaExample | 在Spark应用中,通过使用StructuredStreaming调用Kafka接口来获取单词记录,然后把单词记录分类统计,得到每个单词记录数。 |
| SparkStructuredStreamingScalaExample |
| SparkThriftServerJavaExample | 通过JDBC访问Spark SQL的Java/Scala示例程序。 本示例中,用户自定义JDBCServer的客户端,使用JDBC连接来进行表的创建、数据加载、查询和删除。 |
| SparkThriftServerScalaExample |
| Storm | storm-examples | storm-common-examples | 构造Storm拓扑和开发Spout/Bolt样例程序。可实现创建Spout、创建Bolt、创建Topology等功能。 |
| storm-hbase-examples | MRS的Storm与HBase组件实现交互的示例程序。实现提交Storm拓扑将数据存储到HBase的WordCount表中。 |
| storm-hdfs-examples | MRS的Storm与HDFS组件实现交互的示例程序。实现提交Storm拓扑数据存储到HDFS的功能。 |
| storm-jdbc-examples | 使用JDBC访问MRS Storm的样例程序。实现使用Storm拓扑向表中插入数据功能。 |
| storm-kafka-examples | MRS的Storm与Kafka组件实现交互的示例程序。实现使用Storm拓扑向Kafka中发送数据并查看。 |
| storm-obs-examples | MRS的Storm与OBS实现交互的示例程序。实现提交Storm拓扑数据存储到OBS功能。 |