自拓展输入流

用户可通过编写代码实现从想要的云生态或者开源生态获取数据，作为Flink作业的输入数据。

语法格式

    
         CREATE SOURCE STREAM stream_id (attr_name attr_type (',' attr_name attr_type)* )
  WITH (
    type = "user_defined",
    type_class_name = "",
    type_class_parameter = ""
  )
  (TIMESTAMP BY timeindicator (',' timeindicator)?);timeindicator:PROCTIME '.' PROCTIME| ID '.' ROWTIME

关键字

表1 关键字说明
参数	是否必选	说明
type	是	数据源类型，"user_defined"表示数据源为用户自定义数据源。
type_class_name	是	用户实现获取源数据的source类名称，注意包含完整包路径。
type_class_parameter	是	用户自定义source类的入参，仅支持一个string类型的参数。

注意事项

用户自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row例如定义类MySource：public class MySource extends RichParallelSourceFunction<Row>{}，重点实现其中的open、run和close函数。

依赖pom:

<dependency>
	<groupId>org.apache.flink</groupId>
	<artifactId>flink-streaming-java_2.11</artifactId>
	<version>${flink.version}</version>
	<scope>provided</scope>
</dependency>
<dependency>
	<groupId>org.apache.flink</groupId>
	<artifactId>flink-core</artifactId>
	<version>${flink.version}</version>
	<scope>provided</scope>
</dependency>

示例

实现每周期产生一条数据（仅包含一个字段，类型为INT，初始值为1，每周期加1），周期时长为60s，通过入参指定。

   
        CREATE SOURCE STREAM user_in_data (
	count INT
     )
  WITH (  
	type = "user_defined", 
	type_class_name = "mySourceSink.MySource", 
	type_class_parameter = "60"
      )
      TIMESTAMP BY car_timestamp.rowtime;

自定义source类实现，需要将该类打在jar包中，通过sql编辑页上传udf函数按钮上传。

父主题： 自拓展生态

上一篇：自拓展生态

下一篇：自拓展输出流

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

自拓展输入流

语法格式

关键字

注意事项

示例

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线