文档首页 > > 开发指南> 开发HBase Elasticsearch全文检索应用> HBase Elasticsearch schema说明

HBase Elasticsearch schema说明

分享
更新时间:2020/06/17 GMT+08:00

HBase通过表的METADATA来存储Elasticsearch schema的定义:

表1 schema定义

字段名称

value说明

是否必填

hbase.index.es.enabled

该HBase表在Elasticsearch中是否创建全文索引,true表示创建,默认为false。

hbase.index.es.endpoint

云搜索服务集群(Elasticsearch引擎)的访问地址,例如'ip1:port,ip2:port'。

hbase.index.es.indexname

HBase表对应在Elasticsearch中的索引名称,必须小写。

hbase.index.es.shards

Elasticsearch中索引的分片数量,默认5。取值为大于等于1的整数。

hbase.index.es.replicas

Elasticsearch中的索引的副本数量,默认1。取值为大于等于0的整数。

hbase.index.es.schema

HBase和Elasticsearch的字段映射,json数组格式的字符,每个元素包含以下字段:

  • name:Elasticsearch中的字段名称。
  • type:Elasticsearch中的字段类型。
  • hbaseQualifier:数据源HBase qualifier。
  • analyzer:text类型的字段通过“analyzer”可以指定分词器。中文分词器一般使用“ik_smart”。默认是“Standard”分词器,支持英文。

例如:

'[ {"name":"contentCh","type":"text","hbaseQualifier":"cf1:contentCh","analyzer":"ik_smart"}, {"name":"contentEng","type":"text","hbaseQualifier":"cf2:contentEng"},{"name":"id","type":"long","hbaseQualifier":"cf1:id"} ]'

HBase-Elasticsearch全文检索当前支持的数据类型有{"text", "long", "integer", "short", "byte", "double", "float","boolean"},也就是schema中type的取值类型。text是Elasticsearch中的文本类型。全文检索一般是指对text类型数据的检索,同时也支持基本数据类型的准确检索。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问