更新时间:2023-05-05 GMT+08:00
分享

配置分词

通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。初次使用时,AOM已默认进行了分词配置,默认配置的分词符为:

, '";=()[]{}@&<>/:\n\t\r

若默认分词符不能满足您的需求时,可按照如下操作进行自定义配置。

注意事项

分词配置只会对配置时间点以后生成的日志生效,之前的日志以之前配置的分词符进行处理。

配置分词

  1. 在左侧导航栏中选择“配置管理 > 日志配置”,选择“分词配置”页签。
  2. 配置分词。

    AOM提供了如下两种配置分词的方法。若同时使用了这两种配置方法,则分词符取并集。
    • 自定义分词符:单击,在文本框中输入分词符,单击
    • 使用ASCII码:单击“添加特殊分词符”,参考ASCII码对照表输入ASCII值,单击

  3. 预览分词效果。

    在文本框中输入待预览的日志内容,单击“预览”。例如,分词符设置为,[]预览效果如下图所示:

    图1 预览分词效果

  4. 预览确认配置无误后,单击“确认”。

    单击“重置”,可恢复到默认分词配置。默认分词符为:

    , '";=()[]{}@&<>/:\n\t\r

ASCII码对照表

表1 ASCII码对照表

ASCII值

控制字符

ASCII值

控制字符

ASCII值

控制字符

ASCII值

控制字符

0

NUL(空字符)

32

空格

64

@

96

`

1

SOH(标题开始)

33

!

65

A

97

a

2

STX(正文开始)

34

"

66

B

98

b

3

ETX(正文结束)

35

#

67

C

99

c

4

EOT(传输结束)

36

$

68

D

100

d

5

ENQ(询问字符)

37

%

69

E

101

e

6

ACK(确认回应)

38

&

70

F

102

f

7

BEL(响铃)

39

'

71

G

103

g

8

BS(退格)

40

(

72

H

104

h

9

HT(水平定位符号,制表符)

41

)

73

I

105

i

10

LF(换行)

42

*

74

J

106

j

11

VT(垂直定位符号)

43

+

75

K

107

k

12

FF(换页键)

44

,

76

L

108

l

13

CR(归位键)

45

-

77

M

109

m

14

SO(取消变换)

46

.

78

N

110

n

15

SI(启用变换)

47

/

79

O

111

o

16

DLE(跳出数据通讯)

48

0

80

P

112

p

17

DC1(设备控制1)

49

1

81

Q

113

q

18

DC2(设备控制2)

50

2

82

R

114

r

19

DC3(设备控制3)

51

3

83

S

115

s

20

DC4(设备控制4)

52

4

84

T

116

t

21

NAK(确认失败回应)

53

5

85

U

117

u

22

SYN(同步用暂停)

54

6

86

V

118

v

23

ETB(区块传输结束)

55

7

87

W

119

w

24

CAN(取消)

56

8

88

X

120

x

25

EM(连接介质中断)

57

9

89

Y

121

y

26

SUB(替换)

58

:

90

Z

122

z

27

ESC(跳出)

59

;

91

[

123

{

28

FS(文件分割符)

60

<

92

/

124

|

29

GS(组群分隔符)

61

=

93

]

125

}

30

RS(记录分隔符)

62

>

94

^

126

~

31

US(单元分隔符)

63

?

95

_

127

DEL(删除)

相关文档