配置分词
通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。初次使用时,AOM已默认进行了分词配置,默认配置的分词符为:
, '";=()[]{}@&<>/:\n\t\r
若默认分词符不能满足您的需求时,可按照如下操作进行自定义配置。
注意事项
分词配置只会对配置时间点以后生成的日志生效,之前的日志以之前配置的分词符进行处理。
配置分词
- 在左侧导航栏中选择“配置管理 > 日志配置”,选择“分词配置”页签。
- 配置分词。
AOM提供了如下两种配置分词的方法。若同时使用了这两种配置方法,则分词符取并集。
- 自定义分词符:单击,在文本框中输入分词符,单击。
- 使用ASCII码:单击“添加特殊分词符”,参考ASCII码对照表输入ASCII值,单击。
- 预览分词效果。
在文本框中输入待预览的日志内容,单击“预览”。例如,分词符设置为,[]预览效果如下图所示:
图1 预览分词效果
- 预览确认配置无误后,单击“确认”。
单击“重置”,可恢复到默认分词配置。默认分词符为:
, '";=()[]{}@&<>/:\n\t\r
ASCII码对照表
ASCII值 |
控制字符 |
ASCII值 |
控制字符 |
ASCII值 |
控制字符 |
ASCII值 |
控制字符 |
---|---|---|---|---|---|---|---|
0 |
NUL(空字符) |
32 |
空格 |
64 |
@ |
96 |
` |
1 |
SOH(标题开始) |
33 |
! |
65 |
A |
97 |
a |
2 |
STX(正文开始) |
34 |
" |
66 |
B |
98 |
b |
3 |
ETX(正文结束) |
35 |
# |
67 |
C |
99 |
c |
4 |
EOT(传输结束) |
36 |
$ |
68 |
D |
100 |
d |
5 |
ENQ(询问字符) |
37 |
% |
69 |
E |
101 |
e |
6 |
ACK(确认回应) |
38 |
& |
70 |
F |
102 |
f |
7 |
BEL(响铃) |
39 |
' |
71 |
G |
103 |
g |
8 |
BS(退格) |
40 |
( |
72 |
H |
104 |
h |
9 |
HT(水平定位符号,制表符) |
41 |
) |
73 |
I |
105 |
i |
10 |
LF(换行) |
42 |
* |
74 |
J |
106 |
j |
11 |
VT(垂直定位符号) |
43 |
+ |
75 |
K |
107 |
k |
12 |
FF(换页键) |
44 |
, |
76 |
L |
108 |
l |
13 |
CR(归位键) |
45 |
- |
77 |
M |
109 |
m |
14 |
SO(取消变换) |
46 |
. |
78 |
N |
110 |
n |
15 |
SI(启用变换) |
47 |
/ |
79 |
O |
111 |
o |
16 |
DLE(跳出数据通讯) |
48 |
0 |
80 |
P |
112 |
p |
17 |
DC1(设备控制1) |
49 |
1 |
81 |
Q |
113 |
q |
18 |
DC2(设备控制2) |
50 |
2 |
82 |
R |
114 |
r |
19 |
DC3(设备控制3) |
51 |
3 |
83 |
S |
115 |
s |
20 |
DC4(设备控制4) |
52 |
4 |
84 |
T |
116 |
t |
21 |
NAK(确认失败回应) |
53 |
5 |
85 |
U |
117 |
u |
22 |
SYN(同步用暂停) |
54 |
6 |
86 |
V |
118 |
v |
23 |
ETB(区块传输结束) |
55 |
7 |
87 |
W |
119 |
w |
24 |
CAN(取消) |
56 |
8 |
88 |
X |
120 |
x |
25 |
EM(连接介质中断) |
57 |
9 |
89 |
Y |
121 |
y |
26 |
SUB(替换) |
58 |
: |
90 |
Z |
122 |
z |
27 |
ESC(跳出) |
59 |
; |
91 |
[ |
123 |
{ |
28 |
FS(文件分割符) |
60 |
< |
92 |
/ |
124 |
| |
29 |
GS(组群分隔符) |
61 |
= |
93 |
] |
125 |
} |
30 |
RS(记录分隔符) |
62 |
> |
94 |
^ |
126 |
~ |
31 |
US(单元分隔符) |
63 |
? |
95 |
_ |
127 |
DEL(删除) |