Page 387 - 《软件学报》2025年第9期

P. 387

4298 软件学报 2025 年第 36 卷第 9 期

判断目标跨度的目标位置的参数索引是否在符合要求的取值索引中. 如果符合条件, 则交由重构器还原该追踪的
文本表示.

算法 3. 单字段搜索过程.
输入: 目标字段 key, 比较符 operator, 比较取值 value, 跨度容器 span_containers, 结构列表 structs, 压缩分组
groups;
输出: 符合条件的追踪数据 traces.
1. spans ← {}, structs ← {}, traces ← []
2. for each span in span_containers //遍历所有跨度容器, 寻找符合条件的跨度
3. if key in span.key_dict and index_of(value, span.param_dict[key], operator, value) > 0
4. spans[span] ← index_of(value, span.param_dict[key], operator, value) //记录符合条件的取值索引
5. for each struct in structs //遍历所有结构, 寻找包含目标跨度的结构
6. if struct.spans ∩ spans is not empty
7. structs[struct] ← position_of(struct, spans) // 记录目标跨度在结构中的位置
8. for each group in groups
9. if group.structs ∩ structs is not empty
10. data ← decompress(group) // 解压符合条件的压缩分组
11. for each trace in data
12. if trace.struct ∈ structs and trace.get_value(structs[trace.struct]) ∈ spans
13. traces ← trace ∪ traces //将符合条件的数据加入结果列表中
14. return traces

跨度容器 1 结构容器分组 1 索引
索引字典组合字典
ID 字段值指针 ID 参数值 ID 组合追踪 ID 结构 ID 开始时间
http.status_code>200 0 kind 0 200 0 (0, 1) 0 1 1 0 1700000
1 http. status_code 1 400 1 (0, 1, 2) ... ... ... ...
... ... 2 500 ... ...

跨度 ID 组合索引位置取值索引结构 ID 跨度 ID 位置
1 0 1 [1, 2] 0 1 [1]
1 1 ... ... ...
... ... ... ...
图 8 字段搜索示例流程

除了字段查询以外, NCQT 还支持根据结构搜索相关追踪. 由于结构容器中记录了每种结构的序列化表示, 定
位器既可以快速判断被查询的两个跨度是否在某个结构中属于祖先与后代的关系, 又可以找出被查询跨度指定跳
数以内的上下游节点. 相较于字段搜索, 结构搜索无需遍历跨度容器, 因此拥有更快的查询速度.
NCQT 通过预加载的方式缓解了搜索冷数据的问题. 如果查询过程中定位到的分组尚未解压, 则会带来较长
的解压时间开销, 第 4 节给出了分组是否需要解压时的查询延迟对比. 考虑到用户在查询数据时可能围绕同一场
景对相关追踪进行搜索, 且压缩的追踪数据根据相似性分组, NCQT 在解压时可以选择对被解压分组的相邻分组
后台并行解压, 从而提高后续查询命中已解压分组的概率.

3.3.2 解压
从编码器解压数据的过程与压缩过程相似. 算术编码使用网络模型的概率估计解析数据, 然后网络模型根据
新窗口输出下个字符的概率, 重复该过程直至所有数据解压完成. 具体而言, NCQT 首先使用相同的均匀分布概率

382 383 384 385 386 387 388 389 390 391 392