
这张图片展示了一个将图表图像(Images)逆向工程转化为 TikZ 代码的自动化处理流程(Pipeline)。 该系统的核心逻辑可以分为以下四个主要阶段: 1. 全局规划与输入阶段 (Input & Global Planning) 输入:原始的图表图像(如折线图、柱状图等)。 全局处理: Global Planner(全局规划器):接收图像输入,提取全局性的元数据。 输出:生成 JSON 格式的数据,包含图表的全局参数(例如 "X-scale": 1.5, "Y-scale": 0.5 等比例尺信息)。 2. 并行特征提取阶段 (Parallel Feature Extraction) 图像同时输入到四个并行的深度学习/识别模型中,分别负责提取不同的图表组件信息,并生成对应的 TikZ 代码片段: 图表基本配置识别模型:识别图表的基础结构,生成 Tikz 1 代码。 坐标轴解析模型:解析 X/Y 轴的刻度、标签等,生成 Tikz 2 代码。 数据可视化识别模型:识别具体的数据点、线条或柱状体,生成 Tikz 3 代码。 图例识别模型:识别图例(Legend)的内容和样式,生成 Tikz 4 代码。 3. 代码合成阶段 (Code Synthesis) 填充 (Fill-in):将上述两个阶段产出的数据进行整合。 Global Planner 产出的 JSON 数据。 四个模型产出的 TikZ 代码片段 (1-4)。 模板应用:这些数据被填入预设的 Latex 模板 中。 产出:生成一份完整的 TikZ 代码 (Complete Tikz Code)。 4. 编译与校验循环 (Compilation & Validation Loop) 这是该系统的一个关键闭环,用于保证代码的可执行性: Latex Compiler(编译器):尝试编译生成的完整代码。 成功 (Success):直接输出 最终图表,流程结束。 失败 (Failure):触发错误处理机制。 Check Agent(校验/修复智能体): 接收编译失败的信息。 分析错误并尝试修复代码。 生成 New Tikz Code(新代码)。 回环:将新代码再次送回 Latex Compiler 进行编译,直到成功为止。
Pipeline automatizzato per la retroingegneria di immagini di...