
이 이미지는 차트 이미지를 TikZ 코드로 역설계하는 자동화된 파이프라인을 보여줍니다. 이 시스템의 핵심 논리는 다음과 같은 네 가지 주요 단계로 나눌 수 있습니다. 1. 입력 및 전역 계획 단계: 입력: 원본 차트 이미지 (예: 선 차트, 막대 차트 등). 전역 처리: 전역 플래너: 이미지 입력을 받아 전역 메타데이터를 추출합니다. 출력: 차트의 전역 매개변수 (예: 'X-scale': 1.5, 'Y-scale': 0.5 등)를 포함하는 JSON 형식 데이터를 생성합니다. 2. 병렬 특징 추출 단계: 이미지는 동시에 네 개의 병렬 딥러닝/인식 모델에 입력되며, 각 모델은 서로 다른 차트 구성 요소 정보를 추출하고 해당 TikZ 코드 스니펫을 생성하는 역할을 합니다. 차트 기본 구성 인식 모델: 차트의 기본 구조를 식별하고 Tikz 1 코드를 생성합니다. 축 파싱 모델: X/Y 축의 스케일, 레이블 등을 파싱하고 Tikz 2 코드를 생성합니다. 데이터 시각화 인식 모델: 특정 데이터 포인트, 선 또는 막대를 식별하고 Tikz 3 코드를 생성합니다. 범례 인식 모델: 범례의 내용과 스타일을 식별하고 Tikz 4 코드를 생성합니다. 3. 코드 합성 단계: 채우기: 위 두 단계에서 생성된 데이터를 통합합니다: 전역 플래너에서 생성된 JSON 데이터. 네 개의 모델에서 생성된 TikZ 코드 스니펫 (1-4). 템플릿 적용: 이 데이터는 미리 설정된 LaTeX 템플릿에 채워집니다. 출력: 완전한 TikZ 코드를 생성합니다. 4. 컴파일 및 검증 루프: 이는 코드 실행 가능성을 보장하기 위한 시스템의 중요한 폐쇄 루프입니다: Latex 컴파일러: 생성된 완전한 코드를 컴파일하려고 시도합니다. 성공: 최종 차트를 직접 출력하고 프로세스가 종료됩니다. 실패: 오류 처리 메커니즘을 트리거합니다. 검사 에이전트: 컴파일 실패 정보를 받습니다. 오류를 분석하고 코드를 수정하려고 시도합니다. 새로운 TikZ 코드를 생성합니다. 루프: 성공할 때까지 새로운 코드를 Latex 컴파일러로 다시 보내 컴파일합니다.
YOLOV5 아키텍처 다이어그램...