컴퓨터가 읽기 까다로워하는 아티스트 CG (말풍선 없는 대사 많은 작품) 리더를 만들고 싶었다.
꽤 진척이 있다!
여기서 나온 아이디어는, 두 가지의 OCR 데이터를 가지고 LLM에 박아넣는 것이다.
[Task] You are an expert manga translator/editor.
1. Analyze the OCR results (MangaOCR vs PaddleOCR) to determine the correct **Japanese source text**. Fix OCR errors (typos, missing characters).
2. Provide the corrected Japanese text in [READ].
3. Translate it into natural, context-aware **Korean** in [KO].
이런 식이다. (실제 프롬프트는 약 15000자이다)
그리고 이왕 여러 스텝으로 나뉜 겸에 파이프라인으로 돌아가는 걸 CLI로 개조해서 파일 하나로 딸깍, 하도록 만들어 봤다.
.json 출력도 .html 로 가공하도록 만들어 봤다.
결과
이런 느낌.
괜찮지 않나?
Ballontraslator 같은 것들도 artist CG는 이 정도 퀄리티로 못 뽑아냈던 거 같음. 애초에 다 뭉개버리지 않나?
어느 정도 만족한 겸 다음 진행해볼 작업 구상중이다.
이거 말고도 아이디어 있으면 편하게 제안해 줬으면 좋겠다.
결과가 만족스럽네.
이건 약간 고민되는 점인데 혹시 뭔가 해결책 있으면 조언 부탁
그러니까 기본적으로 venv 디펜던시를 그대로 코랩으로 옮기는 건 어렵다고 알고는 있는데, 이거 쉽게 처리 가능한 방법 있을까?
코랩 구축해서 폰으로 '딸깍' 하고싶다.
