검열을 비교적 잘 회피하는 콜로모 번역기를 이용해 파일 분할, 번역, 검수, 자동수정, 통합 하는 프로그램을 만들고 있습니다.
## 0 프로그램 시작
프로그램이 실행되면 번역에 사용할 크롬창을 띄우고, 콜로모에 접속한 후,
API (API_list.txt), 프롬프트(prompt.txt), 사전(glossary.txt)를 읽어 설정합니다.
이 크롬창은 번역과, 검수에 사용되니 닫으면 안됩니다.
## 1단계> 파일 분할
1단계 작업이며 파일을 선택하고, 줄 수를 정하면 파일을 나눠 줍니다. 이때 원문의 각 줄마다 (ID:숫자) 형식의 태그를 앞머리에 붙입니다.
그리고 쪼개진 파일들은 설정의 temp 디렉토리에 저장됩니다.
## 2단계> 번역
[자동 번역 시작] 버튼을 누르면 번역을 시작 합니다.
temp 폴더에 있는 파일들을 하나씩 가져와 콜로모로 번역 후 translated 폴더에 번역본을 저장합니다.
이 때 로그 창과 로그 파일에 번역 상황을 모니터링해 알려줍니다.
문제가 없으면 파일명... 완료가 출력되지만, 원문과 비교해 누락이 있으면 누락 갯수와 ID번호를 출력합니다.
(가독성 때문에 출력되는 ID번호 갯수는 설정창에서 정해진 개수로 제한됩니다)
번역을 하면서 프로그램은 누락 줄을 찾아 자동적으로 repair_request.txt 파일을 만듭니다.
이 파일 안에는 누락된 원문을 뽑아와 담아 놓습니다.
그리고 번역이 다 끝나면 이 파일을 이용해 다시 콜로모를 돌려 자동적으로 repair_result.txt 파일이 만들어 집니다.
이건 나중에 자동적으로 누락을 보수할 때 사용합니다.
## 3단계> 검수 및 수정
번역이 다 끝나고 repair_result.txt 까지 만들어 지면 [누락 자동 수정] 버튼을 누르면 알아서 누락된 부분을 메꿔 줍니다.
로그에 어디를 수선했는지 다 기입됩니다.
## 4단계 >통합
마지막으로 [최종 병합 실행] 버튼을 누르면 translated 폴더에 있는 파일들을 가져와 (ID:번호) 떼고 병합해서 파일1개로 만들어 줍니다.
이때 파일 순서는 파일 리스트 창에 있는 순서로 합니다. 옆에 위로,아래로 버튼이 파일 위치를 바꾸는 겁니다.
이것으로 끝났으면 좋겠지만... AI번역의 찐빠는 심오하죠. 사실 간단한 누락만 수선할 수 있지 복잡한 경우는 못 고칩니다.
그리고 누락분을 콜로모로 번역하는 것도 번역 오류가 없다고는 못하죠.
그래서 [전체 파일 체크]로 몇 번 더 검수 해봐야 합니다.
이 기능도 원문과 번역문을 비교해 가며 누락이나 이상한 부분 찾아서 repair 파일들을 만듭니다.
여기서 다시 누락들이 잡히면 다시 [누락 자동 수정] 버튼을 눌러 자동 수리 하면 됩니다.
이렇게 해도 오류가 남아 있으면 로그를 보고 해당 파일 리스트에서 해당 파일을 찾아 [더블 클릭]하거나 [gvim]버튼을 누르면
이렇게 원문과 번역본을 gvim에 띄워 줍니다.
ID:번호 보고 오류 부분 찾아서 수동으로 고치면 됩니다.
이게 아직 검수 부분 좀 더 손 봐야 해서 프로그램은 올리지 않았습니다.
자동으로 고칠 수 없는 부분을 AI가 판단해서 그 부분을 통채로 들어내고 다시 번역 후 끼워넣는 로직까지 고민하고 있거든요.
사실 AI 작정하고 ㅈㄹ해서 (ID:번호)는 남기고 내용만 싹 바꿔치기 하는 경우(실제로 발생합니다)는 잡아낼 방법이 없습니다.
뭐 줄 빠트리거나 번호 왜곡되는 것 정도만 잡을 수 있어요.
어느 정도 쓸만하다 판단되면 며칠 내로 공유하도록 하겠습니다.
