[인트로]
콜로모 사이트 알게 되고 나서 잘 사용하다가
소설가가 되자에서 크롤링한 텍본들을 일일이 노가다하는게 그래서 파이썬 코드로 자동화 했습니다.
개인적으로 쓸 생각으로 해서 멋들어지게 exe 파일 같은거 만든거 아니니 혹시라도 필요하신 분 있으시면 사용하세요. (애초에 코딩 잘 못해서 구릴겁니다.)
[사용방법]
파이썬 설치하시고 cmd창에
pip install playwright
랑
playwright install chromium
입력해서 설치하세요.
2. 폴더 경로 설정
run_colomo.py 안에
SOURCE_DIR 에 txt파일들 있는 폴더 경로 입력하시고
SAVE_DIR 에 저장할 폴더 경로 입력하시면 됩니다.
3. 실행
cmd 창에서 python run_colomo.py 입력하면 크롬 창이 하나 뜨고 콜로모 사이트가 나올겁니다.
거기에서 평소에 사용하시던 API 설정, 프롬프트, 기타 등등 입력하시고
cmd 창에서 enter 누르시면 시작될겁니다.
설정하신 세팅을 저장되니까 다음에 실행하실 땐 바로 엔터 누르셔도 됩니다.
[마무리]
잘 안되시면 제미니 한테 물어보면 알려줄거에요
혹시 더 써야할 사항 있으면 나중에 추가할게요
배포같은거 많이 안해봐서 안되면 알려주세요
[디테일]
* 크롬 창을 최소화하지 마세요. 속도가 느려질 가능성이 있습니다. 크롬 창 그대로 두고 다른 작업하는거는 지장 없습니다.
* 경고 표시 걱정하지 마세요. 보통 우회 번역 문제로 발생하는데 어지간하면 해결 되는 것 같습니다. 10분동안 번역이 진척 안되면 자동으로 다시 합니다.
* 조각 단위로 저장하기 때문에 api 제한 문제로 끊기거나 해도 기록됩니다. 이미 완료한건 스킵 기능도 있으니 혹시 다시 하고 싶으시면 완료 폴더에서 파일 제거하셔야 합니다.
* 파일 안에 "chunks = split_text_smartly(full_text, 100000)" 에서 100000이 얼마나 전체 파일을 조각낼지를 결정합니다. 크게 하면 다른 분들 후기 처럼 번역 누락 및 순서 바꿈 문제가 발생할 수 있습니다. 대신에 API의 RPD 제한에 좀 더 자유롭습니다.
* 텍스트 이쁘게 쪼개고 싶다 하시는 분은 split_text_smartly 함수 수정하시면 됩니다.
* 전 API key 30개로 한 12시간 정도 번역해서 25 MB 정도 번역되는 것 같습니다.
P.S. 글 작성 Tab을 잡담으로 하면 될까요?
P.S2. 비번 ㄱㄹ
aHR0cHM6Ly9raW8uYWMvYy9jcGdXb3BOY2VBUGhuN01hVWNUaldi
