사용 프로그램
구글 ai 스튜디오, 클로드,
OCR로 구글 클라우드 비전 사용.
읽어낸 텍스트를 제미나이에게 전송해서 번역.
알고리즘?으로 프로그램내에서 말풍선 구분.
인공지능 자체 말풍선 구분이 잘 안되기 때문에 텍스트 줄 별로 말풍선 배경색으로 덮어버리는 오버레이 구현.
색깔을 잘 못 집어내서 결과값 수정기능 추가
현재 문제점.제미나이가 효과음과 신음을 구별 못하는 경우가 많음. 말풍선 안에 신음이 단독으로 나오면 텍스트를 지우지 않는 경우가 발생.
신음 예시를 써넣고 돌릴 수 있으나 가뜩이나 부족한 컨택스트 윈도우(제미나이 뇌용량) 낭비가 심해짐.
어떻게 수정할지 고민 중.
