요즘 소리 탭 장르 빠져서 자막 파일 있는것만 보다가 너무 듣고싶은거 자막 추출해서 ai 번역 해보기로 맘 먹어서 어찌저찌 했는데
예를들어서 동시에 한명은 입으로 효과음 영차 영차 내고, 한명은 상황 설명한다 치면
'영차 영차 (상황 설명) 영차 영차' 이런식으로 잡힘.. 이거에서
(상황 설명) 이런식으로
입으로 내는 효과음이 단독으로 나오는 게 아니라면 몰입이 깨지는데
저런거 분리하는 건 수작업에 전문가의 영역인가..?