배치번역기 용어집 추출 용도로 써도 되는데 기본세팅은 그렇게 효율좋지가 않아서 따로 잡아야 함. 단어집 뽑는건 chunk를 10만 단위로 넣어도 괜찮음. 이정도 chunk면 단어집 샘플링을 10%가 아니라 100%로 해도 충분함. 다만 이렇게 하면 단어집 한계 리밋에 걸릴 수 있으니까 config 파일을 메모장으로 열어서 "glossary_max_total_entries": 9999, 로 바꿔야 합니다. 그리고 쓸데없는거 추출될수도 있으니까 occurrence count 숫자에 따라 수동으로 컷해줘도 좋습니다. 기본 번역이랑 세팅이 아예 다르니까 배치번역기 새로 폴더하나 복사해서 따로 운용하는게 나을겁니다. 제미나이로 파이선 스크립트 만들어달라고 할수 있다면 훨씬 할수있는게 많아지긴 합니다.