야겜 공유가 메인으로 돌아가는 이곳에선
유저들이 번역야겜의 번역 정도를 원활히 확인하기 위해
제목에 손번역, 검수, AI번역, 기계번역, 미검수 와 같은 태그가 붙어져 왔다.
이러한 태그들 중, 미검수 를 제외하고는
제대로 된 가이드라인이나 규칙이 존재하지 않는다.
이유야 여럿 존재하겠지만,
딱히 구분짓지 않아도 여태까지 알아서 암묵적으로 잘 써왔기 때문이라는 부분이 크다고 생각된다.
그러나 이렇다 할만한 확실한 가이드라인이 없기 때문에 문제가 발생한다.
첫째, 이러한 번역 용어의 기준이 개인 주관에 따라 달라질 수 있다.
가이드라인이 없으니
번역 용어에 대한 생각이 역자나 유저의 개인 주관에 의해 판단되므로
AI번역이라고 써있어서 받아봤더니 파파고번역 이었다거나 하는 등
번역에 대한 기준이 사람마다 다를 수 있다는 것이다.
예를 들어 어떤 역자가 대충 기계번역 돌리고 초반부만 검수해서 번역했다 치고,
그 역자 입장에선 그게 손번역이라고 판단해서 손번역으로 올렸는데
받아서 게임을 해본 유저 입장에선 퀄리티가 받쳐주질 않으니 전혀 납득이 안 갈 수 있는 것이다.
둘째, 이렇게 혼용되어 단어가 사용되면 유저들이 정보를 순수하게 받아들이기 힘들어진다.
위에서 언급한 예시와 같은 상황에서,
제목에 손번역이라 써있어서 받고 해봤더니 플레이 해본 유저가 납득하기 힘든 번역 퀄리티라면,
이후에 올라오는 다른 손번역 자료들에 대해서도 해당 유저는 일단 의구심을 갖게 되고
제목 태그에 대한 신뢰도가 떨어지게 된다.
셋째, 제목 태그가 오히려 유저들에게 정보를 혼동 시키게 할 수 있다.
여태껏 제목에 기번, AI번역, 손번역 같은 단어들을 써온 이유는
받는 유저들로 하여금 간단히 정보를 인식하게 하기 위함이 크다.
그런데 AI번역+기계번역, 기번/손번역, 30% 부분 손번역과 같은 제목들은
유저들에게 정확히 이게 어떤 번역인지 제목만으론 쉽게 알 수 없는
혼란스러운 정보를 제공하고,
받고 압축풀어서 해보기 전까진 그 결과를 모르는 슈뢰딩거의 야겜같은 상태가 되어버린다.
그리고 넷째, 이러한 일련의 이유들로 인해 분란이 생긴다.
이곳이 제아무리 음지 커뮤라 한들,
하루 유동인구가 천에서 만단위로 오고가는 일종의 대형 커뮤다.
따라서, 유저수가 많은 만큼 여러 사람이 모이게 되고
번역 관련 이슈로 분란이 생길 여지가 매우 크고,
분란이 생겼다고 한들, 번역 용어에 관련된 가이드라인이 없으니
문제에 대처하기 어려워진다.
본인은 이러한 부분들에 대해서 누구의 잘잘못인지를 따지는 것보다
가이드라인의 부재와 통일되어 있지 않은 단어의 개념이 문제라고 생각하며,
또한, 역자의 노력과 가치가 폄하되는 문제를 막기 위해
번역 용어의 정의에 대해 생각해 볼 필요가 있다고 생각한다.
따라서, 본인은 번역탭 제목에 사용되는 번역 용어에 대한 개념에 대해
통상적으로 어떻게 사용되는지, 국제 기관에서는 어떻게 정의되어 있는지,
그리고 이러한 번역용어들에 대한 주관적인 의견까지 남기고자 한다.
어디까지나 내 생각이 그렇다는 것이니, 그렇게 알아 줬으면 좋겠다.
일단, 기계번역과 AI번역이란 단어의 개념을 설명하고자 한다.
기계번역
은 말 그대로 기계를 통한 번역, 해외에서는
MT, MTL, Machine Translation
등으로 표현되며
이곳 커뮤에선 통상적으로 EHND, 구글번역, 파파고번역 등과 같은 기계적 사전 혹은 번역 프로그램을 써서
게임의 내용을 규칙 및 통계적 번역, 혹은 신경망 기계번역을 통해
번역하는 행위라 할 수 있다.
일단
기계번역
의 특징을 대자면,
인간이 만든
규칙과 통계를 기반으로 번역
이 굴러간다.
그러니, 알기 쉽게 말하자면,
일단 사전적 데이터로 규칙을 정한다.
이것을
규칙 기반 기계번역 (RBMT, Rule-Based Machine Translation)
이라고 한다.
I like apple 을 예시로 들자면
I=나, like=좋아하다, apple=사과
라는 사전적 데이터를 입력하고
이를 각 나라의 문법 규칙에 맞게 재배치한다.
한국어는 순서가 주어+목적어+동사가 되므로
나 사과 좋아하다 순으로 배치시키고
문법 규칙에 맞게
은(는), 을(를) 과 같은 조사를 집어넣는다.
그럼 나는 사과를 좋아한다 로 출력되는 것이다.
그러나, 이렇게 규칙성만을 이용한 번역에는 문제가 하나 있는데,
미리 입력된 사전적 단어와 규칙을 출력할 뿐인지라
あん (앙) 이라는 단어가 신음을 단발하는 앙 이 아니라
팥고물이 되어버리는 대참사가 발생하는 것이다.
일본에선 붕어빵같은거 안에 들어가는 팥앙금, 팥소 를 あんこ (앙코) 라고 부른다.
우리가 붕어빵 안에 팥을 팥앙금, 앙금, 팥 등 여러가지 방식으로 부를수 있듯,
일본도 팥앙금을 あんこ (앙코) 만이 아닌 あん (앙) 으로도 표현이 가능하다.
따라서, 과거 야겜에서 あんあああんあんあんあん 과같이 신음이 연발될때,
이를 팥고물아아팥고물팥고물팥고물팥고물 로 표현이 되어 버리는 것이다.
물론, 이 때문에 많은 역자들이 EHND 사전과 규칙성을 개선하는 등의 노력이 이뤄졌으며
따라서 기계번역을 굴렸다고 해도, 개선시킨 이지트랜스XP의 ehnd 사전등이 보급되며
현재 야겜 번역에서는 보기 힘든 케이스가 되었다.
그런 기계번역의 규칙성을 보완하기 위해서 생각해낸 것이 통계를 기반으로 된
통계 기반 기계번역 (SMT, Statistical Machine Translation)
이다.
이게 구글이나 파파고가 옛날에 쓰던 번역 방식인데,
사전이나 규칙성 뿐만 아니라, 사용자가 사용한 문장을 통계적으로 분류하여 정확도를 높이는 것이다.
예를 들어, I like apple이란 문장을 몇만개 확인해 본 결과,
95%의 사용자가 이 문장에서 apple 이란 단어를 사과 라는 단어로 쓰고 있다고 판단했다고 치자.
그걸 바탕으로 통계상 사용 빈도가 높은 단어를 선택하고 조각맞추기 하듯 문장을 맞춰가서
I like apple을 나는 사과를 좋아한다 로 번역하게 되는 것이다.
이렇게 규칙성과 통계를 합친 기계번역은 단편적인 문장에서 좋으며
번역 처리속도가 매우 빠르다.
또한, 무언가를 번역할 때 일관성이 매우 뛰어나서
한 문장을 여러차례 번역해도 결과는 거의 한가지로 고정되어있다.
다만, 이것도 한계가 명확하다.
단어를 쪼개서 번역하기 때문에 War=전쟁, Never=결코, Again=다시 로
각 단어 혹은 문장을 부분적으로 쪼개서 번역한 이후에
통계적으로 가장 빈도가 높은 한국어 어순으로 재조합하기 때문에,
결과적으로 결코 다시 전쟁이 되어버린다.
이처럼 문맥이 매끄럽지 않고, 어순이 완전히 다른 언어 간에는 번역 오류가 잦았고
기계번역 특유의 어색한 말투가 남았다.
다만, 통계 기반 번역의 경우엔 아래에 설명할 번역으로 흡수 되며 사실상 현재엔 잘 사용되고 있지 않다.
위에서 설명한 통계 기반 번역을 보완하기 위해 나온게
신경망 기계번역 (NMT, Neural Machine Translation)
이다.
현재의 구글이나 파파고와 같은 온라인 서비스가
딥러닝 기술을 활용하여,
문장을 부분적으로 쪼개서 번역하는 것이 아닌,
인코딩->디코딩하는 구조를 거쳐
보다 자연스러운 번역을 하게끔 만들었다.
쉽게 말하자면
파파고나 구글번역기 같은것들이
문장을 통째로 숫자 데이터로 변환해 다시 언어로 풀어낸다고 생각하면 될 것 같다.
이는 유니티 계열의 게임에 플러그인을 집어넣어, 온라인으로 번역을 굴리는
자동번역
과 같은 형태로도 쓰이고 있고,
많은
자체번역
게임들이 구글, 파파고를 통한 번역이다.
다만, 얘도 문제가 있는데
딥러닝 기반으로 번역을 돌리면, 공식적인 학습 데이터 뭐 뉴스나 논문같은거에 없는 말투에 취약하다.
그래서 모해유 라는 단어가 무슨 뜻인지 도출이 안되니, 자기 좆대로
어미 모(母)+해유=Motherfucker 가 되어버린다.
또한, 문장이나 단어를 자기 좆대로 지워버린다.
흑흑ㅠㅠ에서 ㅠㅠ가 뭔지 모르니 걍 지워버리고
남은 흑흑 이라는 부분을 검을 흑(黑) 으로 판단하여
흑흑ㅠㅠ=Black 이 되어버린다.
게다가 여전히 기계번역 어투가 사라진게 아닌지라,
이걸 기반으로 번역한 애들은 확연하게 번역 퀄에서 티가 난다.
번역을 돌렸을때 이것이 게임에 대한 번역인지
현실에서 사용할 단어의 번역인지 알 수 없으므로,
Exit을 나가기가 아닌 출구 라고 번역하고
Gallery를 갤러리가 아닌 갱도 라고 번역하는 등,
오역이 꽤 많이 발생한다.
애시당초 구글 번역이나 파파고 번역은 게임 번역을 전제로 만들어진 것이 아닌,
일상 생활에서 빠르게 의사소통을 하기 위한 목적이 크기 때문에,
이러한 오역이 자주 발생할 수 밖에 없다.
그러다 최근 들어 번역계에 핵폭탄급 대격변이 일어났는데
모두가 다 아는
AI번역
이다.
AI번역은 대형 언어모델 (LLM, Large Language Model)을 기반으로 한 번역이고
따라서 정확히는
대형언어모델 기반 번역 (LLM-based Translation)
이다.
다만, 해외에서도 저렇게 쓰긴 어려우니
AI번역 (AI Translation)
혹은 사용된 언어모델을 기재하곤 한다. (예시: Translated by GPT-5.5)
통상적으로 이곳에선 ChatGPT, Gemini와 같은 언어모델 기반의 번역을 AI번역이라 칭하곤 한다.
큰 틀에서 보면 기계로 번역하는 것이니 기계번역에 해당하지만,
유저들이 원하는 것은 번역된 자료의 퀄리티를 판단하는 것이니 어지간해선 AI번역으로 통용된다.
제미니, 챗GPT와 같은 온라인 서비스 뿐만 아니라,
LLaMA 같이 컴퓨터에서 직접 실행 가능한 로컬 LLM도
온라인 LLM보다 제한적인 능력이지만 역시 AI번역에 해당된다.
수조 개의 데이터라는 방대한 량의 정보를 언어모델이 무차별적으로 학습하고
그 데이터를 기반으로, 보다 유연하고 유창하게 번역한다.
또한, 번역 정보 뿐만 아닌 온갖 정보를 학습했기 때문에,
프로그래밍을 포함하여 여러 복잡한 정보도 도출해 낼 수 있다.
이 때문에 눈에 보일 정도로 매우 자연스러운 번역을 한다.
규칙성, 통계성, 딥러닝등과는 전혀 다르게
방대한 정보량에서 언어모델이
직접 추론하고 결과를 도출해 내므로,
대체로 문장의 어휘가 유연하고 가독성이 좋은 번역문을 뽑아낸다.
그래서 현재 추세로는 기존의 기계번역 방식보다 AI번역 방식을 유저들이 더 선호하는 편이다.
다만, 단점도 명확하다.
LLM을 이용한 번역은 거의 문장을 재창작하는 것에 가깝다.
방대한 정보를 이용해 LLM이 문장을 추론하고 다시 구성하게 되는데
그 과정에서 문장마다 어울리는 단어 선택을 지 꼴릴대로 하기때문에
단어가 일관되지 않은 경우가 잦다.
특히, 인명 지명같은 고유명사의 경우,
한자는 똑같은데 요미가나가 달라서 읽는법이 다른 경우가 있어서
번역할때마다 결과물이 바뀌어버린다던가 해서
眞一라는 이름이 신이치, 마사카즈, 마사이치같이
사람은 한명인데 지좆대로 이름이 무한해질 수 있다.
위의 이미지에서 설명된 것 처럼
갑자기 헛소리를 지껄이는 경우도 생긴다.
언어모델이 최신일수록 오역이 적어졌지만, 여전히 발생한다.
환각번역도 존재한다.
ドクン、ドクン 도쿵 도쿵 같이 꼬추가 움찔거린다는 투의 단어가
원문엔 있지도 않은 심장이 뛰듯 덜컥, 덜컥 같이 번역되기도 한다.
( ) 「 」 『 』 【 】 … ・ ー ― — ゛ ゙ 같은 특문들을
지 맘대로 한국식으로 바꾸는 경우도 매우 잦다.
그런 주제에 정작 바꾸는게 보기좋은 。、〜 ? !같은 특문은 남겨 놓는다.
의성어 의태어에 매우 취약해서
イグゥゥゥゥッ 같은거 나오면
가버려어어어어엇 이 아닌
이그으으 로 끝나버리는 경우가 있고
ぬぷっ! ぬぷっ! ぬぷっ! ぬぷっ!이
뿍! 뿍! 뿍! 뿍! 이 될 때도 있다.
그리고 언어모델이 원문을 재구성해낸 결과물이
한가지로 고정되어 있는것이 아니니,
위의 이미지와 같이 한가지 문장 임에도
여러 결과로 도출되어 버리고,
유저들로 하여금 번역문 이해에 혼란을 야기할 수 있다.
이를 보완하기 위해 프롬프트를 작성하기도 하지만
프롬프트가 길어질수록 토큰을 많이 쳐먹고
그마저도 매번 프롬프트대로 움직여주지 않아서
번역에 선,후처리 과정을 거치는 역자들도 있다.
따라서, 규칙적이고 통계적인 결과만 내뱉는 기계번역보다
결과물이 일관적이지 않은 AI번역이 검수가 더 많이 필요하다.
이러한 이유들로 인해 본인은 AI번역이 만능이라고 생각하지 않는다.
몇년 뒤쯤 되면 AI번역에 검수조차 하지 않아도 될 지 모르지만,
현 시점에선 어떤 최신 모델을 쓰더라도 위에서 설명한 문제점들이 간혹 일어나기 때문이다.
따라서, 위 이미지와 같이
기계번역과 AI번역의 장단점을 구분할 수 있다.
DL이나 스팀 어느쪽의 제작자든
공식적, 혹은 자체적으로 번역을 넣는다면
대부분이 기계번역이나 AI번역일 확률이 높고,
이는 이곳에서 통상적으로
자체번역, 자체한글, 공식번역
과 같은 단어로 쓰인다.
기계번역이나 AI번역, 그 어떤 방식을 택하든 검수를 거치는 쪽이 더욱 안정적인 결과물을 도출한다.
게임 번역은 특히 만화나 소설과 같은 문학 작품과 달리
플러그인 및 스크립트와 같은 구간에 번역이 필요한 내용이 있는 경우가 잦기 때문에
검수를 거치지 않으면 어떤 구간에서 번역되지 않은 내용이 튀어나올지 모르며,
게임 진행에 문제가 되는 치명적인 오류가 발생할 수도 있다.
그렇게 AI번역이나 기계번역 이후에 검수를 거치는 과정을
해외에서는
MTPE, Machine Translation Post-Editing
이라고 한다.
기계번역 사후 검수 교정
이라는 뜻이고,
이곳에선 번역물 제목이나 본문에
검수
를 했다고 표현하는 행위라고 생각된다.
또한, 미검수 규칙이 존재하니,
미검수가 적혀있지 않은 모든 번역 게시물은 일반적으로 이러한 검수를 거쳤다고 판단한다.
기계번역 사후 검수 교정이라는 단어에서 알 수 있듯이,
원문의 1차적인 번역은 기계나 AI 언어모델에게 맡기고
그 이후에 사람의 손을 거쳐 검수를 맡는 것이다.
여기서 검수는
오역과 번역되지 않은 구간에 대한 검사와
번역으로 인한 게임 내 오류가 포함된다.
역자가 검수를 맡았음에도 발생하는 오류, 오역, 미번 구간은
차후 역자 본인이 체험하면서 다시 검수과정을 거치거나
혹은 피드백 탭이나 댓글을 통해 이러한 정보를 얻고 고쳐지게 된다.
따라서, 검수라 함은
게임이 오류없이 원활하게 실행 되는지에 대한 검수
게임 내에 번역되지 않은 구간에 대한 검수
게임 내에 기계번역이나 AI번역에서 발생하는 오역이나 문제점에 대한 검수가 되겠다.
이렇게 검수 과정을 부분적으로 거치거나
게임 내 텍스트 또한 유저 입장에서 게임 플레이 및 내용의 이해만 가능하게 고쳐내는 등,
미검수는 아니지만 최소한의 과정을 통해 확인 검수 및 교정하는 것을
해외에선
LPE, Light Post-Editing (사후 경미 검수 교정)
이라고 부른다.
말 그대로 게임 전체를 검수하는 것이 아닌,
필요한 부분만 검수를 거치는 것이다.
즉, 여기 번역탭에 올라오는 번역 작품 중에
미검수를 제외한,
AI번역, 기계번역에 검수를 대충 거친 작품들은 Light Post-Editing이다.
20% 손번역, 부분손번역, 기번검수같은 것도 Light Post-Editing에 해당한다고 생각된다.
최소한의 검수만을 거치는 것과 다르게,
최대한 모든 내용을 전부 검수해내는 번역을
해외에선
FPE, Full Post-Editing (전수 사후 교정)
이라고 부른다.
기계번역 혹은 언어모델을 통한 AI번역을 거친 번역문을 모두 검수해낸 번역문을 뜻한다.
이러한 MTPE, LPE, FPE 등, 검수에 대한 모든 내용은 국제 표준 ISO 18587:2017로 존재한다.
위의 이미지와 같이,
Light Post-Editing은 최소한의 검수를 거치는 것이고,
Full Post-Editing은 전체적으로 검수를 한다고 보면 된다.
당연한 얘기지만, Full Post-Editing은
처음부터 끝까지 전부 검수를 거친 번역문이니
단순히 기계번역이나 AI번역을 돌린 것,
혹은 최소한의 검수만 거친 번역물보다 번역의 퀄리티가 좋고
유저들이 번역으로 인해 겪게 되는 불편을 상당히 줄여준다.
이곳에선 대부분의 역자가 이를
손번역
이라고 쓰고있다.
다만 여기서 문제가 발생한다.
"기계와 AI를 썼는데 이게 손번역이 맞나?" 라는 부분이다.
일단, 손번역이 무엇인지를 좀 따지고 가야한다.
해외에선 손번역이라는 단어가 없다.
아마 손번역이란,
아랄트랜스같은걸로 후킹해서 번역해먹거나
팥고물같은 기번으로 돌려먹던 시절,
투박한 기계번역을 대체하기 위한 더 좋은 번역 수단이
인간의 손을 거치는 번역밖에 없었기 때문에 나온 단어라고 생각된다.
처음부터 끝까지 기계나 AI의 도움 없이 번역을 하는 것을 논하자면,
인간번역
(
HT, Human Translation)
이 그것에 가깝다.
F95나 해외 야겜 커뮤에서 이런 단어선택은 찾기 힘들다.
한국에서는 언제부턴가 손번역이라는 말이 그냥 돌아다니기 시작했고
인간번역 이라는 말 대신 손번역이라는 단어가 보편화 되었다.
손번역에 대한 해석을 굳이 하자면 두가지로 분류 할 수 있다고 판단한다.
1. 방법론에 따라 말 그대로 인간이 초안을 작성하고 인간이 검수해서 결과를 도출해낸 번역이 손번역이다.
손번역이라는 단어 그대로 그 과정적인 부분을 중시하여 정말 손으로 하는 번역이다.
여기서 도구의 사용은
기계나 AI와 같이 번역과 관련된 그 어떠한 도구도 사용하지 않은 상태를 말할 것이다.
즉, 본인이 가지고 있는 언어적 지식만으로 번역을 이끌어 나간다는 것이므로
역자 본인의 역량이 가장 중요하며,
역자가 언어적, 문학적으로 뛰어나다면 초월번역도 가능하여
놀라울 정도의 품질이 제공될 수 있다.
그러나 그런 장점은 어디까지나 전문 번역가가 완벽한 번역을 행했다는 전제에서다.
역자의 역량에 모든 것을 기댄다는 것은,
반대로 말하자면 역자의 역량이나 언어적, 문학적 지식 수준이 쓰레기 수준이라면 모두 단점이 된다.
방법론에 있어선 분명 인간이 번역한 손번역이지만
퀄리티가 제대로 받쳐주지 못하게 된다는 것이다.
효율도 극심하게 떨어진다.
모든 원문의 번역과 타이핑을 홀로 해야 하기 때문에
번역 방식중에 가장 느리다.
본인이 오래 전에 150쪽짜리 영문 SF 소설책을 직접 타이핑해서 번역한 적이 있다.
PDF도 아니고 실제 종이책이었던 지라 원문을 타이핑하는것도 고역이었지만
번역이 그냥 지옥 그 자체였다.
본인 지식에 존재하지 않는 단어가 나오면 사전을 뒤져가며 한국어 문장에 짜맞춰 끼워넣었어야 했는데,
당시 그 지랄을 떨고나서 본인이 느꼈던 것이,
이런 번역 방식을 고수하는 인물이라면
번역해야 할 언어에 대한 지식도 높아야 하고
번역해서 작성할 언어에 대한 지식도 높아야 한다는 것이었다.
게다가 평소에 쓰지도 않는 전문용어 나오기 시작하면 존나 골아파진다
따라서, 국제표준화기구에서는
인간 번역, Human Translation에 대한 적합성 평가 기준이 존재한다.
ISO 17100:2015 Translation services - Requirements for translation services 라는 녀석이다.
번역 방법과 과정에서 오직 인간의 손만을 거치면 ISO 17100:2015 인증 마크를 받을 수 있다.
그 과정은 다음과 같다.
번역(Translation): 적절한 자격을 갖춘 역자가 초안 작업.
검토(Check): 역자 본인이 오타, 누락 등을 스스로 1차 확인.
수정(Revision): 원문과 번역문을 대조하여 제3자가 오류를 잡아냄.
재확인(Review): 원문 없이 번역문만 읽으며 문장의 유창함을 확인.
교정(Proofreading): 작품을 제출하기 전에 레이아웃 및 서식 등을 최종 점검.
최종 확인(Final Verification): 모든 공정이 끝났음을 확인
물론 그냥 아무나 갖다 번역해서 될 건 아니고,
번역 전공 학사 이상 학위 보유
타 전공 학사 + 2년 이상의 전업 번역 경력
5년 이상의 전문 번역 경력
이 중에 하나라도 해당되어야 적용 받을 수 있다.
당연한 소리지만 이건 솔직히 상업적 문학작품에 인증마크 달려고 있는 제도이고
그냥 인간번역 방법론을 굳이 굳이 따지자면 그렇다는거지
순전히 봉사활동에 가까운 일반인들의 야겜번역따위에 이런 장황한 국제 표준이 어쩌니 하는 것을 적용시켜봐야
손번역하겠다는 역자만 줄어들고 아무 쓰잘데기 없는 짓이라고 생각한다.
2. 품질 중시에 따라서 결과물의 번역 퀄리티가 매우 높으면 손번역이다.
본인은 줄곧 번역의 퀄리티가 중요하다고 주장해왔다.
유저들은 과정이 아닌 결과물로 평가한다.
누가 맷돌로 콩갈고 직접 친환경두부를 만들어서 천연 조미료만 넣어서 조리를 했다 한들
결과물이 개밥이면 유저들은 그것을 인정해 주지 않는다.
AI 번역을 해서 모든 텍스트를 직접 검수 했던
기계 번역을 해서 모든 텍스트를 직접 검수 했던
처음부터 끝까지 직접 손으로 번역을 했던
결과물이 쓰레기면 그것은 쓰레기고
결과물이 보석이면 그것은 보석이라는 것이 내 주관이다.
AI번역툴이나 기계번역툴과 같은것은
말하자면 번역을 좀 더 편리하게 할 수 있는 도구라고 생각한다.
네비 안키고도 운전할 수 있지만 네비가 있으면 더 좋은거고
도마에 식칼이 없어도 요리가 가능하지만 있으면 더 좋은거다.
장인은 도구를 가리지 않는다는 말이 있지만
장인도 도구가 좋으면 존나 더 잘 만든다.
이 얘길 하면 항상 이런 얘기가 나온다.
"엥 그러면 AI번역으로 손번역급 퀄리티 나오면 그건 손번역임?"
ㅆㅂ 그런거 있으면 혼자 쓰지말고 나부터 좀 줬으면 좋겠다.
이 세상에 나만 모르는 완벽 손번역급 AI가 있나?
나도 클로드, 챗gpt 전부 최신모델로 쓴다. 무료 속터져서 다 결제하고 유료로 쓴다.
예전 모델들보다야 많이 나아졌지만 그럼에도 여전히 찐빠 개많이난다.
그러니 AI번역이 최근들어 꽤나 좋아졌다 한들,
인간이 전부 직접 검수한 번역물에 비할 수 없고
최종적으로 사람 손을 안거치면 결국 AI번역의 문제점이 남아있기 마련이다.
여기서 부턴 내 개인적 주관이고 본인이 생각하는 바다.
따라서 본인에게 있어 손번역은
1. 기계번역이나 AI번역 이후에 검수하면서 번역을 했던,
처음부터 손번역이던, 모든 내용이 인간의 손을 거쳤고, 번역의 품질이 매우 월등할것
아까부터 품질 우선시 한다는 내용을 말했으니 당연한거다.
검수 없는 번역에 대해선 크게 신용이 안가니 인간의 손은 반드시 거쳐야 한다고 생각한다.
2.게임에 등장하고 화면에 나오는 모든 텍스트는 99~100% 검수할 것.
여기서 왜 99%라는 말을 썼냐면, 역자 입장에선 전부 확인했다고 생각했는데
사람이 하는 일이다 보니 체크 못한 부분이 있을 수도 있으니 써놓은거지,
사실상 역자입장에선 100%를 전부 다 검수하고 손으로 번역하는게 맞다.
니까짓게 뭔데 뭐가 맞다고 논하냐? 그러면,
본인 자랑하고자 하는게 아니고
나는
미검수 기계번역
미검수 자동번역이식
기계번역후 검수
기계번역후 손번역
미검수 AI번역
AI번역후 검수
AI번역후 손번역
처음부터 끝까지 손번역
일본어 음성 대사만 듣고 청취로 손번역
이미지 역식질
동영상 역식질
노모이식
유모 모자이크 지우고 직접 노가다로 노모만들기
다 해봤다.
번역은 원문을 번역하여 재구성하는 것이다.
처음부터 끝까지 손으로 번역?
품 많이 간다.
하지만 어디 프로로 돈받고 하는 전문 번역자가 아니라면
그냥 그게 끝이다.
본인이 여러 방식으로 번역하면서 느낀점?
퀄리티가 전부다.
그리고 노력은 결과를 대신하지 않는다.
역자의 노력을 폄하하려는 것이 아니라, 그냥 진짜 퀄리티가 제일 중요하다고 생각한다는거다.
AI번역 이후에 전부 검수하여 손번역을 해도
몇차례 재차 검수하지 않는 이상 오타도 있고 오역도 나오고 매우 좆같다.
기계번역 이후에 손번역은 그것보다 더했다.
말투가 기번어투이니 존나 많이 고쳐야 했다.
그런데 처음부터 끝까지 인간이 하는 번역?
개씹노가다로 품은 많이 가는주제에
분량이 많을수록 오타, 오역도 존나 많아져서
그냥 개씨발이다.
생각해보자.
님들이 대학 과제같은거 낼때, 문법오류, 오타 이런거 하나 없이 내기 위해 얼마나 노력하는가?
AI없던 시절에도 외국새기들 대학 에세이에 문법 좆창나는거 막을려고
Grammarly같은거 써서 문법 체크했었다.
그냥 한국어로 생각해서 한국어로 쓰는것도 그 모양인데,
일본어나 영어를 한국어로 번역하는 과정은 더 좆같기 마련이다.
결과물에 대한 검증이 중요하다고 판단하는 것은
나만 그런게 아니다.
국제표준화기구에서 발행한 ISO 5060이라고 2024년에 신설된거 있다.
Translation services - Evaluation of translation output이라고 해서
인간 번역뿐만 아니라 기계번역, 그리고 Post-editing과 같은 검수 결과물에 대하여
과정이 아니라 번역 결과와 품질에 대한 평가를 내려서 점수를 매기는 거다.
번역계가 AI번역과 같은 기술들로 인해 급격하게 변화하다보니
번역 과정만 가지고 평가하는 것이 아닌,
번역의 결과물에 대한 평가 또한 필요하다고 생각되어 지고 있다는 것이다.
AI의 등장 이후에 온갖 것들이 급격하게 바뀌고 있고,
이는 번역 또한 마찬가지로,
초창기 AI번역 모델과 비교해서
현재의 AI번역 모델은 훨씬 더 월등한 번역물을 뽑아내고 있다.
그리고 시간이 지날수록 더 정교한 모델이 등장하여 더 자연스러운 번역물을 뽑아낼 지도 모른다.
실제로 단기적으로 시간에 제한을 두고 인간과 AI가 대결을 펼친다면,
위의 이미지처럼, 당연히 AI가 인간보다 압도적으로 빠른 속도로 번역을 해낼 것이다.
그럼에도 아직까진, 번역에 검수를 거치는 것이
단순히 AI번역을 한 것보다 낫다고 본인은 생각한다.
요새 대학에 제출하는 과제의 대부분이 챗GPT같은 AI를 거친다고 한다.
근데 이런 부분으로 챗GPT나 제미나이 써본 사람들은 다 알겠지만,
레퍼런스나 출처부분에서 헛소리를 할때가 많고, 지 뇌내망상을 지껄이는 경우도 잦다.
따라서, AI자료 깡으로 냈다가 반려되는 사례가 많고, 대부분의 대학생들이 검수를 거친다.
번역도 마찬가지이다.
기술이 급격하게 발전하고 있으나,
그럼에도 전통을 중시하여 직접 모든 것을 손으로 번역하는 사람도 있을 것이고
손에 익은 방식을 생각해 기계번역 이후에 검수만 하는 사람도 있을 것이고
AI번역을 돌리는 사람도 다수 존재할 것이다.
이곳은 항상 수요보다 공급이 부족한,
특히나 역자가 턱없이 부족한 커뮤니티이기에,
어떠한 방식으로든, 어떠한 번역을 했든,
그들의 노력으로 공유되는 자료들은 매우 귀중한 것이라고 생각한다.
그러나, 그것과 별개로
게임을 받는 유저들 입장에선 아무래도 번역 퀄리티를 따질 수 밖에 없고,
게임을 직접 해보기 전에 번역 퀄리티나 번역 상태를 알 수 있는 방법은
제목이나 본문에 적힌, 기계번역, AI번역, 손번역 과 같은 번역 용어 일 것이다.
따라서, 이러한 번역 용어를 강제하진 않더라도,
적어도 유저 개개인이 간략하게나마 게임의 번역 상태를 확인하기 위해,
그리고 번역 용어로 인한 분란을 막기 위해,
번역 용어의 가이드라인이 있으면 좋겠다고 생각한다.
아무튼, 위에서 설명한 번역 용어의 정리를 하자면 다음과 같다.
기계번역, 기번 (MT, MTL, Machine Translation)
이지트랜스와 같은 규칙 및 통계적 기계번역,
구글번역, 파파고번역과 같은 딥러닝 기반 신경망 기계번역 (플러그인을 이용한 구글 자동번역과 같은 것도 포함)
을 통해 게임의 내용을 번역.
AI번역 (AI Translation, LLM-based Translation)
ChatGPT, Claude, Gemini와 같은 대형언어모델을 이용하여
게임의 내용을 번역.
AI번역이라고 써있지 않아도 본문에 ChatGPT번역, Gemini번역 등
사용한 언어 모델의 정보가 써있어도 유저 입장에선 충분히 이해 가능.
자체번역, 자체한글, 공식번역 등
게임 제작자가 자체적으로 게임의 번역이 돌아가게 해두었거나,
기계번역, AI번역과 같은 번역문을 이미 집어넣은 상태의 번역.
제작자의 검수 여부는 알 수 없음.
번역 검수 (MTPE, Machine Translation Post-Editing)
기계번역 혹은 AI번역 이후에 사람의 손을 거쳐 검수를 하는 행위.
이곳의 규칙에 따라, 번역탭에 올라오는 자료 중,
자체번역, 자체한글 자료와 미검수 자료를 제외하고,
본인이 AI번역 혹은 기계번역이라고 올리거나,
검수라는 내용을 써놓으면,
이는 게임 오류 검수나 플러그인 번역과 같은,
최소한의 검수(LPE, Light Post-Editing)를 거친 자료라고 판단.
이와 반대로, 검수를 거치지 않은 AI번역과 기계번역은
미검수
.
손번역
1. 전통적인 의미에서의 손번역 (HT, Human Translation)
처음부터 끝까지 모든 번역 과정을 기계와 AI의 도움 없이, 순수히 인간의 능력만으로 검수하여 번역.
2. 품질적인 의미에서의 손번역
위에서 언급한 순수히 인간의 능력만으로 검수한 번역을 포함해
기계와 AI의 도움을 받은 이후 모든 내용을 원문과 대조하며 99~100% 검수한 번역 (FPE, Full Post-Editing)과 같이,
모든 내용이 인간의 검수를 거쳤고 번역의 품질 면에서 우수한 결과물을 도출한 번역.
유저에게 혼동을 주는 제목 태그
이건 내가 받는 입장에서 매우 혼란스러운 경우가 많아서 기재를함.
이런 제목보면 번역 정보가 불분명해서 좋지 않다고 생각.
AI번역(부분손번역), 20%손번역, 일부발번역, 초반검수번역 등 부분적인 번역이 존재하는 경우
최소한의 검수(LPE, Light Post-Editing)를 거친 자료라면 번역 검수에 해당.
검수를 제대로 거치지 않았다면 미검수에 해당.
AI번역+기계번역, 기계번역+손번역 등 번역이 혼재한 경우
AI번역+기계번역과 같은 경우,
이것들이 대체 어째서 공존하는건지 이해가 잘 안되지만,
어떤 번역이 비중이 높은지가 중요하다고 생각됨.
AI번역의 비중이 높다면 AI번역, 기계번역의 비중이 높다면 기계번역.
다만, 같이 사용했다면, 본문에 기재하는게 낫다고 생각됨.
기계번역+손번역과 같은 경우,
기계번역 이후에 모든 내용을 검수하여 번역했다면 손번역.
기계번역 이후에 일부 손번역만 했다면 기계번역 검수라고 생각.
어디까지나 본인 주관이고, 개인적인 생각이니 좆같으면 님 말이 맞음.
끝.
