번역 사전(Translation Dictionary)

100% 활용을 위한 구축 및 관리 방법

22
 / 
07
 / 
2020

모든 데이터는 제대로 수집, 분류, 체계화 하여 정리했을 때 비로서 그 진정한 가치를 보여줍니다. 혹시 번역 관련 경험이 있는 분들 이라면 용어, 표현, 문장을 비롯한 언어 데이터는 그런 수집 및 정리 과정이 특히 중요하다는 것을 잘 아실 겁니다.


오늘날 번역에 필수적인 기계 번역(Machine Translation)은 광범위한 웹 크롤링(Web Crawling)을 통해 수집된 데이터를 활용합니다. 덕분에 누구나 편리하게 번역 서비스를 이용할 수 있다는 장점이 있는 반면, 특정한 전문 분야나 업계와는 거의 관련이 없는 데이터를 사용하기 때문에 번역의 품질에 있어 그 한계도 분명합니다. 


그렇다고 너무 실망할 필요는 없습니다. 그런 한계를 극복할 수 있게 도와주는 매우 효과적인 툴(Tool)도 있는데, 바로 지콘스튜디오 블로그에 단골로 등장하는 번역 사전(Translation Dictionary, TD)이 그런 역할을 합니다. 다만 번역 사전 역시 잘 정제해서 정리한 데이터를 적재적소에 사용하지 않으면 그 기능을 100% 발휘하기 힘든 것은 마찬가지 입니다. 그래서 꼭 필요한 과정이 사전에 번역 사전을 잘 정리해 놓는 라벨링(Labeling) 작업입니다. 


번역 사전의 라벨링이라고 하면 좀 생소한 분들이 많을 것 같습니다. 하지만 용어가 좀 생소해서 그렇지, 다른 데이터나 문서의 정리 작업에 비해 특별히 더 어렵거나 복잡한 것은 아닙니다. 간단히 요약하자면 번역할 문서들에서 수집한 용어, 표현 등 데이터들의 위계(Hierarchy) 및 레벨(Level)에 따른 분류 작업 입니다. 즉 이후 실제 번역 작업을 진행할 때 필요에 따라 올바른 데이터를 선택해서 사용하기 위한 사전 세팅이라 생각하면 될 것 같습니다.



그럼 이제부터는 좀 더 구체적인 분류의 기준에 대해 말씀드리겠습니다. 현지화에 사용하기 위한 번역 사전을 제작하려고 해당 기업의 문서들을 구분해보면 크게 4가지로 분류할 수 있습니다. 그리고 그 분류의 기준은 해당 문서가 '변화에 얼마나 민감한가' 인데, 번역 사전 역시 같은 기준으로 분류해서 정리해 놓고 이후 해당하는 번역 작업에 활용하게 됩니다.


아래는 실제 기업에서 사용하는 문서들을 분류해 본 리스트 입니다.


1. 회사명, 서비스/제품명, 부서/직책명, 기업 철학(Philosophy), 슬로건(Slogan), 캐치프레이즈(Catchphrase), 표어(Motto) 등

사실 문서보다 용어에 가깝습니다. 하지만 가장 자주 사용하는 동시에 절대 틀려서는 안되는 것들 입니다. 그래서 번역 사전 중에서도 가장 많이 사용하고, 특별한 경우가 아니라면 일단 제작한 후에는 변경하는 일이 거의 없습니다.


2. 계약서, 이용약관, 개인정보처리방침, 특허 청구서 등

일단 한번 문서화하면 거의 변화가 없고, 가끔 업데이트를 위한 수정이 있습니다. 그래서 일단 번역 사전으로 제작해 놓으면 반복적으로 쓸 수 있어 번역 작업의 생산성을 높여주고, 해당 용어의 문서 내 중복률도 높아 일관성 등 번역의 품질까지 함께 향상됩니다.


3. 회사 및 서비스 소개서, 웹사이트 스트링(문자열, String), 프로그램 스트링 등

비교적 업데이트 및 수정이 자주 있는 편입니다. 변화한 환경에 맞게 수정하거나, 주기적으로 업데이트 하는 등 비교적 자주 변경됩니다. 실제로도 기업 또는 제품, 서비스의 목표나 전략 등 방향성이 변화하면 함께 달라 지는 경우가 많습니다. 또한 창작 번역과는 거리가 먼 1, 2번에 비해 번역 작업에 창작적인 요소가 많이 들어가게 됩니다.


4. 마케팅 문구, 광고 문구, 이메일/뉴스레터, 보도자료, 포스터, SNS 컨텐츠(블로그, 영상 자막) 등

문서의 내용이나 메시지를 그때그때 순발력 있게 바꿔줘야 합니다. 번역문의 톤 앤 매너(Tone & Manner) 등 표현적인 요소의 비중이 높은 편이고, 프로젝트의 성격에 따라 일회성으로 사용 되는 경우도 자주 있습니다.


지금까지 말씀드린 번역 사전의 분류를 도식화하면 아래와 같이 표시할 수 있습니다.



최상단에 분류된 코어(Core) 번역 사전의 역할은, 예를 들면 'APPLE'이란 기업을 어떤 문서에서도 '사과'라고 번역하지 않기 위한 것이라고 이해하시면 쉬울 것 같습니다. 제품 또는 서비스 명, 일관되게 사용해야 하는 용어, 정의 등 해당 기업에서 사용하는 어떤 문서의 번역에도 유용하게 사용할 수 있을 뿐만 아니라, 실수없이 일관성 있는 번역으로 번역의 품질까지 보장할 수 있습니다. 코어 번역사전 뿐만 아니라 제대로 분류하여 구축한 모든 번역 사전은 해당 상황과 문서의 특성에 맞게 적절히 사용할 경우 더 큰 능력을 발휘하게 됩니다.


마지막으로 이렇게 잘 분류하여 구축한 번역 사전은 어떻게 활용할까요?


특히 반복되는 번역의 경우 번역 사전을 사용하면 항상 용어를 일관되게 적용할 수 있어 번역 품질이 크게 향상됩니다. 또는 대부분 고정된 문장, 표현들이 있고 일부분에서 업데이트가 종종 있는 문서의 번역을 진행할 때도 새롭게 개정된 부분만 수정하면 되기 때문에 번역 작업에 소요되는 시간을 줄일 수 있습니다. 또한 번역가의 작업이 완료된 후 검수를 진행할 때도 번역 사전은 매우 유용합니다. 번역 사전을 사용해서 검수 하면 시간과 비용은 절약하면서 번역의 품질까지 올릴 수 있기 때문입니다.

지콘스튜디오

Difference Makes Possibilities.

다양한 번역기를 동시에 확인하는 비교 번역은 물론 중역, 역번역을 통해 사용자에게 맞는 더 정확하고, 자연스러운 번역 경험을 제공합니다.

번역 사전(Translation Dictionary)

100% 활용을 위한 구축 및 관리 방법

22
 / 
07
 / 
2020

모든 데이터는 제대로 수집, 분류, 체계화 하여 정리했을 때 비로서 그 진정한 가치를 보여줍니다. 혹시 번역 관련 경험이 있는 분들 이라면 용어, 표현, 문장을 비롯한 언어 데이터는 그런 수집 및 정리 과정이 특히 중요하다는 것을 잘 아실 겁니다.


오늘날 번역에 필수적인 기계 번역(Machine Translation)은 광범위한 웹 크롤링(Web Crawling)을 통해 수집된 데이터를 활용합니다. 덕분에 누구나 편리하게 번역 서비스를 이용할 수 있다는 장점이 있는 반면, 특정한 전문 분야나 업계와는 거의 관련이 없는 데이터를 사용하기 때문에 번역의 품질에 있어 그 한계도 분명합니다. 


그렇다고 너무 실망할 필요는 없습니다. 그런 한계를 극복할 수 있게 도와주는 매우 효과적인 툴(Tool)도 있는데, 바로 지콘스튜디오 블로그에 단골로 등장하는 번역 사전(Translation Dictionary, TD)이 그런 역할을 합니다. 다만 번역 사전 역시 잘 정제해서 정리한 데이터를 적재적소에 사용하지 않으면 그 기능을 100% 발휘하기 힘든 것은 마찬가지 입니다. 그래서 꼭 필요한 과정이 사전에 번역 사전을 잘 정리해 놓는 라벨링(Labeling) 작업입니다. 


번역 사전의 라벨링이라고 하면 좀 생소한 분들이 많을 것 같습니다. 하지만 용어가 좀 생소해서 그렇지, 다른 데이터나 문서의 정리 작업에 비해 특별히 더 어렵거나 복잡한 것은 아닙니다. 간단히 요약하자면 번역할 문서들에서 수집한 용어, 표현 등 데이터들의 위계(Hierarchy) 및 레벨(Level)에 따른 분류 작업 입니다. 즉 이후 실제 번역 작업을 진행할 때 필요에 따라 올바른 데이터를 선택해서 사용하기 위한 사전 세팅이라 생각하면 될 것 같습니다.



그럼 이제부터는 좀 더 구체적인 분류의 기준에 대해 말씀드리겠습니다. 현지화에 사용하기 위한 번역 사전을 제작하려고 해당 기업의 문서들을 구분해보면 크게 4가지로 분류할 수 있습니다. 그리고 그 분류의 기준은 해당 문서가 '변화에 얼마나 민감한가' 인데, 번역 사전 역시 같은 기준으로 분류해서 정리해 놓고 이후 해당하는 번역 작업에 활용하게 됩니다.


아래는 실제 기업에서 사용하는 문서들을 분류해 본 리스트 입니다.


1. 회사명, 서비스/제품명, 부서/직책명, 기업 철학(Philosophy), 슬로건(Slogan), 캐치프레이즈(Catchphrase), 표어(Motto) 등

사실 문서보다 용어에 가깝습니다. 하지만 가장 자주 사용하는 동시에 절대 틀려서는 안되는 것들 입니다. 그래서 번역 사전 중에서도 가장 많이 사용하고, 특별한 경우가 아니라면 일단 제작한 후에는 변경하는 일이 거의 없습니다.


2. 계약서, 이용약관, 개인정보처리방침, 특허 청구서 등

일단 한번 문서화하면 거의 변화가 없고, 가끔 업데이트를 위한 수정이 있습니다. 그래서 일단 번역 사전으로 제작해 놓으면 반복적으로 쓸 수 있어 번역 작업의 생산성을 높여주고, 해당 용어의 문서 내 중복률도 높아 일관성 등 번역의 품질까지 함께 향상됩니다.


3. 회사 및 서비스 소개서, 웹사이트 스트링(문자열, String), 프로그램 스트링 등

비교적 업데이트 및 수정이 자주 있는 편입니다. 변화한 환경에 맞게 수정하거나, 주기적으로 업데이트 하는 등 비교적 자주 변경됩니다. 실제로도 기업 또는 제품, 서비스의 목표나 전략 등 방향성이 변화하면 함께 달라 지는 경우가 많습니다. 또한 창작 번역과는 거리가 먼 1, 2번에 비해 번역 작업에 창작적인 요소가 많이 들어가게 됩니다.


4. 마케팅 문구, 광고 문구, 이메일/뉴스레터, 보도자료, 포스터, SNS 컨텐츠(블로그, 영상 자막) 등

문서의 내용이나 메시지를 그때그때 순발력 있게 바꿔줘야 합니다. 번역문의 톤 앤 매너(Tone & Manner) 등 표현적인 요소의 비중이 높은 편이고, 프로젝트의 성격에 따라 일회성으로 사용 되는 경우도 자주 있습니다.


지금까지 말씀드린 번역 사전의 분류를 도식화하면 아래와 같이 표시할 수 있습니다.



최상단에 분류된 코어(Core) 번역 사전의 역할은, 예를 들면 'APPLE'이란 기업을 어떤 문서에서도 '사과'라고 번역하지 않기 위한 것이라고 이해하시면 쉬울 것 같습니다. 제품 또는 서비스 명, 일관되게 사용해야 하는 용어, 정의 등 해당 기업에서 사용하는 어떤 문서의 번역에도 유용하게 사용할 수 있을 뿐만 아니라, 실수없이 일관성 있는 번역으로 번역의 품질까지 보장할 수 있습니다. 코어 번역사전 뿐만 아니라 제대로 분류하여 구축한 모든 번역 사전은 해당 상황과 문서의 특성에 맞게 적절히 사용할 경우 더 큰 능력을 발휘하게 됩니다.


마지막으로 이렇게 잘 분류하여 구축한 번역 사전은 어떻게 활용할까요?


특히 반복되는 번역의 경우 번역 사전을 사용하면 항상 용어를 일관되게 적용할 수 있어 번역 품질이 크게 향상됩니다. 또는 대부분 고정된 문장, 표현들이 있고 일부분에서 업데이트가 종종 있는 문서의 번역을 진행할 때도 새롭게 개정된 부분만 수정하면 되기 때문에 번역 작업에 소요되는 시간을 줄일 수 있습니다. 또한 번역가의 작업이 완료된 후 검수를 진행할 때도 번역 사전은 매우 유용합니다. 번역 사전을 사용해서 검수 하면 시간과 비용은 절약하면서 번역의 품질까지 올릴 수 있기 때문입니다.

지콘스튜디오

Difference Makes Possibilities.

다양한 번역기를 동시에 확인하는 비교 번역은 물론 중역, 역번역을 통해 사용자에게 맞는 더 정확하고, 자연스러운 번역 경험을 제공합니다.