Neural Machine Translation (NMT) - 기계번역에 대한 고찰
누구나 과제를 하면서 구글 번역기 (Google Translate)를 사용해 본 경험이 있을 것이다. 요즘에는 네이버나 카카오 같이 충분한 기술력과 자본을 갖춘 대기업들이 딥러닝을 이용한 번역기의 성능을 개선하기 위해 동분서주 노력하고 있다.
NMT 는 한국어로 '기계번역', Neural Machine Translation 의 약어이다. 이는 딥러닝을 사용한 소프트웨어로, 벡터화(vectorize) 한 입력 문장과 타겟 문장을 encoder-decoder 구조를 통하여 학습한다. NMT 의 가장 큰 장점은 기존은 SMT (통계 기반 번역기) 의 성능을 뛰어넘고, 그만큼 복잡한 설계를 필요로하지 않는다는 점이다. 또한, NMT 는 딥러닝을 사용한 만큼 더 고도화 할 수 있는 가능성이 충분히 존재하고, 언어학자나 통계학자와 같은 고급 인력을 제외하고도 상당한 성능의 번역기를 만들 수 있기에 커다란 잠재력을 지니고 있다.
NMT 분야에서는 현재 Yoshua Bengio 와 같은 딥러닝의 선구자들이 연구를 진행하고 있으며, 더 적은 양의 데이터를 이용한 번역과 같은 연구를 꾸준히 진행하고 있다. 예를 들어 한동대학교의 최희열 교수님이 Yoshua Bengio, KyungHyun Cho 교수님과 함께 작성한 'Fine-Grained Attention Mechanism for Neural Machine Translation' 논문은 context vector 의 각 차원에 대해 각각 다른 attention score를 부여함으로써 기계번역의 성능을 높이는 것을 목표로 한다.
기계번역의 활용 사례는 구글 번역기, 네이버 파파고, 카카오 i 번역 등이 있지만, 현재로써 영어-한국어의 번역에 있어서는 전부 비슷한 성능을 보인다. 한국어의 경우 모음과 자음의 조합을 가진 언어이기 때문에 딥러닝으로 학습하기에 어려움이 있다고 한다. 이 문제를 해결하기 전까지는 상당 수준의 한영, 영한 번역기가 나오기 전까지는 상당한 시간이 걸릴 것으로 예상된다.
초창기의 기계번역은 'RBMT (Rule-Based Machine Translation) 기술을 이용한 것이 대부분이었다. 이는 언어학자들을 중심으로 개발된 번역 소프트웨어였고 문법 자체를 알고리즘화 시킨 것이기 때문에 높은 정확성을 보였지만, 비싼 개발 비용과 시간이 가장 큰 문제가 됐다. 또한, 인터넷 상의 언어나 표준적이지 않은 언어 구조에 취약한 점도 문제점이었다.
1988년, RBMT 을 대체할 만한 수단으로 SMT (Statistical Machine Translation) 기술이 나왔다. 이는 빅데이터를 이용해 방대한 양의 언어 데이터를 통계적 규칙을 통해 문장으로 생성해 내는 기술으로써, 언어학자를 필요로 하지도 않고 기계번역에 있어서 상당히 많은 진전을 이룰 수 있게 해주었다. 하지만 이 또한 사람 번역가의 성능에 현저히 떨어졌고 실생활에서 사용하기에는 무리가 있었다.
2010년도 부터 딥러닝 붐이 일기 시작하면서 개발 된 NMT 는 이전의 번역기들 보다 월등히 높은 성능을 자랑했다. 딥러닝을 사용한 학습을 통해 방대한 양의 벡터화 시킨 문장들을 encoder-decoder 구조로 번역을 하는데, 이는 언어학자나 문법의 규칙을 필요로 하지 않는다. 문법의 규칙은 NMT 네트워크 구조가 자체적으로 학습하고 사람은 그저 필요한 데이터를 준비하면 된다.
기계번역의 미래는 밝다. 구글, 아마존, 바이두, 화웨이, 네이버, 삼성과 같은 대기업들이 앞다투어 딥러닝 기술에 아낌 없는 투자를 하고 있고, 미국, 중국과 같은 강대국들은 AI 인재를 더 육성하기 위한 국가 차원에서의 투자를 하고 있는 중이다. 아이폰이나 갤럭시와 같은 스마트폰에는 더욱 더 발전된 인공지능 어시스턴트가 탑재 되어 번역기의 기능을 구현하고 있고, 심지어 최근 출시된 핸드폰에서는 카메라에 글자를 보여주는 것만으로도 번역을 하여 결과를 보여준다.
VR 기기를 사용한 AR 기술이 발전하고 있는 것으로 미루어 보아, NMT 기술의 발전은 아마도 AR 과 융합되어 나아가지 않을까 생각한다. 언어는 듣고 보고 난 후에 번역하는 것이 아닌 듣는 것, 보는 것과 동시에 이루어져야 한다고 생각한다. 그래야 외국인과 소통하는 것 뿐만 아니라 외국어를 읽을 때도 실용적이기 때문이다. 이는 AR 기술로 현실 세계의 이미지에 번역된 언어를 오버레이 시킴으로써 충분히 해결 될 수 있는 문제라고 생각한다. 만일 5년 내에 이 기술이 출시 된다면 향후 십수년 간의 기술 개발을 거쳐 실생활에서 무리 없이 사용 가능한 통번역 기기가 출시 될 것이라고 생각한다.
NMT 의 발전 가능성과 딥러닝 기술의 무한한 잠재력에도 불구하고 이와 관련한 스타트업은 거의 찾아볼 수 없다. 이는 NMT 기술이 필요로 하는 가장 중요한 두 가지를 구글이나 아마존과 같은 대기업들이 가지고 있기 때문이 아닌가 싶다.
1) 방대한 양의 언어 데이터
2) 언어 데이터를 전처리하고 딥러닝 아키텍쳐를 구현할만한 능력을 갖춘 인공지능 인재
이 기술을 오픈소스가 대부분이기 때문에 특허와 관련된 이야기들은 생각보다 그렇게 많지 않다. 하지만 2016년에 구글이 NMT에 대한 특허를 내놓았는데 이는 인공지능을 연구하는 사람들 사이에서 커다란 반향을 불러 일으켰고 구글이 NMT 기술을 독점하려는 것이 아니냐라는 이야기 까지 나왔었다. 아래는 관련 특허 링크이다:
<Citations>
1) 디지털 시대의 통번역 전문가, NMT (신경망 기반 자동 번역)(2018, May 08) http://it.donga.com/27075/
2) NAVER Products - 제품 소개 (2018, May 08)
3) 위키백과 - 기계 번역 (2018, May 12)
4) Wikipedia - Free Encyclopidia, Neural Machine Translation (2018, May 13)
5) US Patents & Trademark Office, NEURAL MACHINE TRANSLATION SYSTEMS WITH RARE WORD PROCESSING (2018, May 13)
Comments
Post a Comment