> 뉴스 > 국제
     
[Trend] 언어장벽 허무는 컴퓨터 동시통역 시대
전화 통·번역 서비스 본격화하는 MS
[61호] 2015년 05월 01일 (금) 크리스토프 드뢰서 economyinsight@hani.co.kr
   
▲ 영화 <스타워즈>에 나오는 인간 형태의 로봇 ‘C-3PO’. 뛰어난 인공지능으로 각기 다른 형태의 언어 600만가지를 이해할 수 있다. REUTERS

스카이프 통해 2014년 말부터 영어–스페인어 서비스 시작…
올해 영어–독일어 서비스 계획


컴퓨터 실시간 동시통역 서비스로 국가 간 언어장벽이 허물어지고 있다. 마이크로소프트(MS)는 2014년 12월부터 인터넷 전화회사 스카이프를 통해 영어와 스페인어의 실시간 통·번역 서비스를 시행하고 있다. 아직 수준은 낮다. 하지만 집중적인 투자가 이뤄지면 생각보다 빠른 속도로 개선될 것으로 보인다. 스카이프는 2015년 영어와 독일어 통·번역 서비스를 시작할 예정이다.


크리스토프 드뢰서 Christoph Dro¨ sser <차이트> 기자

“안녕, 멜라니, 잘 있었어요?”(영어) 스티브 클레이턴이 독일인 동료 직원인 멜라니 쇼에벨에게 인사를 건넸다. 멜라니는 스카이프를 통해 미국 워싱턴주에 본사를 둔 마이크로소프트(MS)의 전세계 파트너 콘퍼런스에 접속돼 있었다. 그러자 컴퓨터에서 덜그럭거리는 음성으로 “그러나 새 멜라니 다음에, 잘 있었어요?”(독일어)라고 통역한다. 멜라니가 좀체로 알아듣기 어려운데도 이에 아랑곳하지 않고 단어 하나하나를 과도하다 싶을 만치 또렷하게 발음하면서 대답한다. 멜라니가 “나는 잘 지내요. 그쪽은 어때요?”(독일어)라고 했더니 컴퓨터가 이번에는 “그런데, 어때요 나 친구들?”(영어)이라고 말을 옮겼다.

이 뒤편에 마이크로소프트의 광고부 직원, 프로그램 개발자, 학자들이 자리잡고 통화를 함께 들었다고 상상해보자. 모두 몹시 입맛이 썼을 것이다. 컴퓨터가 민족 간의 소통을 방해하는 맨 마지막 장벽까지 완전히 허무는 모습을 보는 것이 이 쇼를 개최한 원래 목적이었다. 인류가 전화와 인터넷을 통해 전세계로 연결됐으니 이제 컴퓨터가 나서서 수천가지 언어 사이의 국경을 없애버릴 차례였다. 그런데 이 프레젠테이션은 장애를 제거하기는커녕 언어라는 인간 고유의 영역에 컴퓨터가 세세하게 적응해 들어가기 어렵다는 것을 실증하는 현장이 돼버렸다.

스티브와 멜라니의 대화가 좀 투박하게 시작되긴 했지만 두 사람을 연결한 컴퓨터 통역 서비스가 나중에는 좀 매끄러워졌다는 건 인정해줘야 하겠다. 전화 통화나 미디어 콘퍼런스를 동시통역한다는 것은 원칙적으로 가능하다. 영어나 스페인어를 하는 사람이라면 요즘 직접 확인해볼 수도 있다. 마이크로소프트가 2011년 인수한 스카이프의 온라인 전화 서비스를 이용하는 사람은 2014년 12월부터 영어를 스페인어로, 스페인어를 영어로 통역하는 서비스를 받아볼 수 있다. 2015년 안에 독일어와 영어 통역 서비스도 실시될 예정이다.

우리가 오래전부터 익히 알고 있는 얘기부터 해보자. 더글러스 애덤스의 과학소설 <은하수를 여행하는 히치하이커를 위한 안내서>를 예로 들어보겠다. 이 소설의 등장인물들은 모든 외국어를 자신의 모국어로 통역해주는 일명 ‘바벨의 물고기’라는 것을 귓속에 꽂고 산다. 영화 <스타워즈>에 나오는 인간 형태의 로봇 ‘C-3PO’는 다른 형태의 언어를 600만가지나 이해할 수 있다.

인공지능의 결정판, 실시간 전화통역

이제 지난 몇십년 동안 꿈꿔오던 일이 바야흐로 현실로 나타나고 있다. 그것도 별도 요금 없이 일반 대중에게 모두 열려 있는 서비스로 이뤄지고 있다. 현재 전세계에서 3억명이 이를 이용한다. 기계를 통해 이뤄지는 동시통역이 어떻게 사람의 일상 속으로 들어오고 작용하게 되는가. 이런 주제는 오늘날 다른 어떤 학문보다 콧대가 높은 전산학의 주요 연구 분야에 속한다.

전산학은 1950년대부터 많은 약속을 해왔으나 지켜낸 건 별로 없었다. 디지털 통역이라는 사안에서도 예외가 아니다. 독일 연방정부가 1993~2000년 5800만유로(약 680억원)를 부어넣었던 휴대용 통역기 ‘버브 모빌’ 프로젝트는 더운 공기 외에는 이렇다 할 만한 게 없다. 원래 목표는 두 언어 사이에서 통역자 역할을 하는 자그마한 전자상자를 만드는 것이었다. 그런데 정작 생산된 작품은 원안보다 훨씬 뒤진, 겨우 한 음절짜리 명령이나 접수하는 자동차용 언어 인식 시스템이었다.

2000년 이래 10년 동안 인공지능이 갑자기 여러 분야에서 크게 발전한 적이 있다. 미국 캘리포니아에서 구글 자동차들이 운전자 없이 거리를 활보하는가 하면, IBM의 인공지능 컴퓨터 ‘왓슨’은 텔레비전 퀴즈 프로그램에서 우승했다.

스마트폰 역시 ‘바벨의 물고기’의 역할을 했다. 영어가 만국 공용어로 활약할 수 없는 나라에서는 더욱 그렇다. 이를테면 한국의 관광지 같은 곳이 그렇다. 그곳에서는 영어로 말하는 것을 어려워하는 여관의 여주인이 손님에게 자신의 삼성 휴대전화를 불쑥 내민다. 바다가 내다보이는 방 2개짜리 숙소를 원한다고, 손님이 직접 휴대전화에 영어로 얘기하라는 것이다. 손님의 말이 떨어지기 무섭게 그의 요구사항은 한국어로 통역돼 휴대전화의 확성기에서 튀어나온다.

구글 번역기나 페이스북이 인수한 모바일 음성 번역 소프트웨어 ‘지비고’ 같은 애플리케이션이 그런 일대일 통역을 가능하게 해준다. 이 앱의 품질은 받아들일 만하다. 물론 잘못 이해하는 것이 많아 본의 아니게 코미디도 연출하지만 내용은 어느 정도 전달되는 편이다.

   
▲ 2013년 노벨화학상 수상자인 아리에 와르셸 남캘리포니아대학 교수가 미국 로스앤젤레스에 있는 그의 집에서 스카이프를 통해 수상 소감을 말하고 있다. REUTERS

하지만 이런 프로그램을 사용할 때는 하나의 문장을 컴퓨터에 대고 말한 뒤 통역이 될 때까지 기다려야 한다. 또 기계가 듣고 있다는 걸 의식하기 때문에 사용자 자신이 더욱 분명하고 정확하게 말하게 된다. 마이크로소프트의 기계번역 프로그램 매니저인 크리스 벤트는 “실제 대화에서는 완전히 다르다”라고 설명을 붙인다. “말을 시작하다 틀리는 수도 있고, 더듬거릴 경우도 있지 않은가. 내가 정작, 에-, 내가 정작, 에-, 말하려고 했던 건,에- 하는 식으로 말이다. 크고 작은 말실수도 있고. 하지만 통역 프로그램은 이런 건 하나도 듣지 않는다.”

언어를 번역하기 위해 소프트웨어는 세 부분의 프로그램을 필요로 한다. 첫번째 프로그램은 음향 시그널에서 음운을 가려낸 다음 이를 자·모음과 단어로 분류한다. 두번째 프로그램은 이 문자상의 결과를 외국어로 번역한다. 마지막 세번째 프로그램이 번역 결과를 소리로 읽어내는 것이다.

그중 세번째 분야에는 오늘날 아무 문제가 없다. 우리는 콜센터의 컴퓨터 음성과 아이폰에 저장된 ‘시리’의 음성에 익숙하다. 이에 반해 언어 인식과 번역은 아직도 오류를 범할 확률이 매우 높다. “그런 마당에 믿음직하지 못한 이 두 기술을 결합한다면 오류율은 배가 될 수밖에 없다”고 벤트가 보충 설명을 한다. 다른 말로 하자면, 처음 말한 내용에서 의미 있는 문장이 인식되지 않을 경우 제대로 된 번역을 기대할 수 없다는 뜻일 것이다.

이 언어 인식 기술은 공교롭게도 1980년대에 이미 한번 인기몰이를 했던 기술을 사용해 발전할 수 있었다. 인간의 뇌 구조를 닮은 뉴런의 연결망을 컴퓨터 구조 안에 그대로 모방해낸다는 것이다. 이 연결망은 한편으로 (음향 시그널 같은) 1차 데이터를 수신한다. 수신된 데이터는 뉴런의 여러 층으로 계속 연결되다 마지막 층에 이르러 마침내 결과를 내놓는 것이다. 이 데이터를 어떤 프로그램이 처리한다는 뚜렷한 원칙은 없다. 대신 뉴런 연결망은 주어진 여러 가지 예를 자료로 삼아 배워가며 자기 내부의 신경망을 거기에 적응시킨다. 이런 훈련이 충분히 이뤄지면 이 신경망은 혼자 힘으로 단어를 인식할 수 있게 된다. 이 시스템이 이제껏 실패를 거듭한 이유는 해당 기술을 담을 수 있는 자료의 용량이 얼마 되지 않은 데 있었다. 마이크로소프트는 거대 기억장치와 연결망을 이용해 즉흥적으로 한 말에서 잘못 인식된 단어 수를 30개에서 20개로 낮추는 데 성공했다.

독일 카를스루에기술연구소(KIT)의 알렉스 바이벨도 이 점을 발전으로 인정한다. 올해 58살인 그는 지비고 앱 뒤에 숨어 있는 진짜 브레인이다.

컴퓨터 언어인식 기술의 약진

바이벨의 연구팀은 1991년 최초로 독일어 통역 프로그램을 선보였다. 다만 인식할 수 있는 어휘가 500단어에 한정돼 들을 수 있는 내용은 한가지 주제(호텔 객실 예약)뿐이었다. 그는 “일반적인 대화를 번역하려면 대략 4만개 정도의 단어를 알아야 한다”고 알려준다.

그는 이 연결망이 새로운 걸 배워가는 사람의 학습 과정과 매우 흡사하다는 데 매료됐다. 이 시스템에 자료만 입력한 뒤 원하는 결과를 제시할 뿐인데도 개별 뉴런 몇개는 즉시 최소 음운 단위같이 특정한 세부 사항을 자기 분야로 삼아 처리하기 때문이다.

언어 인식의 첫단계가 정상적으로 작동하면 그 과정에서 마침표와 쉼표, 대문자와 소문자의 구별이 없는 단어들이 줄지어 나오게 된다. 번역 프로그램에 입력하기에는 적당하지 않은 형태다. 우선 이 자료를 깨끗이 다듬는 작업이 요구된다. 마이크로소프트는 이 정화 작업에 특히 에너지를 많이 쏟았다. 마이크로소프트 연구자들은 방향을 소셜 네트워크에서 말하는 그대로 구두 언어에 맞췄다. 정화 프로그램은 정확하지 않은 문장의 서두와 반복되는 부분을 제거하고 대문자와 소문자를 다시 입력할 뿐 아니라 (이건 앞의 두가지보다 훨씬 더 중요한 기능인데) 문장부호를 보충한다. 그렇게 해서 전혀 구조를 갖추지 못한 채 흘러가던 단어 뭉치에서 문장이 탄생하게 된다. 그리고 문장은 바로 뒤이어 있을 번역의 토대가 된다.

   
▲ 스티브 발머 전 마이크로소프트 최고경영자(CEO)가 스카이프를 자회사로 편입한 뒤 활용 방안에 대해 설명하고 있다. 인공지능 컴퓨터의 발달로 전화통화나 화상회의에서 동시통역이 가능해졌다. REUTERS

이전의 통역 프로그램은 기초 자료, 즉 번역 대상인 원문장을 문법적으로 분석해 주어, 술어, 목적어를 찾으려 했다. 그러나 즉흥적으로 한 말을 대상으로 했을 때 이런 시도는 성공하지 못하는 경우가 많다. 어느 누구도 문법적으로 정확하게 말하지는 않기 때문이다.

1990년 IBM의 연구자 피터 브라운과 로버트 머서는 기존 방식과 완전히 다른 방식으로 연구를 시작했다. 이미 번역된 엄청난 양의 텍스트를 놓고 통계적으로 분석한 뒤 원단어를 번역문의 해당 단어 밑으로 각각 분류해놓았다. 그다음 단어들이 서로 함께 나타나는 빈도에 근거해 뜻을 밝혀갔다.

예컨대 독일어로 ‘Hahn’이 털 달린 동물을 말하는지 물이 나오는 수도꼭지를 말하는지 분간해내는 것이다(독일어에서는 수탉과 수도꼭지가 모두 Hahn이란 단어로 표시된다 -편집자). 우리가 구글이나 빙의 웹사이트에서 번역 서비스를 이용할 때 바로 이런 분석 방식이 작동한다.

언어 인식 분야에서는 이 신경망이 점점 개선돼가는 데 반해 번역은 제자리에 머물러 있다. 번역은 언어에 따라 효과가 다르다. 알렉스 바이벨은 “이 프로그램을 소개해야 할 경우라면 나 역시 영어와 스페인어 버전을 선택할 것이다”고 솔직하게 말했다. 마이크로소프트가 스카이프 통역기를 선보일 때 왜 하필 이 언어 패키지를 택했는지도 같은 이유에서 설명된다.

독일어는 이와 반대로 번역이 어렵기로 악명 높다. 동사가 앞뒤로 멀리 찢겨나가기 때문이다. 바이벨이 비아냥거리는 투로 문장 하나를 예로 든다. “Ich schlage Ihnen einen Termin fu¨ r na¨ c –hste Woche nachmittags um 14 Uhr, wenn wir alle zusammen sind und sowieso an der Videokonferenz teilnehmen, vor!”(만약 우리 모두가 함께 모여서 비디오 콘퍼런스에 참석할 거라면 다음주 오후 2시를 만날 시간으로 여러분에게 제안합니다.) (이 문장의 중심 동사 ‘vorschlagen’(제안하다)은 밑줄친 부분에서 보듯 두 부분으로 나뉘어 배치된다 -편집자) 통역을 하는 주체가 사람이라면 ‘schlagen’(단독으로는 ‘때리다’는 의미도 있다 -편집자)이라는 단어가 이 문장에서는 폭력과 아무 상관이 없음을 경험으로 알 것이다.

그러나 컴퓨터는 이 단어를 당장 “I hit you…”(당신을 때립니다)라고 영어로 옮길 것이다. 바이벨은 이 문제점을 잘 알고 있다. 그가 근무하는 카를스루에기술연구소(KIT)에서 컴퓨터 관련 강의를 영어로 동시통역한 일이 있기 때문이다. 강의를 듣는 학생들은 마치 텔레비전을 보면서 자막을 읽듯 강의의 번역문을 웹사이트에서 함께 읽어나갈 수 있었다.

하지만 마이크로소프트는 독일어와 관련된 문제를 곧 해결할 것이다. 비록 크리스 벤트가 독일어 스카이프 번역기의 도입 날짜를 확정해 공표하지는 않았지만, “2015년 안에 될 것으로 예상해도 좋다”는 약속을 했기 때문이다. 마이크로소프트는 통역 기능을 지속적으로 개선하기 위해 인간 도우미를 채용했다. 번역 기록을 검토하고 평가해야 하는데, 그러려면 두 언어를 다 잘하는 인력이 필요하다.

도우미가 어디서 근무하냐고? 벤트는 이 질문에 대한 직접적인 답을 피했다. “캘리포니아에서도, 독일에서도, 아니면 일본에서도 당신은 그들을 발견하지 못할 것이다.” 그렇다면 어디?

문법 벗어나 통계 활용한 번역으로 진화

그런 일을 저렴한 가격에 맡아주는 회사들이 있다고 한다. 여러 나라 말을 능통하게 하는 재택근무자라면 아마 동아시아에서 발견되겠지 싶다.  

“뭐라고요? 자동번역된 대화가 전부 녹음되고, 나중에 다른 사람이 그걸 들을 수 있다고요? 그렇습니다. 베타테스트(정식 서비스 전에 시행하는 시범 서비스)에 참가하는 스카이프 이용자들은 누구나 이 조건에 클릭해서 동의해야 합니다.” 벤트는 “언젠가는 이 동의 조항이 자유 선택이 될 것”이라면서 “우리는 개인정보를 되도록 익명화하고 있다”고 강조한다.

“그럼 만약 미국 정보기관 직원이 마이크로소프트 회사 문 앞에 버티고 서서 용의자 두명의 스카이프 통화 내용 녹음 테이프를 달라고 하면 어떻게 되는 건가요?” 벤트는 “설령 우리 쪽에서 그렇게 하고 싶다 해도 우린 미국 정보기관을 위해 통화 내용을 복사할 수 없다”고 말했다. 당장은 그 말을 믿을 수밖에 없다. 그러나 정보를 수집하고 평가하는 일은 불신을 불러온다. 불신은 디지털 통역기 세계의 일부다. 그 세계를 가능케 한 어마어마한 계산 능력이 그 일부인 것과 마찬가지로.

마이크로소프트는 컴퓨터 번역기를 새로 발명하지 않았다. 하지만 자사의 인터넷 전화 통화용 바벨 물고기를 사용해 일상의 평범한 대화를 통역하는 문제에 최초로 접근을 시도한 회사다. 이용 가격이 거의 무료인 스카이프라는 전화 시스템을 통해 실험함으로써 마이크로소프트는 전세계 사람들 간의 언어장벽을 낮추고 있다. 이로써 오랫동안 빈축을 사온 인공지능이 다시 유리한 위치를 확보하는 데 기여하고 있다.

많은 전문가들이 이제 곧 영리한 컴퓨터 시대가 도래하리라고 믿는다. 이 분야의 베테랑인 알렉스 바이벨은 “이 신경망은 지능이 발달한 기계라는 꿈에 가까이 다가서고 있다”고 말했다. 인터뷰를 진행하고 있는 스카이프의 화질이 나빠서 유감스럽게도 이 말을 하는 그의 눈에 눈물이 어리고 있는지를 확인할 수는 없었다.

ⓒ Die Zeit 2015년 10호 Sie haben verstanden
번역 장현숙 위원

정기구독자는 과거 기사 전체와 2016년 6월 이후 온라인 기사 전체를,
온라인 회원은 과거 기사 일부와 2016년 6월 이후 온라인 기사 전체를 보실 수 있습니다.

  

ⓒ Economy Insight(http://www.economyinsight.co.kr) 무단전재 및 재배포금지 | 저작권문의  

     
전체 기사의견(0)  
 
   * 300자까지 쓰실 수 있습니다. (현재 0 byte/최대 600byte)
   * 욕설이나 인신공격성 글은 삭제합니다. [운영원칙]
매체소개 구독신청 구독문의기사문의개인정보취급방침청소년보호정책 이메일무단수집거부찾아오시는 길
한겨레신문(주) | 제호 : 이코노미 인사이트 | 등록번호 : 서울 아 01706 | 등록일자 : 2011년 07월 19일 | 발행인 : 양상우 | 편집인 : 권태호
발행주소 : 서울특별시 마포구 효창목길 6 (공덕동, 한겨레신문사) | 한겨레 고객센터 1566-9595 | 청소년보호 책임자 : 장철규
Copyright 2010 Hankyoreh. All rights reserved.