주메뉴바로가기.. 본문바로가기

플리토의 도전...데이터로 언어 장벽 무너뜨린다

네이버밴드 구글플러스

2017년 03월 20일 13:30 프린트하기

세계의 언어 장벽이 무너지는 날이 올까요? 인공지능과 자동번역 덕분에 어쩌면 바벨탑 이전 시대로 돌아갈 수 있을지도 모른다는 기대가 요즘 조금씩 높아집니다. 

 

전문가들은 인공지능(AI)의 발전에 따라 인간과 AI가 함께 협력하며 살아가는 사회로 변모해 갈 것으로 예상하고 있다. AI 로봇과 인간의 갈등을 그린 영화 ‘아이로봇’의 한 장면. - 영화 아이로봇 장면 제공
전문가들은 인공지능(AI)의 발전에 따라 인간과 AI가 함께 협력하며 살아가는 사회로 변모해 갈 것으로 예상하고 있다. AI 로봇과 인간의 갈등을 그린 영화 ‘아이로봇’의 한 장면. - 영화 아이로봇 장면 제공

인공지능은 빠른 속도로 번역을 배워가고 있습니다. 구글이나 네이버의 자동 번역은 최근 인공신경망 기술이 적용되면서 품질이 급격히 좋아졌습니다. 지금까지는 문장을 단어나 구문 단위로 나눠 그 구문이 다른 문서에서 어떤 표현으로 주로 번역되었는가를 확률적으로 따지는 통계 기반 번역이 많이 쓰였습니다. 이 역시 그 이전, 특정 단어나 문구를 미리 정해진 규칙에 따라 번역하는 방식에 비해선 많이 개선된 기술이긴 합니다.

 

이제 문장 전체를 통으로 인식하는 인공신경망 기술이 현실화됨에 따라 자동 번역은 괄목할 만한 성장을 이뤘습니다. 구글은 세계 인구의 3분의 1이 쓰는 11개 언어에 인공신경망 번역을 제공합니다.

 

구글의 인공지능이 인공신경망 방식으로 중국어를 영어로 번역하는 과정. 문장 전체를 통째로 인식한다. - 구글 제공
구글의 인공지능이 인공신경망 방식으로 중국어를 영어로 번역하는 과정. 문장 전체를 통째로 인식한다. - 구글 제공

물론 사람들의 말과 글은 비논리적이거나 애매모호합니다. 대화에서 비언어 표현이 차지하는 비중은 크고, 맥락을 이해하기란 기술보다 예술에 가깝습니다. 인공지능이 사람의 언어를 알아듣고 번역하기가 여전히 어려운 이유입니다.

 

그래서 최근 열린 전문 번역사와 인공지능의 번역 대결에서는 인간이 압도적인 승리를 거뒀습니다. 언어와 번역은 여전히 인간의 영역임을 확인했습니다. 하지만 아직 어떤 인공지능 번역 기술도 인간에 대한 우위를 주장한 적이 없는데, 굳이 이벤트를 열어 인간의 승리를 선언한 것이 어색해 보이기도 합니다. 그만큼 인간이 기계의 추격에 조바심을 느끼기 때문인 듯 합니다.  

 

☞(관련 기사) ‘인공지능이 전문 번역가를 이길 수 있느냐’보다 중요한 질문

 

사람은 빠르게 발전하는 인공지능의 번역 능력을 활용하고, 인공지능은 사람들이 쏟아내는 말과 글을 배우며 학습에 속도를 내는 상부상조가 당분간 이어질 전망입니다. 이 과정에 필요한 것이 언어에 대한 데이터입니다. 언어 데이터가 많을수록 인공지능은 빨리 사람의 말을 배우고, 사람은 더 편리하게 기계 번역을 쓸 수 있습니다. 이렇게 사람들이 만들어내는 번역 결과는 다시 교보재가 되어 인공지능을 학습시킵니다.

 

● 집단지성 앞세운 ‘번역계 우버’

 

언어 데이터의 축적과 활용, 스타트업 기업 플리토는 바로 그런 역할을 하겠다고 나선 회사입니다. 플리토는 재미있는 회사입니다. 번역계의 ‘우버’이면서 언어 데이터를 다루는 B2B 데이터 기업이기도 합니다.

 

플리토는 ‘집단지성’ 번역 서비스를 표방합니다. 무언가 급히 번역할 일이 있을 때, 플리토에 올리면 해당 언어를 아는 다른 회원들이 번역을 해 줍니다. 물론 소액의 돈을 내야 하지요. 번역을 해 준 회원은 일정 금액을 포인트로 받습니다. 전문 번역가를 쓰기엔 문서의 양이 너무 적거나, 복잡하지 않은 내용이지만 급하게 뜻을 알아야 할 경우에 유용합니다.

 

플리토의 실시간 텍스트 번역 서비스 - 플리토 제공
플리토의 실시간 텍스트 번역 서비스 - 플리토 제공

플리토는 이런 캐주얼한 번역 시장을 노렸습니다. 일하다 보면 그럴 때 있잖아요. 외국어로 된 자료에서 몇 가지 간단한 사실만 확인하고 싶은데 주변에 그 언어를 아는 사람이 없어 발을 동동 구를 때, 혹은 말이 안 통하는 여행지에서 급히 정보를 알아봐야 할 때 말입니다. 비싼 전문 번역을 안 써도 필요한 정보를 얻을 수 있고, 외국어를 잘 아는 사람은 큰 힘 안 들이고도 부수입을 얻을 수 있습니다. 번역을 원하는 사람들과 번역을 하는 사람들이 만나는 플랫폼이 됩니다.

 

매일 7만 건 이상의 번역 요청을 처리하고 있으며, 650만 일반 사용자 외에도 3000여 명의 전문 번역가가 따로 활동하며 맞춤형 번역을 제공하고 있습니다. 이정수 플리토 대표는 “자동번역은 번역 결과를 확신할 수 없어 결국 그 언어를 아는 사람의 확인을 다시 거쳐야 한다는 문제가 있다”며 “수요자는 번역 비용 부담을 낮추고, 외국어를 아는 사람은 수익을 얻을 수 있는 구조를 만들고자 했다”고 말합니다.

 

이정수 플리토 대표 - 플리토 제공
이정수 플리토 대표 - 플리토 제공

● 데이터로 언어 장벽 넘는다

 

하지만 플리토의 비즈니스는 여기서 멈추지 않습니다. 언어를 이해하는 사람들이 직접 만들어낸 생생한 번역 결과물은 자동 번역을 위한 유용한 데이터가 됩니다.

 

현재 글로벌 IT 기업들은 모두 음성 인식이나 자연어 처리, 번역 등의 영역에 뛰어들었다 해도 과언이 아닙니다. 아마존, 애플, 구글, 페이스북, 삼성전자, 마이크로소프트 등이 모두 목소리를 알아듣는 음성 비서, 메신저로 대화하며 답을 찾아 주는 지능형 챗봇, 자동 번역 등의 기술 확보에 앞다퉈 나서고 있습니다.

 

아마존의 음성인식 인공지능 비서 알렉사는 세계 주요 가전 제품이나 자동차에 잇달아 채택되고 있다. CES에서 알렉사를 탑재한 냉장고를 소개하는 LG전자
아마존의 음성인식 인공지능 비서 알렉사는 세계 주요 가전 제품이나 자동차에 잇달아 채택되고 있다. CES에서 알렉사를 탑재한 냉장고를 소개하는 LG전자

특히 세계 테크 시장이 하나의 시장으로 통합됨에 따라 언어 장벽의 극복이 비즈니스의 주요 과제로 떠올랐습니다. 번역 기술로 세계 전체를 대상으로 더욱 효과적으로 비즈니스를 할 수 있습니다. 또 세계 각지 고객들의 반응을 바탕으로 더 큰 가치를 만들 수 있습니다.

 

번역 기술 향상을 위해 꼭 필요한 것이 언어 데이터입니다. 잘 정제되고 정확한 언어 데이터가 있어야 인공지능의 번역 실력이 쑥쑥 좋아집니다. 이 대표는 “글로벌 IT 기업들이 언어 데이터 확보에 적극적”이라며 “이들은 언어 데이터의 라이선스 문제 등을 해결하기 위해 데이터 구매에도 적극 나서고 있다”고 말했습니다.

 

SNS에 공개된 내용을 수집해 인공지능을 학습하는 방법도 쓰이고 있지만, 라이선스 문제로 사용에 제약이 있고 내용도 정제되지 않아 수집 후 분석이 어렵다는 문제가 있습니다. 마이크로소프트의 인공지능 챗봇 테이가 트위터에서 말을 배웠다가 인종차별 발언을 쏟아내는 사건이 터지기도 했습니다. 

 

☞(관련 기사) MS 채팅 봇 ‘테이’, 24시간 만에 인종차별주의자로 타락

 

플리토는 이런 수요에 대응해 기업에 언어 데이터를 팔고 있습니다. 2014년 자동 통역 앱 ‘지니톡’을 개발하던 한국전자통신연구원(ETRI)에 언어 데이터를 판매한 것을 시작으로 NTT도코모, 시스트란, 네이버 등 국내외 주요 기업에 언어 데이터를 판매했습니다.

 

사실 2012년 플리토를 처음 창업한 것도 언어 데이터를 쌓고 싶어서였습니다. 이 대표는 “가치 있는 데이터를 쌓으면 비즈니스가 생기지 않을까”라는 무모한 생각으로 창업에 도전했습니다. 하다 못해 사라지는 언어를 보존하거나 복원하는 데 도움이 되지 않을까라는 생각이었다고 합니다.

 

플리토의 실시간 이미지 번역 기술로 이탈리아 우피치 미술관 표지판을 번역한 모습 - 플리토 제공
플리토의 실시간 이미지 번역 기술로 이탈리아 우피치 미술관 표지판을 번역한 모습 - 플리토 제공

집단 지성 번역 서비스, 또 이와 별개로 진행했던 한류 연예인 SNS 번역 서비스 등이 모두 자연스럽게 언어 번역 데이터를 쌓으려는 노력의 일환이었습니다. 믿을 만 하고 라이선스 걱정 없는 언어 데이터를 착실히 구축하고 있습니다. 이 대표는 “현재 글로벌 언어 데이터를 약 1억 건 정도 확보했고 이중 한국어 데이터만 발라내면 약 1000만 건 정도 된다”고 말합니다. 일상적 대화 외에 다양한 세부 전문 분야에 대해서도 원활히 번역을 할 수 있도록 계속 언어 데이터를 늘여가는 것이 관건입니다.

 

플리토의 최종 목표는 세계 언어의 장벽을 무너뜨리는 것입니다. 사람들이 참여하는 집단지성 번역이 그 한 방법입니다. 해외 여행지에서 표지판 등을 찍어 올리면 이를 번역하고, 이후 같은 이미지가 올라오면 실시간 번역을 보여주는 증강현실 (AR) 번역 서비스도 시작했습니다. 데이터 기반 번역 서비스인 셈이지요. 여기에 대규모 언어 서비스를 하는 대기업을 상대로 한 언어 데이터 사업도 한몫을 하고 있습니다. 

 

이 대표는 “언어 장벽을 무너뜨려 누구나 문명의 이기를 누리고 필요한 정보를 받아들일 수 있게 하고 싶다”고 말합니다. 플리토의 번역 서비스와 언어 데이터 중 어느 쪽이 이 목표를 이루는데 더 기여하게 될 지 궁금합니다.

네이버밴드 구글플러스

2017년 03월 20일 13:30 프린트하기

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

12 + 2 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

관련 태그뉴스