메뉴바로가기본문바로가기

동아사이언스

韓-英-中-日 4개 국어 동시 소통시대 온다

통합검색

韓-英-中-日 4개 국어 동시 소통시대 온다

2020.09.27 09:00
[언택트시대 해결사 AI](1부)

한국전자통신연구원(ETRI), 언어지능 AI로 실시간 동시통역

코로나19로 확대된 온라인 강의, 포럼에 활용 가능

 

김영길 한국전자통신연구원(ETRI) 인공지능연구소 언어지능연구실장이 ′실시간 동시통역 기술′을 테스트하고 있다. ETRI 제공
김영길 한국전자통신연구원(ETRI) 인공지능연구소 언어지능연구실장이 자체 개발한 '실시간 동시통역 기술'을 테스트하고 있다. ETRI 제공

“Do you remember, it was like when you first learn how to drive?”

 

노트북에서는 2018년 12월 테드(TED)의 지역행사인 테드엑스(TEDx)에서 연사로 나선 사비네 도에벨 미국 조지메이슨대 심리학부 조교수의 강연 동영상이 재생되고 있었다. 인간의 뇌가 의식적으로 생각이나 감정, 행동을 통제할 때 사용하는 ‘실행 기능(executive function)’이 훈련을 한다고 향상되는 것은 아니라는 내용이었다. 


도에벨 교수가 강연을 이어가는 동안 화면 상단에는 그의 말이 영어 자막으로, 하단에는 영어 자막 밑에 한국어 자막이 동시에 떴다. ‘처음 운전하는 법을 배웠을 때를 기억하나요?’라며 문장이 자연스럽게 번역됐다.

 

김영길 한국전자통신연구원(ETRI) 인공지능연구소 언어지능연구실장은 “언어지능연구실이 개발 중인 ‘실시간 동시통역 기술’을 적용한 것”이라며 “올해 말까지 베타 서비스 수준으로 만드는 게 목표”라고 말했다. 

 

○ 문장 끊고, 전문용어 인식 AI…한국어 실시간 동시통역은 최고 

 

실시간 동시통역 기술의 가장 큰 특징은 한 문장씩 통역하는 대신 연속적으로 이어지는 문장을 실시간으로 통역한다는 점이다. 핵심은 음성인식 인공지능(AI)이다. 


사람이 문장을 이어서 내뱉으면 음성인식 기술의 난이도가 올라간다. 가령 어디까지가 한 문장인지 AI가 정확히 판단해 문장을 끊어야 한다. 강연의 경우에는 전문용어를 인식하는 능력도 필요하다. 구어체인 만큼 비문(非文)을 바로 잡거나 생략된 단어를 유추할 수도 있어야 한다. AI가 더 똑똑해야 하는 셈이다.


ETRI는 이미 자동 통·번역 서비스를 개발해 2018년 초 평창동계올림픽에서 제공한 경험이 있다. AI가 한국어, 영어, 중국어, 일본어, 독일어, 러시아어, 불어, 스페인어, 아랍어 등 9개 국어를 알아듣고 자동으로 문자로 변환해주는 서비스다. 딥러닝 기법을 활용해 방대한 음성정보를 학습시켜 음성 인식률을 높였고, 당시 음성인식 정확도는 95% 수준이었다. 인식률 90%인 애플의 ‘시리’보다 뛰어났다. 

 

해외에서는 마이크로소프트(MS)와 구글이 음성인식 AI 개발에 적극적이다. MS는 자사 인터넷 전화인 스카이프를 이용해 실시간 음성통역 기능을 확대하고 있다. 지난해 스카이프는 총 61개 언어에 대해서는 문자 기반 실시간 번역 서비스를 제공지만, 음성은 10개 언어만 지원했다. 그만큼 음성인식이 어렵다는 뜻이다.  

 

구글도 유튜브 영상 등에 자동 번역 서비스를 제공하고 있다. 실시간으로 40개 언어를 동시통역하는 무선 이어폰 ‘픽셀버즈(Pixel Buds)’도 출시했다. 김 실장은 “MS나 구글은 영어가 중심인 만큼 한국어에서만큼은 강연이나 대화 전체를 실시간으로 통역할 때 이들을 뛰어넘는 게 목표”라고 말했다.

 

언어지능연구실은 이를 위해 음성인식, 문장 분류, 자동 번역, 문장 재구성, 음성 합성 등 실시간 동시통역 기술에 사용되는 요소 기술들을 더욱 정교하게 업그레이드하고 있다. 한국어 음성을 영어, 중국어, 일본어 등 3개 언어와 쌍방으로 실시간 동시통역하는 게 목표다. 최근에는 한국어와 영어를 쌍방으로 동시통역하는 내부 테스트까지 마쳤다. 

 

올해 전 세계를 강타한 신종 코로나바이러스 감염증(코로나19)의 영향으로 음성인식 AI 기술 수요는 더욱 늘어날 전망이다. 대학을 포함해 교육 현장에서 비대면 온라인 강연이 늘어나면서 언어 문제로 학습에서 소외된 유학생에게도 도움이 될 수 있다. 

 

김 실장은 “외국인 학생이 한국어로 동영상 강의를 들을 때 언어 장벽 때문에 학습 진도를 따라오지 못할 수 있다”며 “이때 실시간 동시통역 기술을 접목하면 도움이 될 것”이라고 말했다. 

 

최근 많이 열리는 비대면 온라인 포럼에도 활용 가능성이 높다. 김 실장은 “실시간 동시통역 기술을 사용하면 해외에 나가거나 통역자를 두지 않고도 외국 연구자나 기업 관계자와 화상회의를 자연스럽게 진행할 수 있을 것”이라고 말했다. 

 

한국전자통신연구원(ETRI) 인공지능연구소 언어지능연구실이 개발 중인 ′실시간 동시통역 기술′을 적용하면 동영상이 재생되는 동안 한국어 번역 자막이 실시간으로 제공된다. 김영길 제공
한국전자통신연구원(ETRI) 인공지능연구소 언어지능연구실이 개발 중인 '실시간 동시통역 기술'을 적용하면 동영상이 재생되는 동안 한국어 번역 자막이 실시간으로 제공된다. 김영길 제공

○ "언어지능, AI 산업 다방면 활용"


언어지능연구실의 ‘히트작’은 하나 더 있다. ‘한국판 알파고’로 불리는 AI ‘엑소브레인(Exobrain)’이다. 한국 토종 AI인 엑소브레인은 2016년 장학퀴즈에 출전해 인간과 맞붙은 대결에서 객관식과 고난도 주관식 문제 등 30문제 가운데 25개를 맞추며 우승했다. 당시 엑소브레인은 510점을 얻어 350점으로 2등을 차지한 인간을 여유롭게 따돌렸다.


당시만 해도 엑소브레인은 웹 검색이나 단답형 질의에 답하는 데 최적화돼 있었다. 지금은 딥러닝을 통해 서술형 질의응답도 가능하다. 가령 당시에는 ‘임진왜란은 몇 년에 일어났지?’라는 단순한 질문에 답했다면, 지금은 ‘임진왜란은 왜 일어났지?’라는 고난이도 질문에도 답을 찾아낸다. 

 

여기에는 ‘기계독해(MRC·Machine Reading Comprehension)’ 기술이 사용됐다. 기계독해는 AI가 질문하고 답하기를 반복적으로 학습해 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술이다. 


김 실장은 “국회도서관의 ‘법률 질의응답 시스템’에 엑소브레인이 채택돼 지난해부터 테스트를 진행하고 있다”며 “올해 안에 서비스를 본격적으로 시작할 가능성이 있다”고 말했다. 


한글과컴퓨터는 지난해 공개한 ‘한컴오피스 2020’에 지식검색 기능을 추가하면서 엑소브레인을 탑재했다. 가령 한글 문서를 작성하다가 지식검색을 선택하고 ‘방탄소년단 멤버는?’ 같은 질문을 입력하면 ‘RM, 진, 슈가, 제이홉, 지민, 뷔, 정국’이라는 문장이 바로 뜬다. 포털에서 동일한 질문을 입력하면 관련 정보가 담긴 사이트가 줄줄이 뜨는 것과 달리 답만 정확히 찾아서 보여준다. 


김 실장은 “사람의 말을 대신하는 언어지능은 향후 AI 산업에서 다방면에 활용될 것”이라며 “ETRI는 정부 출연연구기관인 만큼 기업에 기술을 이전하는 등 국내 AI 기술 발전을 위해 언어지능 원천기술 개발에 더욱 힘을 쏟을 것”이라고 말했다. 

 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

14 + 2 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기