주메뉴바로가기.. 본문바로가기

읽는 책에서 듣는 책으로, 오디오북 시대

카카오스토리 네이버밴드 구글플러스

2018년 02월 19일 12:07 프린트하기

우리나라 성인 인구 중 40%가 1년에 책을 한 권도 읽지 않는다는 문화체육관광부의 통계가 나왔다. 1994년 처음 조사가 이뤄진 이래 가장 낮은 수치라고 한다. 당장 지하철을 타도 책을 읽는 사람은 찾아보기 어렵고 대부분 스마트폰 속 동영상이나 게임, 혹은 소셜미디어에 집중하는 것이 요즘의 현실이다.

이를 단순히 ‘책 읽지 않는 것’에 대한 사회적 문제로 짚을 필요는 없을 것 같다. 여유가 사라진 현대인의 삶이 이유로 꼽혔지만 사람들은 여전히 콘텐츠를 소비하고 있고 그 양은 빠르게 늘어나고 있다. 다만 그게 책이 아니라 다른 콘텐츠일 뿐이다. 서운함과 아쉬움이 있긴 하지만 사람들이 책보다 더 재미있고 쉽게 접근할 수 있다고 느끼는 콘텐츠는 공급과 소비 모두 늘어가고 있다.

 

PIXABAY 제공
PIXABAY 제공


독서 인구의 하락, '바빠서'라지만...

당연히 책도 변해야 한다. 책은 여전히 재미있는 콘텐츠고, 그 앞에 담긴 지식은 높은 가치를 갖고 있다. 다만 스마트폰 중심의 미디어 시대에서 그 형태와 책을 읽는 습관이 짧은 여유 속에서도 찾아보게 만드는 흥미와 형식적 요소에 대해 속시원한 답을 찾지 못했을 뿐이다.

대안으로 꼽히는 ‘책 읽기’는 오디오 북이다. 남이 읽어주는 책을 듣는 것이다. 긴 호흡으로 책을 읽을 수 없다면 짧은 수업에 참여하는 느낌, 혹은 라디오 드라마를 듣는 기분으로 책을 소비하는 방법으로 오디오북이 주목받고 있다. 특히 책 전체를 읽어주기도 하지만 책의 핵심만 뽑아서 읽어주는 형식이 많기 때문에 2~3시간만에 책 한 권을 뗄 수 있기도 하다. 특히 출퇴근 시간, 혼자 차에서 보내는 시간이 많은 미국을 중심으로 오디오북 시장은 꾸준히 성장해 왔다.

우리나라의 오디오북은 미국에 비해 다소 조심스럽게 움직이고 있다. 워낙 출판 시장이 작은 데다가, 전자책을 비롯한 새로운 형태의 유통에 보수적인 시장 분위기도 있다. 하지만 오디오북 자체를 놓치기에는 대세가 되는 책의 형태이기도 하다. 아마존에 인수된 오더블닷컴(www.audible.com)은 미국의 대표적인 오디오북 서비스다. 미국 오디오북 시장은 이제 출퇴근 시간을 채우는 하나의 문화로 자리잡아 전체 책 시장의 10%를 넘어선 지 오래다.

 

묘하게도 요즘 국내에서도 오디오북이 부쩍 눈에 띈다. 흥미로운 것은 단순한 책 읽기를 넘어 여러가지 기술이 더해지면서 오디오북의 가능성을 넓히고 있다는 점이다.

 

오디블은 대표적인 미국의 오디오북 서비스다. 미국은 오디오북이 전체 책 시장의 10%를 차지할 만큼 빠르게 성장하고 있다.
오디블은 대표적인 미국의 오디오북 서비스다. 미국은 오디오북이 전체 책 시장의 10%를 차지할 만큼 빠르게 성장하고 있다.

구글, ‘머신러닝으로 책 듣는 경험 만든다

 

구글은 지난 1월, 구글 플레이에 오디오북을 출시했다. 구글이 오디오북을 내놓는 것은 처음으로, 9가지 언어로 45개 국가에 출시했다. 우리나라와 한국어도 그 안에 포함됐다. 구글은 오디오북을 녹음하는 과정 자체에 개입하지는 않는다. 기존에 만들어져 여러 경로로 유통되던 오디오북을 파는 또 하나의 온라인 서점 역할을 하는 것에 가깝다. 하지만 구글은 단순히 책을 팔기만 하는 것은 아니다. 어떤 서비스에든 머신러닝 기술을 붙여보는 것이 최근 구글의 특징인 만큼 머신러닝 기술이 더해진다.

 

구글플레이의 오디오북 서비스. 또 하나의 유통 채널의 역할이 크지만 머신러닝을 더한 것이 눈에 띈다.
구글플레이의 오디오북 서비스. 또 하나의 유통 채널의 역할이 크지만 머신러닝을 더한 것이 눈에 띈다.

머신러닝이 더해지는 것은 책의 목차 분석이다. 구글은 오디오북의 약점이 현재 어느 정도를 읽었는지 확인하기 어렵다는 점에 집중했다. 마치 스트리밍으로 재생되는 음악에 가사가 실시간으로 따라붙는 것처럼 현재 오디오북이 어느 챕터를 읽고 있는지 알 수 있다. 사실 음악 스트리밍과 비교하긴 했지만 음악은 메타 데이터를 통해 가사를 매칭하는 경우가 많다. 구글은 책 원고가 담긴 텍스트 데이터와 목소리가 담긴 오디오 데이터를 서로 매칭한다. 구글은 이미 머신러닝 기반의 구글 어시스턴트를 통해 사람의 말과 그 문맥을 이해하는 기술을 갖고 있다. 그렇게 음성에서 텍스트로 변환된 데이터는 본래 텍스트 원고와 비교해 해당 위치를 찾는 데 활용한다. 지극히 구글다운 활용 방법이다.

이를 위해 출판사가 별도로 해야 하는 작업은 없다. 책을 내는 쪽에서는 구글에 유통한 오디오 파일과 원고를 제공하면 된다. 목차 분석은 머신러닝 시스템을 이용해 자동으로 이뤄지고, 분석 결과가 더해져 구글 플레이스토어에 유통된다.

 

네이버 듣기 편한 TTS 기술로 오디오북 대중화


네이버는 오디오북 제작 그 자체에 집중했다. 네이버랩스는 연기자 유인나 씨의 목소리를 샘플링한 TTS(Text to speech, 텍스트를 목소리로 바꿔주는 기술) 엔진을 개발했다. 이미 TTS 기술은 우리에게 익숙하다. 기계가 사람의 목소리로 말하는 것은 대부분 이 TTS 기술에 기반한다. 그리고 TTS는 이미 꽤 오래된, 그러니까 완성 단계에 접어든 기술이기도 하다. 기계가 읽는 느낌은 점점 더 줄어들고, 끊어 읽는 부분이나 호흡 등도 사람의 그것과 매우 비슷하다. 목소리도 여러가지로 입힐 수 있게 됐다. 네이버는 여기에 유인나 씨의 차분한 목소리를 얹어 콘텐츠의 상품성과 전달 효과를 높였다.

특히 오디오북이 자연스럽게 들리기 위해서 성우를 쓰는 것이 일반적이긴 한데, 이 때문에 제작비가 치솟게 마련이다. 특히나 국내 시장과 한글 기반의 오디오북 수요는 사실 빤하기 때문에 막대한 제작비를 쏟기가 쉽지 않다. TTS 엔진을 통해 자연스러움과 익숙한 목소리를 더하면서 제작에 대한 부담도 덜어낸 셈이다. 네이버는 오디오 클립(https://audioclip.naver.com/categories/24/channels)에 오디오북 채널을 열고 유인나씨 외에도 책의 내용에 맞는 다양한 목소리로 오디오북을 제공하고 있다.

TTS와 음성 합성 기술을 더한 네이버의 오디오 클립 서비스. 기계음의 색을 덩러내고 아주 자연스러운 목소리를 만들어낸다.
TTS와 음성 합성 기술을 더한 네이버의 오디오 클립 서비스. 기계음의 색을 덜어내고 아주 자연스러운 목소리를 만들어낸다.

TTS를 통한 책 읽기는 리디북스와 예스24등 기존 전자책 업계도 지난 몇 년간 힘을 쏟은 부분이다. 이 전자책 앱들은 남성과 여성 목소리를 담은 TTS 엔진을 품고 있어서 ePUB 형태로 만들어진 전자책은 꽤 자연스럽게 읽어준다. 물론 TTS를 실제 사람 목소리와 비교하는 것은 어불성설이지만 실제 반응도 나쁘지 않고 그 사용량도 꾸준히 늘어가고 있다고 한다. 집중해서 듣지 않아도 되는 장르 소설 등은 목소리를 통해 색다른 느낌으로 전달된다.

여전히 책의 판매량이 많지 않다는 것이 오디오북 시장의 발목을 잡고 있긴 하지만 오히려 그 한계점이 TTS 기술과 맞물려 우리나라 오디오 시장의 발전을 이끌고 있는 묘한 현상을 낳는 것처럼 보인다.

카카오스토리 네이버밴드 구글플러스

2018년 02월 19일 12:07 프린트하기

 

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

11 + 3 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기