메뉴바로가기본문바로가기

동아사이언스

소음 속에서도 목소리 뚜렷이 인식하는 '성대 패치' 나왔다

통합검색

소음 속에서도 목소리 뚜렷이 인식하는 '성대 패치' 나왔다

2019.06.20 14:10
패치형태의 초소형 마이크를 통해 음성인식률을 높일  수 있는 기술이 개발됐다. 게티이미지뱅크
패치형태의 초소형 마이크를 통해 음성인식률을 높일 수 있는 기술이 개발됐다. 게티이미지뱅크

어느새 필수로 자리잡은 인공지능(AI) 비서의 문제는 ‘말을 똑바로 안 듣는 것’이다. 다른 소음에 의도치 않게 AI 비서가 갑자기 켜지기도 하고, 음성을 제대로 인식하지 못해 엉뚱한 대답을 늘어놓곤 한다. 한국 연구팀이 목에 붙이는 패치 형태의 초소형 마이크를 통해 음성 인식률을 대폭 높이는 기술을 선보였다. 가수나 교사 같은 목 관리가 필요한 사람들은 성대를 관리하는 용도로도 쓸 수 있을 전망이다.

 

조길원 포스텍 화학공학과 교수와 정윤영 전기전자공학과 교수 공동연구팀은 기존 마이크보다 훨씬 민감도가 높으면서도 목에 붙여 소음과 마스크 같은 방해물에 영향을 받지 않는 유연한 피부 부착형 진동감지 센서를 개발하는 데 성공했다는 연구결과를 이달 18일 국제학술지 ‘네이처 커뮤니케이션스’에 발표했다.

 

조길원 포스텍 화학공학과 교수(왼쪽)와 정윤영 전기전자공학과 교수(가운데), 이시영 화학공학과 박사과정생 공동연구팀은 목에 붙이는 패치 형태의 고성능 마이크를 개발했다고 밝혔다. 포스텍 제공
조길원 포스텍 화학공학과 교수(왼쪽)와 정윤영 전기전자공학과 교수(가운데), 이시영 화학공학과 박사과정생 공동연구팀은 목에 붙이는 패치 형태의 고성능 마이크를 개발했다고 밝혔다. 포스텍 제공

AI 비서가 목소리를 인식하기 위해 쓰는 마이크의 경우 공기의 떨림이 전파되는 것을 통해 목소리를 인식한다. 성대에서 마이크까지 중간에 소음과 같은 방해꾼이 많으면 민감도가 떨어지다 보니 어떤 말인지를 대강 알아듣는 정도다. 누구의 소리인지나 소리의 크기 같은 것은 정확히 짚어내기 어렵다. 음성 보안에 활용하기는 무리가 있었다.

 

연구팀은 성대의 떨림에서 바로 소리를 뽑아낼 수 있음을 밝혀냈다. 연구팀은 사람이 주로 내는 소리의 세기인 40~70㏈ 안에서 소리의 세기는 성대의 진동가속도와 비례한다는 사실을 밝혀냈다. 이를 활용해 진동가속도를 측정하는 진동 센서를 제작했다. 100 마이크로미터(㎛, 100만분의 1m) 크기의 미세한 구멍이 뚫린 고분자 진동판으로 구성된 센서는 피부를 통해 전해지는 진동가속도를 측정해 음성을 정량적으로 분석해 준다. 연구팀은 사람의 음성 영역인 20~3500Hz에서 센서가 일정한 성능을 보임을 확인했다.

 

연구팀은 성대의 떨림에서 바로 소리를 뽑아내는 진동 센서를 개발했다. 패치형 마이크(맨 왼쪽)를 이용하면 권한 유무에 따라 목소리를 정확하게 인식하고 반응한다. 조길원 교수 연구팀 제공
연구팀은 성대의 떨림에서 바로 소리를 뽑아내는 진동 센서를 개발했다. 패치형 마이크(맨 왼쪽)를 이용하면 권한 유무에 따라 목소리를 정확하게 인식하고 반응한다. 조길원 교수 연구팀 제공

연구팀은 가로세로 1㎝ 크기의 진동 센서를 제작해 사람에게 붙여 음성인식 시스템과 음성 원격제어 시스템을 시연했다. 센서는 권한이 있는 사용자와 없는 사용자를 정확히 구분해냈다. 마스크를 착용한 경우에도 목소리를 인식했다. 실리콘으로 만들어져 잘 휘어지는 데다 반창고처럼 피부에 붙였다 뗐다 하는데 아무런 문제가 없다. 조 교수는 “반창고처럼 아무런 이물감이 없고 피부에 자극도 없다”며 “크기 또한 더 작게 만드는 것도 가능하다”고 말했다.

 

피부부착형 센서는 음성 인식의 정확도를 높이는 것뿐 아니라 음성을 활용한 보안 등 다양한 곳에 응용될 수 있다. 시끄러운 환경 속에서나 목소리를 거의 낼 수 없는 가스마스크를 착용한 환경에서도 목소리를 바로 성대를 통해 전달받기 때문에 왜곡 없이 정확한 음성 인식이 가능하다. 각 개인이 고유하게 갖는 목소리의 파형이 다름을 이용해 사용자를 구분하는 음성 보안에도 활용할 수 있다.

 

성대를 통해 바로 전달되기 때문에 중간의 방해 없이 목소리를 그대로 전달함으로써 음성 보안에도 활용할 수 있다. 포스텍 제공
성대를 통해 바로 전달되기 때문에 중간의 방해 없이 목소리를 그대로 전달함으로써 음성 보안에도 활용할 수 있다. 포스텍 제공

목소리를 많이 쓰는 가수나 교사 같은 직업군의 목 상태를 관리하는 데도 활용할 수 있다. 웨어러블 센서가 목소리의 유무와 크기를 실시간으로 측정할 수 있어 센서를 착용하면 무선통신으로 스마트폰과 연동해 성대를 관리할 수 있다. 스마트폰이 목소리 활용 정도를 분석해 “목소리를 두 시간 동안 썼으니 휴식을 취하라”, “너무 큰 소리를 5분간 냈으니 당분간 성대를 쉬어 줘라” 같은 조언을 해 주는 것이다.

 

조 교수는 “이 연구는 정성적 해석에 그쳤던 목소리 인식 기술을 외부 환경에 관계없이 정량적으로 감지하고 분석할 수 있는 새로운 음성인식 시스템을 제시했다는 점에서 큰 의미가 있다”며 “음성을 인식할 수 있는 전자피부, 성대 헬스케어 모니터링 웨어러블 기기 등 다양한 분야에서 활용될 것으로 기대된다”고 말했다.

 

이시영 박사과정생이 1저자로 참여한 이번 연구결과는 과학기술정보통신부가 추진한 글로벌프론티어사업 ‘나노기반 소프트일렉트로닉스 연구단’의 지원으로 수행됐다.

 

성대의 사용시간과 목소리 크기 등을 모니터링 한 후 이를 분석해 성대를 관리하는데도 활용할 수 있다. 포스텍 제공
성대의 사용시간과 목소리 크기 등을 모니터링 한 후 이를 분석해 성대를 관리하는데도 활용할 수 있다. 포스텍 제공
 

 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

11 + 1 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기