메뉴바로가기본문바로가기

동아사이언스

새해 AI 학습용 데이터 20종, 6000만 건 민간에 푼다

통합검색

새해 AI 학습용 데이터 20종, 6000만 건 민간에 푼다

2019.12.29 13:34
인공지능(AI) 허브 포털(AIHub.or.kr) 화면. 과학기술정보통신부 제공
인공지능(AI) 허브의 포털(AIHub.or.kr) 화면. 과학기술정보통신부 제공

인공지능(AI)을 개발하려면 양질의 학습용 빅데이터와 고성능 컴퓨팅파워(고성능 컴퓨터를 활용하는 능력)가 필수적으로 필요하다. 하지만 이 자원들을 마련하는 데에는 많은 시간과 비용이 들어 중소기업과 벤처기업이 자체 구축하기에는 어려움이 따른다. 내년부터는 이런 자원을 구축하는 일이 올해보다 훨씬 쉬워질 전망이다. 

 

과학기술정보통신부는 AI 개발에 필요한 빅데이터와 고성능 컴퓨팅 자원을 민간 기업에서도 누구나 쉽게 활용할 수 있게 지원하는 ‘인공지능 허브'에 대한 범위를 더욱 확대하겠다고 29일 밝혔다.

 

인공지능 허브(www.AIHub.or.kr)는 지난 해 처음으로 시작한 서비스다. 과기정통부는 2018년 92억5600만원에서 올해 310억원, 내년 761억원까지 지속적으로 투자를 늘려왔다. 첫해에는 AI 학습용 데이터를 11종, 1850만 건 제공했고, 올해는 10종 2500만 건을 추가로 제공했다. 

 

새해에는 이보다 규모가 2배 더 큰 20종, 6000만 건 이상을 추가로 제공할 예정이다. 특히 유튜브 등 동영상 데이터 사용이 기하급수적으로 늘어나고 있어, 대용량 동영상 데이터의 비중을 높일 계획이다. 고성능 컴퓨팅 자원을 올해보다 4배 이상 확보해 중소, 벤처기업뿐 아니라 대학과 연구기관까지 지원대상을 확대할 예정이다.

 

지금까지 개발자 4000여 명이 이 데이터들을 1만5000건 다운로드해 AI 제품과 서비스를 개발하는 데 활용했다. 기계 번역 전문기업인 에버트란은 한국어-영어 번역 말뭉치(150만 문장) 학습용 데이터를 활용해 전문 번역가가 직접 번역한 수준의 실시간 한-영 법률 번역 플랫폼을 출시했고, 인공지능 전문기업인 테스트웍스는 인도 보행 영상 데이터(6만건)를 이용해 시각 장애인을 안전하게 길 안내 할 수 있는 내비게이션을 개발해 상용화를 준비 중이다. 

 

이 서비스를 통해 AI를 개발하는 기간이 단축되기도 했다. 스타트업 라이언로켓은 고성능 컴퓨팅 자원을 활용해 음성합성 엔진 개발에 딥러닝 학습시간을 50% 이상 줄였고, 원더풀플랫폼은 독거노인 돌보미 서비스를 개발하는 데 일정을 30% 줄였다. 

 

과기정통부는 올해 처음으로 AI 개방형(온라인) 경진대회를 개최해 우수 기업 20곳을 선정하고 사업화비로 총 32억원을 지원하기도 했다. 이 경진대회에서 수상한 의료 분야 전문기업인 네어컨버전스는 대학병원 산부인과와 연계해 임산부의 태아 심장박동 초음파의 데이터를 학습해 태아의 이상 징후를 탐지하는 의료진단 서비스를 개발했다. 내년에는 대회의 규모를 더욱 확대할 예정이다.

 

과기정통부 관계자는 “AI 강국으로 도약하기 위해서는 개발자들이 마음껏 도전할 수 있도록 핵심 인프라가 구축되는 일이 중요하다"며 "국내 기업과 대학, 연구소 전문가들이 인공지능 허브의 인프라를 이용해 창의적인 아이디어를 경쟁력 있는 서비스로 개발할 수 있도록 돕겠다"고 말했다. 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

10 + 7 = 새로고침
###
    * 21대 국회의원 선거운동 기간에는 실명확인 과정을 거쳐야 댓글을 게시하실수 있습니다..
    * 실명 확인 및 실명 등록 서비스는 선거운동기간 (2020. 4. 2 ~ 2020. 4. 14) 동안에만 제공됩니다.
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스