주메뉴바로가기.. 본문바로가기

DNA를 조종해 인공지능을 획득한다, 분자 컴퓨터

카카오스토리 네이버밴드 구글플러스

2015년 12월 01일 18:27 프린트하기

5세대 컴퓨터를 대표하는 분자컴퓨터, 양자컴퓨터, 그리고 뉴로모픽컴퓨터는 모두 디지털이 아닌 아날로그 신호를 사용한다. 0 또는 1이 아니라 0.3, 0.6과 같이 연속적인 확률의 개념을 이용해 연산을 수행한다. 그리고 그 장점은 어마어마하다.

 

[다시 시작된 아날로그 시대, 5세대 컴퓨터]
1. DNA를 조종해 인공지능을 획득한다, 분자 컴퓨터

2. 양자의 중첩이 만들어내는 가장 빠른 컴퓨터, 퀵실버 양자컴퓨터
3. 인간을 기계화하거나, 기계를 인간화하거나, 뉴로모픽컴퓨터

 

 

“분자컴퓨터는 분자가 가진 특성을 이용해 현재 실리콘 기술로는 구현할 수 없는 새로운 계산을 하는 컴퓨터다. 분자컴퓨터는 단백질, DNA, RNA 등 바이오 분자를 이용하는데, 최근 가장 앞서가는 것은 DNA를 이용하는 분자컴퓨터다"

- 장병탁 서울대 컴퓨터공학부 교수

 

○ DNA에 정보를 코딩한다

 

DNA는 아데닌(A), 티민(T), 구아닌(G), 시토신(C) 네 가지 염기로 구성된 분자다. DNA컴퓨터는 이 네 가지 염기로 정보를 코딩(coding)한다. 염기 중 A는 T와, C는 G와 상보적인 결합을 한다. 이는 일종의 화학반응으로, 엄청난 수의 DNA 가닥이 동시에 반응한다는 특징이 있다.

 

간단한 실험에서도 DNA로 코딩된 정보 1017개를 동시에 처리할 수 있다. 사람이 1초에 10개씩 처리한다고 해도 3억1710만 년이 걸리는 양이다. 이런 DNA의 특징을 ‘초병렬성’이라 한다. DNA컴퓨터는 이 점을 이용해 인공지능을 구현하는 것이 목표다.

 

필자가 이끌고 있는 서울대학교 컴퓨터공학부 분자지능연구실에서는 필기체 숫자 영상을 패턴인식하는 분자머신러닝 장치를 개발하고 있다. 이 장치는 현재 손글씨로 쓰여진 6을 구분하도록 설계돼 있다. 학습을 위해서 필체가 다른 6자 사진 200개를 사용했다.

 

이 사진들이 7×7=49 개의 픽셀로 이뤄져 있다고 가정하자. 사진의 각 픽셀에서 검은 부분에 해당하는 DNA서열, 하얀 부분에 해당하는 DNA서열을 정한다. 그러면 총 98개의 겹치지 않는 DNA서열이 정해진다. 그리고 각 사진을 분석해 각 픽셀마다 검은 부분과 하얀 부분이 차지하고 있는 비율에 따라 DNA 양을 조절한다.

 

트레이닝 세트 만드는 법. - (주)동아사이언스 제공
트레이닝 세트 만드는 법. - (주)동아사이언스 제공
예를 들어 37번 픽셀에 흰색이 70%, 검은 색이 30%를 차지한다면 흰색 DNA와 검은색 DNA의 비율이 7:3이 되도록 DNA를 증폭시킨다. 이렇게 1번부터 49번 픽셀까지 같은 과정을 반복하면 사진 한 장의 정보가 담긴  ‘트레이닝 세트(traning set)’가 만들어진다. 200장의 사진을 이용하면 200개의 트레이닝 세트가 생긴다. 그 다음은 학습 과정이다.

 

학습을 할 DNA 세트 역시 98개의 서로 다른 DNA 서열을 갖는다. 트레이닝 세트와 다른 건, 이들은 모두 흰색과 검은색 비율이 5:5인 상태라는 점이다.

 

학습 DNA 세트에 트레이닝 세트를 넣어주면, 학습 세트의 DNA와 트레이닝 세트의 DNA는 서로 상보적인 결합을 한다(이중가닥 DNA를 만든다). 37번 픽셀에 집중해서 보자(실제로는 49개 픽셀에서 동시에 일어나는 과정이다). 흰색 이중가닥 DNA : 검은색 이중가닥 DNA는 7:3이 된다. 그런 뒤 완전히 결합한 이중가닥 DNA만 추출해 증폭시킨 뒤, 다시 학습 세트에 넣는다. 그럼 한 번 업데이트한 학습 세트가 된다. DNA농도가 확률이 되는 것이다.

 

200개의 세트를 업데이트 시키고 나면 여러 가지 모양의 ‘6’ 에 대한 정보를 가진 학습 세트가 만들어진다. 여기에 6인지 알 수 없는 사진의 DNA 세트(테스트 세트)를 학습 세트에 넣어주고 상보적인 결합을 하는 비율이 높을 경우 6이라고 판단한다.

 

만약 인공지능 소프트웨어라면 픽셀 하나마다 흰색과 검은색의 비율을 각각 비교해야 하므로, 총 98번의 연산이 필요하다. 반면 분자컴퓨터는 단 한번으로 충분하다. 픽셀 수가 늘어날수록 연산 시간의 차이는 기하급수적으로 늘어난다. 이런 차이는 DNA가 초병렬적으로 화학 반응을 한다는 점에서 비롯된다.

 

○ 분자컴퓨터 활용하려는 움직임 활발

 

분자컴퓨터는 초병렬성을 제외하고도 여러 장점이 있다. 이중나선 DNA 분자는 두께와 폭이 각각 0.34nm, 2nm인 나노구조로, DNA 1g은 1021개의 염기를 포함한다. 이는 10억 테라바이트(TB)에 해당하는 엄청난 집적도다. 이런 특성은 단순한 패턴인식을 넘어서 영상을 분석하는 등 초병렬 분자인식 과정까지 가능하게 한다. 이런 이유로 최근 DNA 컴퓨팅을 여러 분야에 적용시키려는 움직임이 활발하다. 


분자 컴퓨터는 인간수준의 인공지능을 구현할 수 있는 비폰노이만 방식의 새로운 패러다임을 이끌어 나갈 것으로 기대된다.

 

 

※ 더 많은 과학기사를 2015년 12월호 과학동아에서 만나보세요.

 


장병탁 서울대 컴퓨터공학부 교수

btzhang@snu.ac.kr

카카오스토리 네이버밴드 구글플러스

2015년 12월 01일 18:27 프린트하기

 

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

17 + 2 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

관련 태그뉴스