메뉴바로가기본문바로가기

동아사이언스

구글 AI, 생명과학의 미스터리 단백질 접힘 문제 해결 눈앞

통합검색

구글 AI, 생명과학의 미스터리 단백질 접힘 문제 해결 눈앞

2020.12.01 18:29

구글AI ‘알파폴드2’, 단백질 구조 예측 학술대회 최고점,

2년만에 단백질 구조 예측 정확도 60점에서 92.4점으로 상승

정확도 일취월장...신약 개발에 적극 활용

 

 

알파폴드2가 예측한 단백질(파란색)과 실험적으로 예측한 단백질(녹색) 그림. 딥마인드 제공

단백질 구조를 나타내는 모식도. 단백질을 이루는 아미노산은 상호작용을 통해 구부러지고 비틀어진 단백질 모양을 만들어낸다. 딥마인드 제공

구글 딥마인드가 개발한 3차원 단백질 구조 예측 AI ‘알파폴드2’가 30일(현지시간) 온라인으로 열린 단백질 구조 예측 학술대회(CASP)에서 평균 92.4을 받아 최고점을 기록했다. 지난 2018년 멕시코에서 열린 CASP의 최고 점수가 평균 60점이었던 것과 비교해 무려 30점이 넘게 상승했다.

 

데미스 하사비스 딥마인드 최고경영자(CEO)는 "이번 진전은 거대한 과학적 도전의 돌파구"라며 "인류가 질병과 생명을 이해하는 능력에 많은 영향을 줄 것"이라고 말했다.

 

●1994년 시작해 올해 14회를 맞은 ‘단백질 구조 예측 학술대회(CASP)’

 

단백질은 아미노산의 집합체다. 평균적인 크기의 단백질은 20종류의 아미노산이 300개 정도 이어져 만들어지고, 단백질을 이루는 아미노산은 서로 밀거나 당기면서 구부러지고 비틀어진다. 아미노산 서열이 단백질의 구조와 특징을 결정하는 셈이다. 이렇게 아미노산이 상호작용을 통해 고유의 3차원 구조를 형성하는 과정을 '단백질 접힘'이라고 한다. 단백질의 구조를 예측한다는 건 아미노산 서열로부터 단백질이 어떻게 접힐지 예측하는 것과 같다.

 

단백질 접힘을 실험적으로 알아내는 방법은 대표적으로 엑스선 결정학, 핵자기공명 분광학, 저온 현미경을 이용하는 방법이 있다. 하지만 이 방법들로 단백질 접힘을 밝히려면 짧게는 몇 달, 길게는 몇 년이 걸리고 비용이 많이 든다. 이런 이유로 컴퓨터 시뮬레이션과 모델링을 활용해 단백질 접힘을 예측하는 연구가 이뤄지고 있다.

 

CASP는 존 몰트 미국 메릴랜드대세포생물학 및 분자유전학과 교수의 주도로 1994년부터 시작해 2년마다 열리는 단백질 구조 예측 대회다. CASP 조직위원회는 대회가 열리는 해 여름부터 매일 1~2개씩 아미노산 서열을 공개해 대회가 열리기 전까지 총 100개 정도의 문제를 낸다. 자동화 서버를 이용하는 참가자는 3일, 직접 예측하는 참가자는 2주 안에 단백질 구조를 예측해 제출해야 한다. 조직위원회는 10월 말쯤 참가자가 제출한 예측 정확도를 평가해 대회 기간 중 결과를 발표한다. 

 

CASP 조직위원회는 제출한 답안을 템플릿 기반 구조 예측, 템플릿 프리 구조 예측, 인접 아미노산 예측, 정밀화, 복합체 구조, 구조 정확도, 연구 활용성으로 나눠 평가한다. 답안에 제시된 단백질 구조와 실제 구조를 비교해 상대 점수를 매긴다. 템플릿은 이미 알려진 아미노산 서열과 이 서열에 따라 만들어진 단백질 구조에 관한 자료로, 템플릿이 없는 단백질은 ‘템플릿 프리 구조 예측’ 항목에서 평가한다.

 

올해 14회를 맞은 CASP는 11월 30일부터 12월 4일까지 5일 동안 온라인으로 열린다. 딥마인드를 비롯해 마이크로소프트, 중국의 미디어 기업인 텐센트를 비롯해 약 100개 팀이 참가했다. 

 

●2년 동안 일취월장한 알파폴드

 

전기적으로 양성을 띠는 아미노산은 음성을 띠는 아미노산과 인접해 있을 가능성이 높고, 이런 경향이 단백질 구조에도 영향을 미친다. 딥마인드가 개발한 알파폴드는 딥러닝에 기반한 강화학습을 이용해 인접한 아미노산 사이의 규칙성을 찾아 단백질이 어떻게 접힐지 예측하는 AI다. 아미노산 서열을 입력하면 학습한 데이터를 통해 아미노산 사이의 거리와 각도를 예측하고 이를 기반으로 3차원 형태의 단백질 구조를 보여준다.

 

CASP의 평가 위원 중 한 명인 석차옥 서울대 화학과 교수는 “알파폴드2는 알파폴드1 보다 많은 단백질 구조 데이터를 학습했고, 딥러닝 방식도 다르다”며 “딥마인드가 미리 제출한 3쪽 분량의 초록을 토대로 추측해 보면 알파폴드1이 아미노산 2개의 상호작용에 주목한 반면 알파폴드2는 좀 더 많은 아미노산의 상호작용에 초점을 맞춘 것 같다”고 설명했다. 

 

알파폴드2의 비약적인 성장은 화학뿐 아니라 신약 개발에도 큰 도움이 되므로 반갑지만, 일반 연구실에서 쉽게 활용할 수는 없다. 석 교수는 “평가 결과를 보면 알파폴드2의 예측 기법을 빨리 배워서 단백질 구조 예측 연구에 동참하고 싶은 마음이 든다”면서도 “국가의 지원이 없는 한 알파폴드2 운영에 필요한 설비를 일반 연구실이 갖추기는 힘들다”고 말했다.

 

CASP 두 번째 날에는 존 점퍼 딥마인드 연구원이 알파폴드2가 활용한 딥러닝 방식에 대해 설명할 예정이고, 마지막 날에는 데미스 허사비스 딥마인드 CEO의 키노트 발표가 예정돼 있다.

관련 태그 뉴스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

9 + 3 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기