주메뉴바로가기.. 본문바로가기

‘정크 DNA’는 정말 쓰레기통에 버려야 할 개념인가?

네이버밴드 구글플러스

2013년 05월 22일 09:44 프린트하기

 

2012년 9월 6일자 ‘네이처’가 엔코드 프로젝트의 연구결과를 소개하면서, 정크 DNA가 폐기해야할 용어라는 기사가 다음날 ‘사이언스’에 실렸다. 그러나 지난 4월 2일 ‘미국립과학원회보’에는 엔코드 결과를 비판하는 글이 실려 정크 DNA를 둘러싼 논쟁이 계속되고 있다. - 강석기 제공
2012년 9월 6일자 ‘네이처’가 엔코드 프로젝트의 연구결과를 소개하면서, 정크 DNA가 폐기해야할 용어라는 기사가 다음날 ‘사이언스’에 실렸다. 그러나 지난 4월 2일 ‘미국립과학원회보’에는 엔코드 결과를 비판하는 글이 실려 정크 DNA를 둘러싼 논쟁이 계속되고 있다. - 강석기 제공

  “지금까지 정크(junk)라는 말은 개체의 수준에서 자연선택으로 그 존재 이유를 합리적으로 설명할 수 없는 DNA를 나타내기 위해 사용해왔다.”(W. 포드 두리틀)

  학창시절 물리학 시간에 전류의 방향이 전자가 실제로 움직이는 방향과 반대라는 얘기를 듣고 의아해했던 기억이 난다. 전자가 흐르는 방향을 전류의 방향으로 정하면 될 텐데 굳이 반대방향으로 해서 헷갈리게 할 이유는 뭘까.


  물론 나중에야 그 이유를 알게 됐다. 프랑스 과학자 앙페르가 전류를 양전하의 흐름으로 정의하고 나서 거의 한 세기가 지나서야 전자가 발견됐기 때문이다. 그런데 전자는 음전하라는 것. 50%의 확률에서 잘못 찍은 셈이다. 물론 양전하가 시계방향으로 흐르는 걸로 보나 음전하가 시계반대방향으로 흐르는 것으로 보나 관계식에는 영향을 주지 않는다.


  이처럼 어떤 현상에 대한 깊은 지식이 없는 상태에서 이름을 붙이다보면 나중에 좀 아쉽거나 곤란한 일이 생기기 마련이다. 최근 생명과학에도 비슷한 일이 있었는데 바로 ‘정크(junk)’ DNA, 즉 ‘쓰레기 DNA’라는 용어의 운명이다.


●1972년 논문에서 처음 등장


  20세기 후반 게놈 분석 기술이 확립되면서 과학자들은 많은 진핵생물의 게놈에서 실제 유전자가 차지하는 부분은 얼마 되지 않는다는 사실을 발견했다. 예를 들어 사람의 게놈은 박테리아 게놈보다 대략 1000배나 더 크다. 그렇지만, 유전자도 1000배가 되는 것은 아니다. 겨우 10배 정도라는 것이 후일에 밝혀졌다.


  정크 DNA라는 용어는 1928년 한국에서 태어난 일본인으로 훗날 미국 시민이 된 분화진화학 분야의 거장 스스무 오노가 1972년 발표한 논문에서 처음 사용됐다. 당시 오노는 포유류의 게놈에서 특별한 기능이 없는 부분을 표현하기 위해 이 용어를 만들었다. 그리고 1980년 유명인사인 레슬리 오르겔과 프랜시스 크릭은 ‘네이처’에 기고한 리뷰 논문에서 정크 DNA를 “게놈 안에서 이기적인 DNA 서열이 존재하는 건 숙주의 몸속에 아주 해롭지는 않은 기생충이 들어 있는 것과 비교될 만하다”고 언급하면서 유명해졌다. 즉 우리 게놈에는 쓸데없는 기생충 같은 정크 DNA가 넘쳐난다는 말이다.


  정크 DNA의 원천은 다양한데 가장 큰 부분을 차지하는 것은 1940년대 식물유전학자 바바라 매클린톡이 처음 발견한 전이인자(transposable element)다. 사람 게놈의 40% 이상이 전이인자로 알려져 있다. 그리고 게놈에 박혀있는 바이러스 서열인 내인성 레트로바이러스(endogenous retrovirus)도 8%가 넘는다. 이런 서열들은 대부분 쓸데없는 짓을 하지 못하게 발현이 억제돼 있다.


  이런 사실은 2000년 인간게놈프로젝트에서 게놈 초안이 발표되면서 확증됐다. 게놈에서 유전자는 바다 위에 떠있는 섬 또는 사막의 오아시스처럼 끊임없이 반복되는 무의미한 염기서열 가운데서 불쑥 나타나는(그것도 대부분 인트론이라는 무의미한 서열이 끼어들어가 조각난 상태로) 그런 반가운 존재였다. 당시 언론은 게놈에서 1.5%를 차지하는 유전자를 뺀 나머지 98.5%를 정크DNA라고 불렀고 이 자극적인 말은 대중의 귀에도 쏙 들어와 이제는 익숙한 용어가 됐다.


●유전자 발현에 광범위하게 관여

 

종에 따라 게놈 크기는 천차만별이다. 이는 정크DNA의 양이 다르기 때문이다. 정크DNA의 존재 이유가  유전자 발현조절 기능이라고 한다면 이런 현상을 설명하기 어려워 진다. 세로축(위에서부터): 현화식물, 조류(鳥類), 포유류, 파충류, 양서류, 경골어류, 연골어류, 극피동물, 갑각류, 곤충, 연체동물, 환형동물, 사상균, 조류(藻類),  곰팡이, 그람양성균, 그람음성균, 마이코플라스마 - 사이언스 제공
종에 따라 게놈 크기는 천차만별이다. 이는 정크DNA의 양이 다르기 때문이다. 정크DNA의 존재 이유가  유전자 발현조절 기능이라고 한다면 이런 현상을 설명하기 어려워 진다. 세로축(위에서부터): 현화식물, 조류(鳥類), 포유류, 파충류, 양서류, 경골어류, 연골어류, 극피동물, 갑각류, 곤충, 연체동물, 환형동물, 사상균, 조류(藻類),  곰팡이, 그람양성균, 그람음성균, 마이코플라스마 - 사이언스 제공

  그런데 지난해 가을, 정크DNA의 대반란이 일어났다. ‘네이처’ 9월 6일자에 엔코드(ENCODE) 프로젝트의 연구결과가 무더기로 실렸는데, 이때 가장 부각된 것이 바로 정크DNA의 재발견이었다. 엔코드는 ‘DNA요소백과사전(ENCyclopedia Of Dna Elements)’의 줄임말로 유전자 뿐 아니라 게놈을 이루는 전체 DNA를 분석하는 방대한 작업이다.


  연구에 따르면 그동안 무의미하다고 생각했던 염기서열의 상당부분이 유전자의 발현을 조절하는 역할을 하고 또 실제 전사가 일어나 RNA가닥을 만든다는 사실이 밝혀졌다. 여러 조직에서 얻은 140여 가지 유형의 세포를 분석한 결과 유전자가 아닌 영역의 활동이 세포에 따라 달랐고 이는 곧 이들 영역의 활동유무가 각 세포의 특성에 영향을 미침을 시사했다.


  연구자들은 이 결과가 시작에 불과하며 앞으로 데이터가 더 나오면 게놈에서 쓰레기라고 치부됐던 유전자가 아닌 부분의 존재이유가 더 분명히 드러날 것으로 내다봤다. 이 결과에 대한 학계의 반응도 폭발적이어서 미국 하워드휴즈의학연구소의 조셉 엑커 박사는 당시 ‘네이처’에 기고한 글에서 “게놈의 80%가 생화학적 기능과 연관된 인자(elements)를 갖고 있다는 이번 연구결과는 사람 게놈이 대부분 ‘정크DNA’라는 기존에 널리 받아들여지는 관점을 전복시켰다”라고 쓰고 있다. ‘사이언스’ 9월 7일자에 엘리자베스 페니시 기자가 이 연구결과를 소개한 기사의 제목도 인상적이다. ‘엔코드 프로젝트, 정크DNA에 대해 조사(弔詞)를 쓰다(ENCOCE Project Writes Eulogy For Junk DNA).’ 급기야 지난 연말 ‘사이언스’는 2012년 과학 10대 뉴스 가운데 하나로 엔코드 프로젝트의 연구성과를 뽑기도 했다.


  수년 동안 ‘비유전자(non-coding) DNA’의 예상치 못한 기능을 밝힌 논문들을 보면서 게놈이 상상 이상으로 복잡한 대상임을 절감하고는 있었지만, 엔코드 연구결과에 대한 반응을 보면서 좀 지나친 게 아닌가 하는 생각이 들었다. 물론 과거 쓰레기라고 여겼던 영역에서 기능을 갖는, 즉 세포 더 나아가 개체인 사람의 생존에 도움이 되는 역할을 하는 부분이 있다는 건 혁신적인 발견이지만 그렇다고 ‘게놈에서 버릴 게 없다’는 식의 해석은 수긍하기가 어려웠다. 물론 어마어마한 데이터를 바탕으로 한 논문들을 제대로 이해하지 못해서였겠지만.


  필자가 생명과학의 혁명에 적극 동참하지 못하고 삐딱한 시선을 보내는 건 2000년대 중반 대학원 시절 경험 때문일 수도 있다. 차라리 아무 것도 모르면 변화를 그냥 받아들일 텐데 어설프게 알면 그것도 지식이라고 이렇게 저항을 하게 되는 것인지도 모르겠다. 당시 필자는 애기장대라는 식물의 특정 유전자 기능을 규명하는 분자유전학 연구를 하고 있었다. 애기장대는 모델식물로는 적당한데, 일생이 짧고(빛이나 온도 조건에 따라 한두 달에서 서너 달) 게놈 크기도 ‘불과’ 1억2000만 염기쌍으로 적기 때문이다(그래서 2000년 식물로는 처음 게놈이 해독됐다).


  당시 필자는 애기장대 게놈DB를 종종 들여다봤는데 어느날 유전자를 검색하다가 문득 ‘사람 유전자를 연구했으면 화면이 많이 달랐겠다’는 생각을 했다. 즉 애기장대 게놈도 유전자가 띄엄띄엄 존재하지만 사람 게놈이었다면 그 빈도가 훨씬 희박했을 것이기 때문이다. 사람은 32억 염기쌍에 유전자가 2만1000개가 채 안 돼 2만7000여개인 애기장대보다도 적다.


  그런데 이런저런 논문들을 읽다보니 벼의 경우는 게놈크기가 4억 염기쌍이고 밀의 경우는 170억 염기쌍이라는 걸 알게 됐다. 반면 유전자 개수는 애기장대보다 약간 많은 수준이다. 즉 유전자가 아닌 DNA의 비율이 종에 따라 천차만별이라는 말이다. 그런데 이번 엔코드의 연구결과처럼 이들 DNA도 대부분 어떤 역할을 하는 것이라면, 쌍떡잎식물인 애기장대는 빼더라도 외떡잎식물에 같은 벼과(科)인 벼와 밀의 엄청난 게놈 크기 차이는 어떻게 설명해야 할까.


  두 식물 사이에 그렇게 큰 차이가 있는 것 같지도 않는데 밀은 비유전자 DNA가 왜 그렇게나 많이 필요했던 것일까. 물론 이런 고민은 정크DNA가 쓰레기가 아니라고 전제했을 때 생긴다. 이에 대해 엔코드의 결과는 사람의 게놈에 대한 것이고 밀의 엄청난 정크DNA는 진짜 쓰레기라고 생각할 수도 있겠지만 이건 맘에 안 든다.


●엔코드 프로젝트의 해석은 과장?

 

  그런데 ‘미국립과학회보(PNAS)’ 4월 2일자에 무척 흥미로운 글이 한 편 실렸다. 캐나다 댈하우지대 생화학-분자생물학과 포드 두리틀 교수가 기고한 비평으로 글 제목이 거의 기사 제목 수준이다. ‘정크DNA는 터무니없는 말인가? 엔코드 비판(Is junk DNA bunk? A critique of ENCODE)’. 읽어보니 지난 반년동안 필자가 고민했던 바로 그 내용을 다루고 있었다. 그것도 필자의 입장에서!

  알고 보니 엔코드의 주장이 지나치다고 생각하는 생명과학자들이 꽤 되는 듯하다. 두리틀 교수는 동물의 예를 설명하면서 사람만이 정크DNA가 쓰레기가 아닌 예외적인 존재라는 건 ‘게놈 인간중심주의(genomic anthropocentrism)’이라고 꼬집었다. 즉 폐어의 경우 게놈 크기가 무려 1300억 염기쌍으로 사람의 40배에 이르는 반면 같은 어류인 복어는 4억 염기쌍도 되지 않는다. 즉 사람의 정크DNA에 의미를 부여하려면 이들 생물체의 정크DNA에도 의미를 부여해야 되는데 말이 안 된다는 것.


  그는 엔코드의 발견이 놀랍다는 건 인정하면서도 그 해석은 게놈에 대한 여러 오해와 오개념에서 비롯됐다며 조목조목 반박하고 있다. 예를 들어 전이인자나 인트론 안에 유전자발현을 조절하는 부분이 들어 있다고 해서 전이인자나 인트론 전체가 기능을 갖는 건 아니라는 것. 또 정크DNA의 절반 이상이 RNA로 전사가 된다는 데이터 역시 그 전사체가 유전자 발현조절에 어떤 기능을 하는 걸 의미하지는 않는다고 말한다. 즉 잡음(noise)일 가능성이 크다는 것. 결국 정크DNA에서 일부분은 진핵생물 게놈의 진화에서 큰 역할을 했겠지만 그럼에도 (특히 게놈이 큰 종에서) 대부분은 그냥 그 자리에 있는, 즉 존재 이유를 설명할 수 없는 쓰레기라는 것이다.


●불과 8200만 염기쌍인 통발 게놈

통발 게놈의 진화 과정을 도식화 했다. 2배체인 조상에서 유전자 10개가 있는 부분(a. 염색체는 쌍으로 있으므로 하나만 표시)에서 전체게놈복제(WGD)가 일어나 4배체가 됐고(b. 유전자 20개) 뒤이어 중복된 유전자 일부가 소실됐다(c). 두 번째 WGD가 일어나 8배체가 됐고(d. 유전자 32개) 뒤이어 중복된 유전자 일부가 소실됐다(e). 세 번째 WGD가 일어나 16배체가 됐고(f. 유전자 32개) 뒤이어 중복된 유전자 일부가 소실됐다(g). 정크DNA가 제거되면서 게놈 크기가 작아졌다(h). - 네이처 제공
통발 게놈의 진화 과정을 도식화 했다. 2배체인 조상에서 유전자 10개가 있는 부분(a. 염색체는 쌍으로 있으므로 하나만 표시)에서 전체게놈복제(WGD)가 일어나 4배체가 됐고(b. 유전자 20개) 뒤이어 중복된 유전자 일부가 소실됐다(c). 두 번째 WGD가 일어나 8배체가 됐고(d. 유전자 32개) 뒤이어 중복된 유전자 일부가 소실됐다(e). 세 번째 WGD가 일어나 16배체가 됐고(f. 유전자 32개) 뒤이어 중복된 유전자 일부가 소실됐다(g). 정크DNA가 제거되면서 게놈 크기가 작아졌다(h). - 네이처 제공

  ‘네이처’ 5월 12일자 온라인판에는 식충식물인 통발의 게놈 해독에 관한 연구논문이 실렸다. 통발의 게놈은 애기장대보다도 작은데 유전자 개수는 2만8500여개로 오히려 약간 더 많다. 즉 통발의 게놈이 이렇게 작은 건 유전자가 적어서가 아니라 정크DNA가 그만큼 적기 때문이라는 말이다.


  연구자들은 게놈을 분석해 통발의 진화를 역추적했는데 이에 따르면 통발은 세 차례에 걸쳐 전체 게놈의 복제가 일어났다고 한다.


  즉 16배체라는 말이다. (배수성에 대한 자세한 내용은 과학카페 106 ‘곡물 게놈 해독이 동물 것보다 복잡할까?’(http://www.dongascience.com/news/view/38/news) 참조) 그럼에도 게놈 크기가 커지지 않은 건 복제된 유전자 대다수가 사라졌고 이 과정에서 정크DNA 부분도 없어지는 쪽으로 진화가 일어났기 때문이라고 한다.


  연구자들은 논문 말미에서 “동물처럼 복잡한 개체에서 비유전자 DNA의 중요한 기능적 역할을 강조한 최근 논문들과는 대조적으로, 현화식물을 만드는데 필요한 게놈은 비유전자 ‘암흑물질(dark matter)’에 있는 숨은 조절인자를 많이 요구하는 것 같지 않다”고 결론짓고 있다. 이래저래 정크 DNA라는 개념을 쓰레기통에 버리기에는 아직 이르다는 생각이 든다.

네이버밴드 구글플러스

2013년 05월 22일 09:44 프린트하기

태그

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

6 + 7 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

관련 태그뉴스