비과학 상식
정크 DNA의 비밀
외계인 마틴
2011. 6. 30. 00:28
2000년대 초 국제컨소시엄인 인간게놈프로젝트(Human Genome Project, HGP)와 셀레라 게노믹스는 인간의 유전자 지도(genetic map) 초안이 완성되었다고 공동 발표했다. 유전자 지도 완성은 수억 년 진화의 결정체인 인간이 자신의 생물학적 위치를 확인하고, 스스로 미래의 방향을 모색할 수 있는 엄청난 업적이라 할 수 있다.
유전자 지도는 염색체(chromosome) 안에 어떤 유전자가 어느 위치에 있는지를 표시한 것으로 이를 통해 피부나 머리털의 색, 외형 등을 결정하는 유전자가 어떤 염색체의 어느 위치에 있는지 알 수 있다. 염색체는 모양과 크기가 같은 염색체가 2개씩 존재하므로 -정상적인- 모든 생물의 염색체 수는 짝수이다. 인간은 23쌍의 염색체를 구성하는 DNA(Deoxyribo Nucleic Acid)에 유전정보가 담겨 있다.
그림출처 : http://nanotechweb.org
유전정보(genetic information)는 자식에게 물려줄 부모의 성질에 관한 양식이므로, 이를 담은 DNA가 곧 각 생물의 특성과 생명방식까지 결정하는 유전자의 본체라 할 수 있다. 그래서 유전자 지도는 DNA에 담겨 있는 각각의 유전정보가 염색체상에서 차지하는 위치 지도를 작성한 것이며, 생물의 세포 속에 있는 DNA는 생명활동에 필요한 효소 등 각종 단백질의 생산을 지령하고 제어하는 암호 구실을 한다. 이 암호는 DNA가 가진 아데닌(A)·타이민(T)·구아닌(G)·사이토신(C) 이라는 4종류 염기의 배열 차이로 표현된 정보이다. 즉 유전자는 DNA라는 디스크에 네 종류의 염기를 이용하여 고유 언어로 기록한 생명구동 프로그램이며, 무형의 정보(CODE)이다.
DNA는 염기(A,T,G,C)와 디옥시리보스(deocyribose)와 인산기(Phosphate)로 구성된 뉴클레오티드(nucleotid)라는 분자가 사슬 형태로 길게 이어진 것으로 사람의 46개 DNA는 총 120억 개의 뉴클레오티드 분자로 구성되어 있다. 2003년 4월 HGP가 99.99%의 정확도로 완성했다고 발표한 인간게놈지도를 따르면 인간의 염색체에는 약 30억 7천만 개의 염기쌍이 있는데, 이중 유전자는 겨우 2만 5천~3만 2천 개에 불과하다. 즉 사람의 DNA에서 유전정보를 가진 엑손(exon) 부분은 겨우 몇 %에 지나지 않는다. 그래서 많은 학자는 유전체 DNA 내에서 어떤 유전정보도 담당하지 않는 것으로 생각하는 인트론(intro) 부분을 불용DNA라고 부르고 있다.
어떤 면에서 보면 그것은 사실이다. 그러나 그건 전체 유전자 코드를 잘못된 기준에서 해석하여 일어난 착오이다. 복잡한 암호가 단순히 한 가지 언어(CODE)로만 이루어졌을 거라는 일방적인 착각이 불러온 결과이다. 그래서 유전정보에 지대한 영향을 미치는 거대한 정보 덩어리는 단순한 반복순서로 이루어진 불용DNA로 분류되었고, 심하면 정크 DNA(junk DNA) 즉 쓰레기 정보라는 취급까지 받고 있다. 일반적으로 고등생물 세포일수록 불용DNA가 많고, 효모와 같은 하등 진핵생물은 불용DNA가 적으며, 세균류에는 아예 존재하지도 않는다. 그렇다면 쓰레기가 대부분을 차지하는 인간은 세균류보다 유전정보를 잘 정리하지 못하는 것일까?
그림출처 : http://www.lex-usa.com
그것은 DNA지도 작성이 유전정보를 ‘해석했다.’라는 말로 착각한 것에서 비롯된 오해일 뿐이다. 하나의 웹페이지를 소스로 보면 HTML이나 자바스크립트, 이미지, 동영상, 플래시 등 서로 다른 여러 형식의 파일과 코드가 조합되어 하나의 페이지를 구성함을 알 수 있다. 우리의 유전자 해석은 그 소스에 사용된 코드 배열을 찾아내고, 코드의 번역(translation)과 발현을 테스트하여 기능 일부를 유추한 것에 지나지 않는다. 우리는 유전 정보 코딩에 사용한 언어를 아는 것이 아니다. 다만, 소스를 구성한 태그(tag)와 메소드(method)를 통해 일부 뜻을 짐작하는 것이다. 우리를 구성하는 코드는 매우 복잡하고 정교하며 수많은 다른 언어(형식)의 코드가 섬세하게 얽혀 있다. 웹페이지는 숫자와 문자, 기호로 이루어져 있지만, 인간의 유전자는 거기에 위치와 형태, 구조와 크기, 그리고 시공간(space-time)에 관한 배치까지 포함한 복잡한 코드이다.
우리 유전자 코드는 그 자체가 전체가 아니다. HTML에서 EMBED나 OBJECT 명령으로 외부 동영상 파일을 스트리밍(streaming) 하듯 유전자 코드는 완전히 독립된 채로 완성된 지도가 아니라 외부의 정보를 링크하거나 스트리밍 하여 받아들이고, 재생하여 사용하고 있다. 우리 유전자는 지나치게 복잡해지거나 방대해고 중복되어 사용되는 코드는 단순화시켜서, 자바스크립트의 Js 파일처럼 독립된 코드로 분리해 우리가 쓰레기라 여기는 정크 DNA 안에 담아두고 있다.
물론 성체가 된 생물에 정크 DNA는 정말 정크가 될 수도 있다. 그러나 정자와 난자에서 정크를 제거해버린다면 완전한 2세 생물이 만들어질까? 아니다. 하드웨어가 완전할지라도 그를 구동하는 소프트웨어에는 심각한 결함이 생긴다. 생물체의 롬(ROM: Read Only Memory)에는 본능을 총괄하는 정보가 담겨 있는데 지능이 발달한 생물일수록 롬보다는 유전자라는 무한 하드디스크에 더 많은 정보를 효율적으로 저장하고, 그 정보를 고스란히 2세에 물려주는 기술개발에 치중하는 편이다. 그래서 -나중에 이야기하겠지만-유전자에는 소프트웨어와 하드웨어의 효율적인 연결과 고유의 기능은 가지기도 하는 독특한 형태의 램(RAM: Random Access Memory)이 45%를 차지하고 있다. 유전자가 불안정한 생물은 하드웨어가 온전할지라도 이 사이의 연결과 통신이 불완전하여 정상적인 상태를 유지하기 어렵다.
그림출처 : http://www.iontorrent.com
생물이 더 고등하거나 하등 하다는 구분은 어렵다. 또 그 기준을 유전자에 둘 수도 없다. 인류가 파리보다 유전자 수가 부족하므로 더 열등하다 할 수도 없고, 동물이 식물보다 고등생물이라 하지도 못한다. 다만, 더 지적인 생물은 유전자의 구조를 단순화하고, 더 많은 방식과 형태로 유전정보를 기록한다. 사람은 비교적 적은 수의 유전자를 가졌음에도 많은 정보를 단순하게 정리하는 법을 개발하고 적용하여 성능이 떨어지는 하드웨어를 잘 제어하게끔 진화하였다. 그러다 보니 하드웨어와 정보를 통합 제어하는 칩셋(chipset)인 두뇌는 더욱 이상적으로 발전하였고, 그것이 다시 효율적인 코드계발로 이어졌다. 그래서 현재 지구에서 유전자 코드에서 가장 많은 파일을 로드하고 링크하는 것은 사람이다.
정자나 난자에 들어 있는 DNA량, 즉 반수(半數)의 염색체 한 조가 갖는 DNA의 총량을 C값이라고 한다. 일반적으로 진화한 생물일수록 C값이 커지지만, 개구리는 사람의 C값보다 크다. 반드시 진화의 정도와 C값이 비례하지 않는 것(paradox of C value)이다. C값은 그것이 ‘중복된 정보인가?’, ‘정보의 질과 순수성은 어떤가?’를 떠나 DNA의 총량만을 비교한 것이다. C값의 크기도 중요하지만, 그것을 얼마나 체계적으로 요약 정리하였는가도 매우 중요하다. 그리고 그것의 사용성과 사용빈도도 중요하다. 그래서 C값의 크기보다는 그것을 얼마나 효율적으로 정리하고 적절하게 하이퍼 링크하느냐가 고등생물의 척도가 된다. 그리고 얼마나 자주, 잘, 코드를 관리하고, 그 코드를 활용하는 프로그램을 버전업(version-up)하고, 실사용(release) 하는가도 중요하다.
원시 생물의 코드는 거의 기계어에 가깝다 보니 간결하기는 한데 그것이 생물에 잘 맞지 않아 정보해석 과정에서 문제가 발생한다. 인간은 스스로에 적당한 언어를 이백만 년에 걸쳐 개발하였고, 마침내 지금에 이르렀다. 2백만 년 전에 두 개의 염색체를 하나로 결합한 획기적인 시도로 일부의 침팬지는 그와 전혀 다른 종족의 시조가 되었다. 이는 단순한 우연이 아니라 끊임없이 새로워져야만 생존한다는 오래된 기억 덕택이다. 그리고 다시 도전하며 이어진 작은 발현과 표현들로 인간은 최소의 변화로 최대의 효과를 발휘해오고 있다. 침팬지는 34억 개의 염기로 이뤄진 48개의 염색체를 가졌고, 그 중 98.77%가 인간과 같은 구조로 돼 있지만, 멸종에 이르기까지 침팬지일 뿐이다. 2백만 년 동안 발버둥치며 얻어낸 1.23%의 미묘한 차이가 바로 인간을 인간이게 하고 있다.
그림출처 : http://truthopia.wordpress.com/
좀 더 정확히 따지자면 지금 인간의 유전자는 3만 년 전에 네안데르탈인(Neanderthal man) 시스템을 확연히 개선하여 이후 조금씩 디버깅(Debugging)하고 패치(patch) 한 v3.937이라고 하겠다. 같은 하드웨어라도 그를 얼마나 잘 알고 잘 구동하느냐에 따라 엄청난 차이가 날 수 있다. 인간이 인간이 될 수 있는 건 소프트웨어 차원의 문제이다. 30억 개 염색체 속에 있는 정보를 해독(번역)하여 불러들이는 소프트웨어의 발전과 다시 그 소프트웨어에 빠르게 응답(코딩)하게끔 진화한 DNA를 새롭게 배열한 덕분에 인간은 지성을 가지게 되었다.
본론으로 돌아가 한 개체의 주요 정보는 여러 과정을 거쳐 정리하여 정크 DNA(이하 ‘정크’라 한다)에 내려받는데 정크는 그것을 다시 원격으로 서버(Server)에 등록한다. 서버는 이를 받아 누적하고 정리한 다음, 새로운 진화 방향을 설계하여 축적한다. 이 정보는 다시 원격으로 인류의 정크 서버에 전송되어 다음 세대에 반영된다. 참고로 여기서 말하는 서버는 하나의 독립된 개체나 장소가 아니다. 살아있는 모든 인류의 정크는 아주 조금씩 잉여 자원을 공유하는데 이게 합쳐져 하나의 메인프레임(mainframe)을 이룬다. 물론 그를 제어하는 소프트웨어도 이렇게 유기적으로 연결되어 거대지성을 이루고 있다.
그 예로 텔로미어(telomere, 말단소체)는 염색체의 끝은 보호하는데 이것의 수명에 따라 세포 분열 횟수, 즉 생명체의 수명이 정해진다고 할 수 있다. 텔로미어는 오랜 진화 과정에서 얻은 경험을 바탕으로 한 종족의 적정 개체 수를 조절하는 역할을 하며, 이는 텔로머레이즈(telomerase)라는 효소에 의해 합성된다. 그런데 델로머레이즈는 생명체의 염원을 담은 DNA를 보호하는 텔로미어를 합성하면서도 각 개체의 DNA가 아닌 독립된 기관, 즉 메인프레임(mainframe)의 명령을 받고 수행하기 위한 RNA를 가지고 있다. 그래서 개체의 과욕을 원천적으로 차단해 개체 수를 조절한다.
다시말해 DNA에서 RNA로 정보가 복사되는 전사(transcription)와 그 정보에 따라 단백질이 만들어지는 번역 과정이 오직 생명 개체의 의지대로만 이뤄지는 것이 아니라 종족의 공동지성인 메인프레임의 통제에 따라 전사되는 과정에서 염기가 조작되어 DNA의 소망과 달라진 변이가 RNA에 일어난다는 것이다. 이는 텔로미어뿐만 아니라 X염색체 등, 개체의 특성이 나타나는 대부분의 정보에서 이뤄지므로, 개인과 민족, 인종, 시대 등에 따라서 천만 개 이상의 게놈 변이가 나타나는 경우도 있다.
한 개체에서 정크가 담은 정보가 사라진대도 그의 생존은 위협받지 않는다. 그래서 정크는 정말 정크처럼 보인다. 그러나 모든 인류에게서 정크를 제거하면 어찌 될까? 인류는 공통의 진화방향을 잡지 못하고, 서로 연결되지 못하므로 묘한 불일치감을 느끼게 될 것이다. 그래서 점차 서로 경계하기 시작하여 짝짓기를 이루어지기 어렵게 된다. 또한, 다음 세대로 갈수록 인류는 각각 다르게 발현한 표현형으로 동질성이 떨어지고, 개체별로 심한 이질감이 나타나 각기 다른 방향으로 나아가거나 퇴보하다가 결국 멸종에 이를 것이다.
그림출처 : http://www.templeton-cambridge.org
앞으로도 인간이 나아갈 길은 까마득히 멀다. 백만 년 전에 비하면야 많이 발전했다 할 수 있으나, 인간은 자신 안에 있는 자원의 10%도 제대로 활용하지 못하는 중이다. 굳이 진화발생생물학(Evolutionary Developmental Biology)을 예로 들지 않더라도 생물이 어느 정점에 서면 얼마나 많은 정보를 획득하느냐보다는 얼마나 가진바 정보를 잘 활용하고, 활용하는 새로운 방법을 익히는가가 진화의 방향이 되고, 성패를 좌우하게 된다. 한 예로 수억 년 전에 인류의 고대 조상이 지구가 급격한 환경변화로 강력한 우주선에 노출되었을 때 이에 대응하려고 그것에 저항력을 갖춘 우주유영(space walk) 바이러스로부터 받아들인 트랜스포존(Transposon)이라는 이동유전자가 있다.
지금 인류에게 이것은 엑손 뒤섞기(exon shuffling) 등으로 돌연변이나 일으키는 분자 기생물 정도로 취급받지만 사실 돌연변이는 무작위가 아니라 정교하게 계산된 랜덤으로 발생하며 표현된다. 그리고 도약유전자(Jumping gene)라는 이름처럼 정보와 정보를 연결하고, 하드디스크의 정보를 번역해 발현하는 데 전달자 역할을 하며, 그 과정에서 획득한 정보를 축적해 유전자에 전달하는 RAM 구실을 한다. 그리고 이것은 수십억 년이 지난 지금까지도 우주를 유영하던 시절의 고유한 능력을 고스란히 지니고 있으므로, 인간 유전정보의 상당수를 차지한 이를 잘만 제어하여 발현시킬 수 있다면 인류는 우주여행을 매우 쉽게 할 수 있을 것이다.
우주의 어느 한 종족은 짧은 진화 역사만 가졌음에도 자신의 유전 정보를 잘 이해하여 필요한 부분을 즉시 발현하고, 표현할 수 있는 능력을 지니고 있다. 아마도 다중쌍성(multiple binary star)을 공전하는 이심률이 심한 행성을 고향으로 삼은 덕분이리라. 그래서 그들은 웬만큼 가혹한 환경이 아니라면 수분에서 수일 안에 자신의 신체를 환경에 대비한 형태로 변형하여 무리 없이 생존할 수 있다. 어떤 때에는 세포구조까지 식물과 비슷한 형태로 변형하여 고착하며 지내다가 어떤 때에는 날개를 만들거나 아가미와 지느러미를 지니기도 하고, 네 개의 튼튼한 다리나 두꺼운 각갑(脚甲)의 껍질로 무장하기도 한다. 때론 수백 년 동안 암석 형태로 동면하며 생명을 보존하기도 한다. 현재 우주를 유영하는 종족 중에는 이런 변환생물이 많으며, 그 대부분은 인류처럼 ‘외래 인자’를 받아들인 DNA를 가졌다.
그림출처 : http://chandra.harvard.edu
어떤 이는 DNA야말로 가장 쓸모없는 진화의 자취를 고스란히 보존한 가장 훌륭한 흔적기관이라고 한다. 그러나 DNA야말로 치열한 진화 과정을 보여주는 가장 훌륭한 역사서이자 지식의 보고이며, 이를 얼마나 바르게 활용하는가에 따라 인류의 미래는 결정되는 것이다.
-끝
- 상식 수준의 지식으로 작성한 글이라 분명 오류가 있을 겁니다만 SF관점서 재미로 보셨길 바랍니다.
- 이런 글은 쓰는 사람이나 읽는 사람 모두의 머리를 뽀개지게 합니다.