인간 유전체 기능연구의 소개

     

인간 유전체 기능연구의 소개
Introduction of human genome function research

질병관리본부 국립보건연구원 유전체센터 바이오과학정보과            
반효정           
  


Ⅰ. 들어가는 말
    인간게놈프로젝트(Human Genome Project; HGP)는 1980년대 말 미국 국립보건원과 유럽, 일본 등 선진국들이 참여해 인체 게놈 사업기구(HUGO)라는 별도의 국제 학술회의가 결성되어 시작된 프로젝트이다. 2001년 2월 11일에 완료된 인간게놈프로젝트는 성인 남성 1명의 DNA 샘플을 이용해 인간 게놈 99%의 지도를 완성하였지만 샘플 수가 적어 유용성의 문제가 끊임없이 제기되어 왔다. 또한 인간 지도를 완성하게 되면 유전자 정보를 분석하여 질환 치료에 많은 도움을 줄 것이라는 기대와는 다르게 질병  치료에 실제적인 큰 도움을 주지는 못했다. 기존 인간게놈프로젝트의 한계를 보완하기 위하여, 1000명을 대상으로 인간 유전체를 다시 자세히 분석해 보자는 취지의 1000 유전체 프로젝트(1000 Genomes Project)가 2008년에 시작되었다. 2001년도에 완성된 게놈 프로젝트의 DNA 염기 해독 기술을 그대로 사용하면 이번 프로젝트의 비용은 대략 5억 달러의 비용이 소요되지만 발전된 최신의 해독기술[1]과 효율적인 관리방법으로 1000 유전체 프로젝트의 비용은 급속히 떨어졌다.
  전 세계 75개 대학과 기업들의 연구자들이 결성한 컨소시엄인 1000 유전체 프로젝트의 성과는 ‘네이처’지에 'A map of human genome variation from population-scale sequencing'라는 제목으로 발표되었다[2]. 이 프로젝트의 첫 단계에서는 서아프리카, 유럽, 중국과 일본에 살고 있는 179명의 개인 유전체의 염기서열을 완전히 분석하는 작업과, 부모와 한 명으로 이루어진 표본 집단의 두 가족을   대상으로 유전체 염기 서열을 분석하는 작업, 그리고 697명의 엑손(exon)부분의 염기서열을 분석하는 것으로 이루어졌다. 연구자들은 이번 프로젝트에서 발굴된 유전자변이를 기준으로 하여 환자들과의   비교를 통해 다양한 질환특이적인 유전적 변이를 밝혀 낼 수 있을 것이다. 또한 서로 다른 인종들의   유전체 다양성을 비교함으로써 진화과정에서의 중요 역할을 하는 유전적 특징을 알아낼 수 있는 기반을 마련할 수 있게 되었다.
  위와 같은 염기 서열과 연관된 인간유전체 연구의 진행과 더불어 미국 국립 인간 유전체 연구 기관(National Human Genome Research Institute; NHGRI)에서는 유전체 지도의 완성뿐 아니라 그 기능을 밝히고 각 요소들의 역할을 이해하기 위해 ENCODE(ENCyclopedia Of DNA Elements) 프로젝트를  지원하고 있다. 이 글에서는 ENCODE 프로젝트에서 수행하고 있는 인간 유전체 기능연구에 대하여   소개하고 향후 기능연구의 방향에 대해 설명하고자 한다.


Ⅱ. 몸 말
   DNA 서열은 인간의 모든 정보를 담고 있으며, 건강이나 질병에 대한 정보도 DNA에 포함되어 있다. DNA 서열의 극히 작은 부위의 이상으로 발생하는 인간 질병의 메카니즘을 밝혀내고자 많은 연구자들은 끊임없이 노력하고 있다. 비록 인간 유전체 서열이 해독되었지만 생물학적 기능에 대한 염기서열의   변이가 미치는 영향성 연구는 아직 많은 부분이 숙제로 남아있다. 진핵생물의 염색체는 DNA 이중가닥에 히스톤 단백질이 결합되어 뉴클레오솜 1)을 형성하며 이들이 응축되어 염색체를 만들게 된다. 이렇게   형성된 염색체는 모든 부위가 기능을 하는 것이 아니라 mRNA로 합성된 후 핵공 2)을 통해 세포질로  이동되어 리보솜과 결합하여 단백질로 합성되었을 때 그 기능을 하게 된다. 이렇게 DNA서열에서 역할을 할 수 있게 도와주는 부위가 존재하는데 ENCODE 프로젝트는 다양한 연구자들이 함께 유전체내의   기능적 영역을 밝혀내기 위해 8개의 큰 프로젝트의 시작으로 2003년에 시작하였다. ENCODE 프로젝트에서 연구가 진행되고 있는 기능 요소들은 유전자, 프로모터, 발현의 촉진과 억제에 관여하는 인자,   전사조절 부위, 메틸화(methylation)부위 및 아직 알려지지 않은 다양한 종 사이에서 보존되는 부위가 있다(Figure 2).
           
           
  이들 부위에 대한 연구는 비록 인간 유전체의 1%에 해당하는 영역이지만 유전자 발현과정에 관여하는 분자적 기전을 설명할 수 있는 중요 유전적 정보를 제공한다. ENCODE 프로젝트의 목적을 이루기 위해 35개의 그룹들은 선행 연구에서 제공한 수백의 실험 및 시뮬레이션 데이터를 이용하였고, 이 데이터의 분석을 통해 얻어낸 연구 성과는 Nature지에 “Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project"라는 제목으로 실렸다[4]. ENCODE data는 UCSC Genome Browser(http://genome.ucsc.edu/ENCODE/)에서 제공하고 있으며 다른 다양한 웹사이트에서 사용되고 있다(Figure 3). ENCODE Genome Browser는 유전체 기능연구를 하는 연구자들에게 다양한 정보와 편리함을 제공한다. 또한 UCSC Genome Browser에서는 pilot 결과뿐만 아니라 pilot 결과들을 생물정보학적 방법으로 분석을 하고 유전체 버전별로 맵핑(mapping)하여 계속해서 업데이트하고 있다. 2007년도에는 앞으로의 유전체 기능 분석의 확장을 위해 공통된 세포 타입과 세포배양 프로토콜 정립, 실험 검증과 보고를 위한 표준 명세서를 작성, 다양한 실험의 통합 분석을 위한 용어 관리, 고속대량 시퀀싱(high-throughput sequencing)을 기초로 새로운 실험 기술 발전 등의 데이터 관리   정책을 조정함으로써 향후 증가하는 유전체 연구 데이터의 효율적 사용을 위해 노력하였다.
          
  2009년이 되었을 때는 전사조절 인자 결합부위와 크로마틴의 변형부위를 찾을 수 있는 Chromatin immunoprecipitation 실험과 유전자의 세포내 위치와 전사체 프로파일링을 할 수 있는 RNA-seq 실험과 마이크로어레이(Micro-array) 실험에 대한 내용을 포함했다. Table 1에서는 실험 데이터의 종류와   실험을 한 연구자들의 기관 및 그 실험의 규모에 대한 내용을 담고 있다[5].
  현재까지 볼 수 있는 정보는 ENCODE 프로젝트의 초기결과이며 앞으로 발전된 실험 기술 및 새로운 분석 방법들로 인하여 유전체단위의 실험을 이용한 기능 연구는 더욱 활발해질 것이다. 프로젝트의   초기에는 실험방법의 표준화 및 분석 전략과 데이터 기술 프로토콜을 정립하기 위해 노력했다면 향후에는 ChIP-seq, DNase-seq, RNA-seq 과 Methyl-seq과 같은 서열기반의 새로운 기술들을 이용한 연구  방법 및 방대한 데이터들을 이용하여 새로운 분석 방법의 개발을 하게 될 것이다.

Ⅲ. 맺는 말


    현재 많은 연구자들이 방대한 인간 유전체 서열 데이터를 분석하기 위해 많은 노력을 기울이고 있다. 1000 genomes project에 참여하는 연구 그룹 중 생물정보 연구 그룹의 역할은 대단히 크며 그중 Sanger 센터와 MIT와 하버드의 Broad Institute가 그 그룹을 이끌고 있다. 이제까지 서열분석에 전  세계 많은 유전체 및 생물정보학자들이 투입된 상태이며 앞으로 ENCODE 초기 연구에서 나온 연구  방법을 이용하여 유전체 서열의 기능연구는 더욱 가속화 될 것이다. 유전체 자료의 특성상, 대용량의  자료를 효율적으로 다룰 수 있는 생물정보학적인 연구방법의 적용이 필수적이다. 따라서 이번 프로젝트에서 얻어진 자료에 숨겨진 새로운 생물학적인 현상의 발굴을 위해서는 정보학적인 방법론이 매우 중요한 부분이 되었다고 할 수 있다. 결론적으로 ENCODE와 같은 대형 프로젝트에서 생산된 자료와 정보학적인 분석방법의 결합을 통해서 이제까지 알려지지 않았던 유전체의 기능의 발굴과 질병연구로의 응용이   더욱 활발히 이루어질 것으로 보인다. 


                                                                                                                                                                                         

1) 뉴클레오솜(nucleosome) : 유전자가 모여서 이루는 염색체의 기본단위를 말함
2) 핵공(nuclear pore) : 핵막, 세포질과 핵과의 경계. 세포분열시에 전기의 마지막에 방추체 형성에 따라 그 계면에 이행해서 없어지고
    말기에 다시 낭핵의 형성에 따라 나타남


Ⅳ. 참고문헌

1. Wheeler, D.A. et al. The complete genome of an individual by massively parallel DNA sequencing. Nature 452, 872-876 (2008)
2. The 1000 Genomes Project Consortium. A map of human genome variation from population-scale sequencing. Nature 467, 1061-1073 (2010)
3. The ENCODE Project Consortium. The ENCODE (ENCyclopedia Of DNA Elements) Project. Science 306, 636 (2004)
4. The ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature 447, 799-816 (2007)
5. ENCODE whole-genome data in the UCSC Genome Browser. Nucl. Acids Res. 38, D620-D625 (2009)