
지난 2003년 미국에서 시작된 인간게놈프로젝트(HGP).
13년의 노력 끝에 92%의 인간 유전체를 해독한 지 20년만에 최근 ‘텔로미어 투 텔로미어'(T2T) 컨소시엄이 나머지 8%에 대한 해독을 마쳤다. 1953년 DNA가 생명체의 유전 정보를 담고 있다는 사실을 발견한 것부터 치면 약 70년 만에 인간 유전체 30억5500만쌍의 실체가 온전하게 드러난 것이다.
미국, 영국, 독일, 러시아 등 4개국 33개 연구기관 과학자 114명으로 구성된 T2T 컨소시엄은 지난달 31일 국제학술지 사이언스에 완전한 인간 유전체 정보와 함께 6편의 연구 논문을 함께 발표했다. 텔로미어는 염색체 양쪽 끝에 있는 말단 염기서열인데, ‘유전체의 전모를 파악한다’는 의미로 T2T라는 이름이 컨소시엄에 붙었다.
기존 유전체 분석에는 DNA를 잘게 쪼개 염기서열을 분석한 뒤 컴퓨터로 원래 DNA순서를 짜맞추는 ‘쇼트 리드'(short read) 시퀀싱 방식을 썼다. 하지만 인간 유전체에는 반복되는 DNA가 많아 위치를 특정할 수 없는 경우가 있었다. 이에 컨소시엄 연구팀은 ‘롱 리드'(long read)라는 새로운 방식을 추가했다. 롱리드는 DNA를 길게 잘라내 읽는 방식이라 DNA 위치를 다시 찾기가 용이했다.
최근 10년 사이 새롭게 등장한 DNA 시퀀싱 기술이 이들의 연구에 결정적 역할을 했는데 한번에 최대 100만개의 염기를 읽을 수 있지만 일부 오류가 나는 옥스퍼드 나노포어의 시퀀싱 방법과 2만개의 염기를 99.9%의 정확도로 읽는 ‘팩바이오 하이파이 시퀀싱’ 기술이 그것이다.
인간의 완전한 게놈 정보를 갖게 됨으로써 과학자들은 이제 사람마다 어떤 유전체 차이가 있는지, 이 유전체 차이가 어떤 질병과 연관된 건지 분석할 수 있게 됐다.
2003년 당시 과학자들은 분석한 92% 외에 남은 8%를 ‘정크(쓰레기) DNA’로 판단했다. 이 부분에는 염기서열이 고도로 반복되는 DNA 덩어리가 많았는데 유기체나 진화와 관련이 없는 부분이라고 보았다.
하지만 연구를 계속한 결과, 이 부분의 유전자들이 적응에 매우 중요하다는 것을 밝혀냈다. 논문의 주요 저자인 에반 아이클러 박사는 “인간이 감염, 전염병, 바이러스의 침입에도 적응하고 생존할 수 있게 돕는 면역 반응 유전자가 이 안에 포함되어 있었다. 또 약물 반응을 예측하는 측면에서 매우 중요한 유전자도 포함하고 있다”고 설명했다.
컨소시엄은 현재 전 세계 350명의 DNA 염기서열을 판독하는 작업도 진행중이다. 미국 CNN에 따르면 연구자들은 앞으로 10년 안에 개인의 게놈 서열을 분석하는 것이 1000달러(약 122만원) 미만 비용의 일상적인 의학 검사가 될 수 있기를 바란다고 말했다.





