지난 1월 26일, 세계 3대 과학 저널인 ‘네이처(Nature)’에서는 10만 개가량의 신종 RNA 바이러스와 아홉 개의 새로운 코로나바이러스 종을 발견했다는 일명 ‘세라투스 프로젝트(Serratus Project)’ 연구 결과가 발표됐다.

 

아르템 바바이안(Babaian) 박사가 이끄는 연구진이 진행한 이번 프로젝트는 공개적으로 사용 가능한 모든 RNA 염기서열 데이터를 통틀어서 RNA 바이러스의 존재 여부를 가리는 유전자를 찾아내는 방식으로 진행됐으며, 약 10만 개의 신종 RNA 바이러스를 발견했다. 바바이안 박사는 UBC에서 의학 유전학 박사 학위를 취득한 이후, 현재 케임브리지 대학교에서 Banting 박사 후 연구원으로 재직 중이다.

 

570샘플 추출해 새로운 RNA 바이러스 발견

 

연구진은 추출된 데이터로부터 약 13만2000개의 RNA 바이러스를 발견했는데, 이 중 이미 알려진 RNA 바이러스는 약 1만5000종뿐이었다. 발견된 바이러스 중에는 9종의 신종 코로나19 바이러스도 포함되어 있었다.

 

이를 덧붙이자면 코로나바이러스는 호흡계 및 소화계 감염을 유발하는 RNA 바이러스들의 통칭이며, 현재 팬데믹의 원인인 코로나19(COVID-19)는 코로나 바이러스의 한 종일뿐 코로나19 변이를 일컫는 것은 아니다.

 

해당 분석 결과에 대해 바바이안 박사는 "원인 불명의 발열을 겪고 있는 환자의 피에서 발견된 바이러스를 데이터베이스에 검색해 단 몇 분 만에 위치와 종을 알아낼 수 있었다"라고 설명했다. 이 데이터는 전 세계 곳곳의 연구 커뮤니티가 모은 570만 개의 샘플로부터 추출되었으며, 해당 샘플은 빙하부터 동물 배설물까지 다양했다.

 

해당 프로젝트는 UBC 산하 Cloud Innovation Centre(이하 UBC-CIC)와의 협력 아래 진행됐다. UBC-CIC는 UBC와 Amazon Web Service(AWS)의 협업 센터이며, UBC 학생 및 교수진에 각종 프로젝트 추진에 필요한 클라우드 기술들을 제공한다.

 

바바이안은 프로젝트 진행을 위해 일반 컴퓨터보다 연산 처리가 빠른 슈퍼컴퓨터를 필요로 해 중앙 처리 장치(CPU) 개수를 중요시했다. CPU는 프로그램의 명령어를 해석한 후 데이터를 연산해, 컴퓨터 작동을 위한 모든 계산 처리를 맡는 중요한 하드웨어이다.

 

따라서 여러 CPU를 사용하게 되면 수많은 계산을 동시에 처리함으로써, 실행 시간이 급격히 줄어든다. 기존에 2000만 기가바이트에 가까운 데이터를 짧은 시간 내에 분석해야 했던 바바이안은 수많은 CPU를 필요로 했고, UBC-CIC와의 연락을 통해 AWS에서 2만2500개의 CPU를 지원받았다.

 


아르템 바바이안 박사

새로운 전염병 예측에 기여

 

UBC-CIC, AWS와의 협력으로 세라투스 프로젝트는 2만 4000달러의 연구금으로 11일 만에 연구를 완료했다. 실제로 바바이안 박사는 "UBC-CIC와 AWS의 도움 없이 이 연구를 마치려면 웬만한 슈퍼컴퓨터도 최소 1년은 걸렸을테고, 상당한 투자가 필요했을 것"이라고 밝힌 바 있다.

 

또한 바바이안은 그의 논문을 통해 앞서 언급된 RNA 관련 연구 결과뿐만이 아닌 생태계 보전을 위한 방향을 제시했다.

 

그는 “코로나19의 원인인 SARS-CoV-2같은 바이러스가 미래에 다시 나타난다 해도 RNA 바이러스들을 더욱더 쉽고 신속하게 추적할 수 있게 됨으로써, 더 큰 팬데믹으로 번지지 않도록 대비할 수 있을 것”이라고 강조했다. 또한, 고 처리량 바이로믹스(high-throughput viromics) 같은 분야들은 수많은 바이러스 염기서열 데이터를 분석해, 새로운 전염병을 예측하고 완화하는 정책 결정에 기여할 수 있다고 설명했다.

 

추가적, 연구진은 인구 증가와 동물 서식지 잠식으로 인한 종의 밀집 생활을 근거로 동물 원성 감염 비율 속도 증가를 언급하며 “멸종 위기 생물 보호를 위해선 다양한 생물학적 샘플들의 수집과 보존이 그 어느 때보다 시급하다”고 발표했다.

 

이를 위해 바바이안은 연구원들의 주체적인 협력이 필요하다고 강조했으며, 바이러스 데이터와 생태 정보학 기술을 조합한다면 세계적인 병원체 감식 네트워크를 설립하는 것도 충분히 가능한 일이라고 덧붙였다. 추후 진행을 위해 그의 팀 역시 연구에 사용된 프로그램과 새로 찾은 데이터를 무료로 세라투스 데이터베이스에 배포했다.

 

세라투스 프로젝트를 통해 탄생한 바이러스 분석 소프트웨어와 발견된 정보들이 미래의 국제 사회에 어떻게 공헌할지 기대가 되고 있다.

 

UBC K.I.S.S. 11.5기 하늬바람 학생기자단

김동규 인턴기자 donggyu258@gmail.com