실시간 뉴스



[지금은 과학] 유전질환 연관분석 오류, 슈퍼컴으로 잡는다


KISTI, 7.5PF 병렬컴퓨팅으로 세계 최대 규모 전장 유전체 연관분석 실행

[아이뉴스24 최상국 기자] 한국과학기술정보연구원(KISTI, 원장 김재수)이 거대규모의 슈퍼컴퓨터를 활용해 유전질환 분석의 오류를 보정할 수 있는 병렬컴퓨팅 기술을 개발하고 해당 소프트웨어를 누구나 사용할 수 있도록 공개했다.

31일 KISTI 슈퍼컴퓨팅응용센터 권오경·백효정 박사 연구팀은 전장유전체 연관분석(Genome Wide Association Study, 이하 GWAS)의 통계 오류를 보정하기 위한 거대규모 슈퍼컴퓨팅 소프트웨어를 개발하고, 관련 연구 내용을 국제 학술지인 지노믹스 앤 인포매틱스(Genomics & Informatics)에 발표했다.(논문제목: MPI-GWAS: a supercomputing-aided permutation approach for genome-wide association studies)

연구팀은 또한 유전체 연구자들이 자유롭게 사용할 수 있도록 이 소프트웨어(MPI-GWAS)의 소스코드를 깃허브(github.com/hypaik/proj_MPIGWAS)에 공개했다.

GWAS는 사람의 질병이나 약물 반응성, 식물의 형질 등과 연관된 유전적 요인을 찾아내기 위해 최근 보편적으로 사용되고 있는 연구방법론이다. GWAS 분석으로 특정 질병과 유의미하게 관련이 있는 유전변이를 발견하면 개인 맞춤형 건강 관리에 도움을 줄 수 있다. 농축산 분야에서는 신품종을 개발할 수 있는 중요한 지표로 여겨지고 있다.

하지만 통계 오류가 발생하면 특정 유전변이가 질병과 관련이 없는데도 연관성이 높은 것으로 잘못(위양성) 인식될 수 있다. 따라서 GWAS 분석 결과의 통계 오류 보정은 필수적이다. GWAS 분석의 통계 오류 보정은 방대한 계산으로 인해 해당 분야 연구 난제로 남아있었다.

KISTI 연구팀은 병렬컴퓨팅 기술을 통해 전장유전체 통계오류 보정 계산을 최적화한 소프트웨어를 개발했다. 이를 국가슈퍼컴퓨터 5호기 '누리온'을 활용해 세계 최대 규모로 전장 유전체 연관분석을 실행하고 기존의 통계오류 보정이 가능함을 확인했다.

연구팀은 이번 실험에 한국인 7천523명과 영국인 4천242명을 대상으로 한 코호트 연구 데이터를 사용했다. 여기서 보고된 8만4천295개의 유전변이에 따른 당뇨, 고혈압 연관 유전변이를 GWAS 계산을 통해 도출하고, 최대 70억 회 이상의 무작위 조합을 수행함으로써 통계 오류를 보정 할 수 있었다.

KISTI 국가 슈퍼컴퓨터 5호기 누리온 [사진=KISTI]
KISTI 국가 슈퍼컴퓨터 5호기 누리온 [사진=KISTI]

이번 슈퍼컴퓨팅 시뮬레이션은 누리온 슈퍼컴퓨터의 2천500 노드를 동시에 사용했다. 이는 누리온 전체 연산자원의 25%에 해당하는 것으로 약 7.5 페타플롭스(1페타플롭스는 1초당 1천조번 계산)의 연산이 가능한 수준이다. KISTI 연구팀이 개발한 소프트웨어는 기존 통계 프로그램 대비 약 300% 이상 더 빠르게 계산할 수 있는 성능을 나타냈다. 이처럼 대규모의 연산자원을 동원했음에도 이번 시뮬레이션에는 약 1개월의 시간이 걸렸다고 연구팀이 전했다.

권오경 박사와 백효정 박사는 “이번 GWAS 관련 병렬화 소프트웨어는 다양한 유전체 연구자들이 자유롭게 활용할 수 있도록 소스코드를 공개하였으므로 유전체 분야에 슈퍼컴퓨터를 활용한 연구 효율화가 기대된다”고 말했다.

정민중 KISTI 슈퍼컴퓨팅응용센터장은 “KISTI는 거대규모의 계산을 필요로 하는 슈퍼컴퓨터 사용자들에게 최적병렬화 기술 및 계산자원을 지원하고 있다. 배포된 슈퍼컴퓨팅 시뮬레이션 소프트웨어로 바이오 및 의료분야 연구 효율화가 마련될 수 있을 것"으로 기대했다.

/최상국 기자(skchoi@inews24.com)

2024 iFORUM






alert

댓글 쓰기 제목 [지금은 과학] 유전질환 연관분석 오류, 슈퍼컴으로 잡는다

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스