Friday 29th November 2024,
최윤섭의 디지털 헬스케어

23andMe의 개인 유전정보 분석 결과는 얼마나 정확한가?

개인 고객의 타액 샘플을 우편으로 받아서 단돈 $99에 120여개 질병에 대한 위험도를 포함한 200개가 넘는 유전적인 특성을 분석해주는 기업, 23andMe. 지난번 포스팅에서도 소개해드렸듯이, 개인 유전정보 분석 (Personal Genome Service, PGS) 회사의 대표주자인  23andMe에게 FDA가 지난 11월 말 서비스 중지 명령을 내린 이유는 유전 정보 분석 결과의 정확성이 검증되지 않았다는 것 때문이었습니다. 질병의 위험도 계산이나 약물에 대한 반응 정도에 대한 분석 결과는 사용자의 의학적인 행동으로 이어질 수도 있으므로, 그러한 분석 결과의 정확도는 반드시 철저하게 검증이 되어야 한다는 것이었습니다.

사실 현재 개인 유전정보 분석 서비스를 제공하는 회사는 23andMe 하나만 있는 것은 아닙니다. 샌디에고에 위치한 Pathway Genomics 는 $399에 24개의 질병에 대한 위험도를 분석해주며, 영국 기업인 Genetic Testing Laboratories (GTL)은 $285 에 25개의 질병 리스크를 계산해줍니다. 23andMe와 함께 이 PGS 시장의 초기 개척자 중 하나였던 NavigenicsdeCODE Genetics는  비록 지난 2012년, 각각 Amgen과 Life Technology에 인수되면서 역사의 뒤안길로 사라졌거나 유명무실해진 것으로 보이지만 말입니다.

23andMevsothers
23andMe vs. Pathway Genomics vs. GTL

23andMe vs. Pathway Genomics vs. GTL

우리는 여기서 재미있는 질문을 던져 볼 수 있습니다. 개인 유전 정보 분석에 있어 정확도가 그렇게도 중요한 것이고, 같은 목적의 분석을 수행해주는 회사가 세 군데가 있다면, 과연 동일한 사람에 대해서 세 개의 다른 기업이 각자 분석을 했을 경우에 그 분석 결과들은 얼마나 일치할까 하는 것입니다.

최근 뉴욕타임즈에는 바로 이러한 질문에 관해서 흥미로운 기사가 실렸습니다. Kira Peikoff 라는 스물 여덟 살의 기자가 신의 유전 정보를 각각 23andMe, Pathway Genomics, GTL 등 세 기업에 분석한 다음, 그 결과를 서로 비교한 것입니다. 세 회사에서 나온 분석 결과는, 예상하셨겠지만, 서로 일치하는 경우도 있었으나 불일치하는 경우도 있었습니다.

세가지의 서비스에서 모두 결과를 얻는 것에 두 달이 걸렸다는 기자는 결과 간의 불일치가 충격적이었다 (the discrepancies were striking)’고 이야기하고 있습니다.

  • 23andMe의 결과로는 건선(psoriasis)의 위험도는 유럽인의 두 배 (20.2%) 였으며, 류마티스 관절염의 위험도 역시 유럽인의 두 배 (8.2%)로 나왔다고 합니다. 하지만 GTL의 분석 결과들 중에 가장 낮은 위험도를 보였던 것이 바로 건선 (2%)와 류마티스 관절염 (2.6%) 였다고 합니다.
  • 관상심장병(coronary heart disease)에 관해서는 23andMe와 GLT 모두 평균에 가까운 위험도 (26-29%)를 나타내었으나, Pathway Genomics 는 ‘평균 이상 (above average)’의 위험도를 가진다는 결과를 주었습니다.
  • 제 2형 당뇨병에 관해서는 위험도의 수치는 크게 차이가 나지는 않았으나, 그에 대한 해석이 불일치 하였습니다. GLT은 위험도가 10.3%으로 ‘중간(medium)’ 이라고 한 반면, 23andMe는 위험도가 15.7% 으로 ‘낮다(decreased)’ 라고 해석하였습니다. 사실 평균적으로 가지는 위험도의 3/4 수준이라고 이야기 하였지만, 그 숫자에 대한 설명은 완전히 달랐던 것입니다.

기사에 따르면, 전문가들은 이러한 결과의 불일치에 대해서 우려를 표하고 있습니다. 위험도를 정의하거나 해석하기 위한 업계의 표준 (industry standard)가 없기 때문입니다. New York University Langone Medical Center의 의료 윤리학자인 Arthur L. Caplan 는 “제 눈에 안경(risk is in the eye of the beholder) 이라는 식의 업계 표준이라는 것은 제대로 작동하지 않을 것이다. 우리는 위험도의 높음/중간/낮음 정도에 대한 표준이 필요하다.” 고 지적하였습니다.

nytimes 23andMe
(출처: 뉴욕타임즈)

분석 결과가 일치하지 않는  이유는 무엇일까

그렇다면 이러한  불일치가 발생하는 이유는 무엇일까요? 첫번째 이유는 세 회사 모두 유전 정보의 테스트를 위해서 SNPs 라는 전체 DNA에서 극히 일부분에 해당하는 정보만을 사용한다는 것을 꼽을 수 있습니다. Single-nucleotide polymorphism (단일 염기 다형성)의 줄임말인 SNP (‘스닙’ 이라고 읽습니다)는 기나긴 DNA의 염기 서열에서 단 하나의 염기 서열이 사람들 간에 차이를 보이는 것을 말합니다.

예를 들어, DNA의 어떤 특정 부위에 어떤 사람은 A (adenine)을 가지고 있지만, 어떤 사람은 C (cytosine)을 가지고 있는 것입니다. 이러한 다양성의 빈도에 따라서 이를 정의하는 것이 약간은 달라지는데, 보통 전체 인구에서 1% 이상의 높은 빈도로 나타나면 이를 SNP 라고 정의합니다. 특히, 이 SNP는 개개인의 질병에 대한 감수성이나, 약물에 대한 반응, 효과, 부작용의 차이를 나타내는 원인이 되다고도 알려져 있습니다.

SNP_260x260

하지만 문제는 이 SNP라는 것이 인간이 가지는 전체 유전 정보 중에서는 극히 일부분에 지나지 않는 제한적인 정보라는 것입니다. 과학자들은 3 billion 개의 전체 DNA 염기 서열 중에, SNP는 10 million 개 정도 밖에 되지 않는다고 합니다. 그래서 컬럼비아 대학의 생명윤리학자인 Dr. Robert Klitzman은  전체 유전 정보를 보지 않고, SNP만을 분석하는 것에 대하여 “책을 읽을 때, 매 페이지의 첫번째 문자만 읽는 것과 같다”면서 “전체 염기 서열의 99.9%를 놓치기 때문에 거기서 얻을 수 있는 정보도 제한적일 것이다.”고 언급하고 있습니다.

SNP 분석의 한계점에 대해서, 2013년 네이쳐 제네틱스의 논문을 보면 아래와 같은 언급이 나옵니다.

For most diseases, it should be possible to identify the individuals with the highest genetic risk. However, if the aim is to identify individuals with just twice the mean population risk, we cannot currently do that with SNPs.
대부분의 질병에 대해서, 가장 높은 위험도를 가지는 개인을 판별해내는 것은 가능하다. 하지만, 만약 전체 인구 평균 보다 두배의 위험도를 가지는 개인을 찾아내는 것이 목적이라면, 현재의 SNP 분석만 가지고는 불가능하다.

하지만, 현재로서는 유전 정보의 전체를 분석하는 비용은 $3,000 정도로 적지 않습니다. 더 많은 사용자를 확보함으로써 PGS 시장을 키워가고 싶은 개인 유전 정보 분석 회사에 입장에서는 비용효율성 측면에서 현실적인 대안인 SNP 분석만을 하고 있는 것입니다. 이에 대해 23andMe의 CEO Anne Wojcicki는 “서열 분석이 중요하기는 하지만, 모든 고객이 그것을 필요로 하지는 않는다. 유전자형 검사 (genotyping) 정도로도 현재 고객들에게는 충분하다” 고 언급한 바 있습니다.

사실, 23andMe를 비롯한 기업들도 이러한 한계점에 대해서 당연히 인지하고 있으며, SNP 뿐만이 아닌 유전 정보의 더 많은 부분을 분석하려는 시도를 계속 해오고 있습니다.  23andMe는 전체 엑솜 분석 (whole exome sequencing; WES)을 파일럿-테스트 형태로 시도하기 위해 2011년 사람들을 모집한 바 있으며, 2012년 American Society of Human Genetics 등의 학회에서 WES에 대한 포스터를 발표하기도 하였습니다.

 

분석 결과가 다른 또 다른 이유들

세 기업의 결과가 불일치하는 또 다른 이유는 각 질병의 위험도를 예측하기 위해서 사용하는 SNP의 종류가 다르다는 것입니다. 예를 들어, 위에서 언급한, 관상동맥질환 (coronary heart disease)의 경우, 세 회사가 각각 거의 겹치지 않는 4개에서 15개의 SNP를 분석했다고 합니다. 비록 결과적으로 나온 위험도는 비슷했지만 말입니다. 반면에 류마티스 관절염의 경우에는 공통된 5개의 SNP 에 더하여 몇가지의 SNP를 추가적으로 사용했지만, 결과는 정반대로 나왔다고 합니다.

또한, 결과 불일치는 각 질병에 대한 평균적인 위험도를 다르게 계산하기 때문이기도 합니다. 예를 들어, 23andMe는 비만에 대한 평균적인 위험도를 59%라고 보지만, GTL은 30% 라고 보는 것이지요.

하지만 아마도 가장 근본적인 문제는 질병에 대한 근본적인 원인이 여전히 완벽하게 밝혀지지 않았다는 것입니다. 전문가들에 따르면 유전자들은 아마도 질병 원인의 5-20% 밖에 설명하지 못할 것이라고 합니다. 컬럼비아 대학의 임상 유전학과의 디렉터인 Wendy Chung 박사는, “그 5%에 해당하는 위험도를 정확하게 계산했다고 할지라도, 그들은 질병의 원인에 대한 다른 요소들은 고려하지 못한 것이다” 라고 하였습니다. 즉, 질병을 정확히 예측하기 위해서는 유전적인 원인 뿐만 아니라 후생학적인, 환경적인 원인들까지 종합적으로 고려해야 한다는 것입니다.

뿐만 아니라, 질병마다 유전적 요소에 영향을 받는 정도도 상이한 것도 문제입니다. 즉, 암과 같이 발병에 있어서 유전적 요소의 영향을 많이 받는 질병이 있는가 하면, 그렇지 않은 질병도 있다는 것이지요. 저와 개인적인 친분이 있는, 충북대병원 내분비내과 최형진 교수님의 말씀에 따르면, 당뇨병과 같은 만성 질병의 발병 위험을 예측하는 것은, 기존의 다른 임상적인 지표들 (나이, 성별, 키, 몸무게, 가족력 등)로 예측하는 것에 비해 추가로 도움을 많이 주고 있지는 못하다고 합니다.

Genetictesting

 

크레이그 벤터의 ‘맞춤 의학을 위한 현안들’

게놈 프로젝트의 핵심 인물 중의 한 명이자, 유전체학이라는 분야를 만들어낸 장본인 들 중의 한명인, 저명한 생물학자 크레이그 벤터 (Craig Venter)는 이번 뉴욕 타임즈 기사에도 나오듯이 이러한 개인 유전정보 테스트에 대해서 회의적인 입장을 유지하고 있습니다.

사실 크레이그 벤터는 이번 기사에 나온 것과 비슷한 방식으로 이미 2009년에  여러 명의 사람에 대한 23andMe와 Navigenics 의 분석결과가 서로 일치하는지를 비교 분석한 논문을 Nature 에 출판한 적이 있습니다. “맞춤 의학을 위한 현안들 (An agenda for personalized medicine)” 이라는 제목의 이 논문은 3명의 여성과 2명의 남성의 샘플을 각각 23andMe와 Navigenics를 이용하여 유방암, 대장암, 류마티스 관절염, 제 2형 당뇨병 등 13개 질병에 대한 위험도를 계산하여 분석 결과가 일치하는지를 분석하였습니다. 아래의 그림을 보시면 그러한 결과를 한 눈에 보실 수 있습니다.

23andMevsNavigenics(출처: Pauline C. Ng et al. Nature 2009)

표에서 나오는 두개의 화살표 중에 왼쪽 화살표는 23andMe에서 나온 결과를 나타내며, 오른쪽 화살표는 Navigenics의 결과를 나타냅니다. 화살표가 위를 향해 있으면 위험도가 평균보다 높음을, 아래로 향해 있으면 평균 보다 낮음을, 그리고 = 표시는 평균 위험도와 비슷함을 나타냅니다.

이 표에서는 유방암 (breast cancer)이나, 만성 소화장애증 (coeliac disease), 다발성 경화증 (multiple sclerosis), 류마티스 관절염 등 4개의 질병에 관해서는 5명에 대한 분석 결과가 완전히 일치한다는 것을 볼 수 있습니다. 하지만 7가지 크론씨 병, 건선(psoriasis), 제 2형 당뇨병 등의 질병에 대해서는 절반 이상의 경우에 결과가 불일치한다는 것을 알 수 있습니다.

뉴욕 타임즈의 기사와 마찬가지로 이 논문에서도 결과의 일치/불일치에 대해서 비슷한 원인을 제시하고 있습니다. 예를 들어, 만성 소화장애증 (coeliac disease)의 결과가 다섯명의 경우에 모두 일치하는 것은 결과값에 강하게 영향을 주는 표지자 (strong-effect marker)를 두 기업 모두 계산에 크게 반영하기 때문이라고 합니다. 만약 두 기업이 이렇게 강하게 영향을 주는 표지자를 공통으로 사용하지 않을 경우에는 결과 값에 크게 차이가 나는데, 건선(psoriasis)의 경우가 그러하다고 논문에서는 설명하고 있습니다.

이러한 불일치에 대해서 크레이그 벤터는 이런 PGS 회사들이 공통된, 같은 수의 표지자를 이용해서 예측을 할 필요가 있다는 것을 제안하고 있습니다. 23andMe와 Navigenics 모두 의학적으로 검증되어 있는 표지자를 사용하기는 하지만, 이렇게 업계의 표준이 없는 상태에서는 결국 회사마다 다른 결과를 줄 수 밖에 없기 때문입니다.

 

한국인들이 PGS 결과를 볼 때 고려해야 할 한 가지

더구나, 우리 한국인들은 23andMe의 결과를 볼 때에는 주의해야 할 또 한 가지 부분이 더 있습니다. 아래는 제 23andMe 분석 결과의 일부분입니다. (저는 다행히(?) 23andMe가 FDA에서 판매 금지 신청을 받기 전에 분석을 마쳤습니다.)

Screen Shot 2014-01-12 at 11.33.53 PM

제 유전자 검사 결과 중에 가장 위험도가 높은 질환은 이 심방세동 (atrial fibrillation) 으로, 평균적인 위험도가 27.2%인데 비해, 제 위험도는 46.9% 으로, 평균치의 1.73배입니다. 저는 평소에 심장에는 아무런 무리를 느끼지 못했고 가족력도 없기 때문에, 이런 결과를 보고 상당히 놀라기도 했고 좀 의아하기도 했습니다. 그런데 결과를 조금 자세히 살펴보면, 이러한 분석은 제 인종(ethnicity)을 ‘유럽인’ 이라고 가정하고 나온 결과임을 알 수 있습니다.

인종 부분의 옵션을 바꿔보려고 하면, 유럽인 외에는 선택할 수가 없게 되어 있습니다. 이것은 역시 아시아인에 대한 유전자-질병 연관관계 데이터가 없기 때문입니다. 23andMe의 분석 결과는 기존의 생명과학/의학 연구에서 밝혀진 유전자와 질병의 연관 관계를 근거로 하고 있는데, 지금까지 행해진 많은 연구들이 한국인이나 아시아인이 아닌, 서양인을 대상으로 한 것이기 때문이지요.

인종에 따라 유전적인 특성이 다를 수도 있는만큼, 현재까지의 PGS 결과들은 한국인을 포함한 아시아인들이 분석 결과를 해석할 때에는 이러한 추가적인 한계점 또한 고려되어야 한다는 것입니다.

실제로, 동일한 유전 변이를 가지더라도 인종간에 질병의 위험도에 차이가 나는 예들이 연구 결과 밝혀지기도 하였습니다. 충북대병원 내분비내과 최형진 교수님의 말씀을 빌자면, 예를 들어 백인에서는 특정 질병의 위험도를 높인다는 결과를 보여주는 유전형이, 아시아인에게는 오히려 질병 위험을 낮추는 작용을 할 수도 있다는 것입니다.  2012년 네이쳐에 출판된 논문에서 소개된 연구는 이러한 예를 보여줍니다. 골밀도와 관련된 이 연구에서 RANKL 라는 유전자의 rs9533090 변이는 골밀도에 미치는 영향이 코호트 간의 차이가 매우 크며, 심지어는 서로 반대 방향으로 작용하기도 한다는 결과를 보여주었다고 합니다.

 

개인 유전 정보 분석의 미래

이번 포스팅에서는 개인 유전정보 분석 서비스 (PGS)의 한계점들에 대해서 주로 살펴보았습니다. Navigenics가 2006년에, 23andMe가 2008년에 창업한지 몇년의 세월이 흘렀지만 개인 유전 정보 분석은 여전히 태동기에 있다고 볼 수 있을 것 같습니다. 이번 FDA의 규제에서도 볼 수 있듯이 새로운 분야에 대해서 제도적으로 미비한 상황이며, 과학적, 의학적으로도 검증해야 할 많은 부분을 남겨두고 있습니다.

하지만 이런 서비스가 완전히 부정확하다고도, 전혀 쓸모 없다고 할 수는 없을 것 같습니다. 23andMe의 분석 결과 덕분에 목숨을 구할 수 있었다는 많은 사례들은 (비록 FDA는 이를 좋아하지 않았지만) 그러한 예를 단적으로 보여줍니다. 저는 개인 유전정보 분석이라는 거대한 물결은 결코 거스를 수 없는, 언젠가는 인류가 반드시 맞이하게 될, 도도한 역사의 큰 물결과 같은 것이라고 생각합니다.  다만 그것이 어떠한 시행착오를 거쳐서 정착되게 될지, 또한 그러한 시기가 언제가 될지가 문제일 뿐이지요.

혁신이라는 것은 우리가 잘 알아차리지 못하는 사이에 예상보다 빨리 우리 곁에 다가와 있는 경우가 많습니다. 최근 Wired 에는 “23andMe를 죽도록 규제해도, 새로운 시대의 도래는 막을 수 없을 것이다 (Regulating 23andMe to Death Won’t Stop the New Age of Genetic Testing)”는 도발적인 제목의 칼럼이 실렸습니다. 이 칼럼에서는 다른 산업에서도 파괴적인 혁신이 일어난 과정과 마찬가지로, 개인 유전 정보 분석 시장에서도 23andMe 등의 기업에 의해서 파괴적 혁신이 결국에는 일어날 것이라는 것을 이야기하고 있습니다.

그렇게 개인 유전 정보 분석이 과학적, 제도적으로 완전히 정착되기 전까지는 이러한 분석 결과를 비판적으로 받아들이고, 결과값이 어떠한 한계점을 왜 지니고 있는지를 인지한 채 받아들이는 것이 중요할 것입니다. 그러한 정착 시기를 앞당기고, 시행착오를 줄이기 위해서는 저와 같은 관련 분야의 전문가들의 역할이 중요할 것이라고 생각합니다.

Like this Article? Share it!

About The Author

디지털 헬스케어를 통해 의료를 혁신하고 세상을 더 건강하게 만들고자 하는 벤처투자자, 미래의료학자, 에반젤리스트입니다. 포항공대에서 컴퓨터공학과 생명과학을 복수 전공하였고, 동대학원에서 전산생물학으로 이학박사를 취득했습니다. 스탠퍼드 대학, 서울대학교병원 등에서 연구하였습니다. 현재 디지털 헬스케어 스타트업 전문 투자사, 디지털 헬스케어 파트너스 (DHP)를 2016년에 공동창업하였고, 대표를 맡고 있습니다. 지금까지 40여 개의 디지털 헬스케어 스타트업에 투자하였습니다. 네이처의 디지털 헬스케어 분야 자매지 『npj 디지털 메디슨』의 편집위원이자, 식약처, 심평원의 전문가 협의체 자문위원입니다. 『디지털 헬스케어: 의료의 미래』 『의료 인공지능』 『헬스케어 이노베이션』 등을 집필하였습니다.

2 Comments

Leave A Response