현재 미국에서는 어마어마한 규모의, 인류 역사상 가장 큰 규모의 코호트 구축 프로젝트가 진행되고 있습니다. 이름하여 ‘All-of-Us’ 라는 프로젝트인데요. 이름에 걸맞게 그야말로 ‘모든 사람’의 ‘모든 데이터’를 모으겠다는 야심찬 프로젝트라고 보면 됩니다. 정말 정말 야심찬 프로젝트입니다. 이 프로젝트에 대한 업데이트가 이번 NEJM에
스페셜 리포트로 실렸습니다.
All-of-Us는 2015년 오바마 대통령이 천명했던 ‘정밀 의료 이니셔티브’의 일환으로 시작되었던 프로젝트입니다. 당시에는 ‘Precision Medicine Initiative cohort program’으로 부르다가, 이제는 All-of-Us로 명칭이 바뀌었습니다. 이 프로젝트의 목표는 최소 100만 명 이상의 사람의 데이터를 모으는 것입니다. 수집하는 데이터는 건강 관련 설문 조사를 비롯해서, EHR의 진료 기록, 건강 검진, (웨어러블과 센서 등을 활용한) 디지털 헬스케어 데이터, 그리고 생체 시료 (아마도 혈액)까지 정말 모을 수 있는 것은 그야말로 전부 수집합니다. (정부 주도의 과제라면 정말 이 정도는 되어야 하지 않은가 하는 생각이 듭니다.)
이러한 코호트의 구축은 의학 및 생명과학 연구에서 어마어마한 의미를 갖습니다. 의학과 생명과학에서는 기본적으로 데이터가 있어야 연구를 합니다. 딥러닝을 비롯한 인공지능도 마찬가지입니다. 지금까지 이런 코호트의 구축이 없었던 것은 결코 아닙니다만, 코호트에 포함되는 사람의 숫자가 제한적이거나, 다양성이 충분히 확보되지 않은 경우가 대부분이었습니다. 예를 들어서, 인종, 성별, 나이, 지역, 수입/경제력, 의료기관 접근성, 교육 수준 등에 따라서 코호트에 포함되는 구성원의 bias가 있는 경우가 많았습니다. 이 경우 연구 결과에도 당연히 bias가 있게 됩니다.
이 때문에 All-of-Us에서는 매우 인상적이게도 기존의 의학 연구에서 상대적으로 소외당했던 소수 인종 등의 참가자들을 특정 비중 이상 포함시키는 것을 목표로 하고 있습니다. (전체 참가자 중에는 75% 이상, 생체 시료 확보군에서는 45% 이상 달성하는 것이 목표)
이 프로젝트는 2017년 5월부터 베타 단계를 거쳐서, 미국 전역에 런칭은 2018년 5월에 시작했습니다. 현재 무려 340군데 이상의 사이트에서 환자를 모집하고 있습니다 (대부분은 병원). 이렇게 미국 전역에서 환자를 리크루팅하고 데이터를 모으기 시작한지 1여 년 만에 중간 결과가 NEJM에 발표된 것입니다. 개인적으로는 이 All-of-Us 프로젝트의 런칭 초기부터 유심히 봐왔고, 현재 집필 마무리 단계인 저서에 한 꼭지로 들어가기도 하는데요. 마침 프로젝트 진행의 최신 업데이트가 실려서 매우 반갑게 살펴보았습니다.
이 프로그램에 참가한 사람의 총 수는 2019년 7월 기준의 현재까지 230,000명으로, 100만 명을 달성하겠다는 목표의 1/5 정도를 달성하였습니다. 이 중에 생체 시료, EHR 데이터 등의 핵심 데이터를 제공하기로 한 ‘핵심 참가자 (core participants)’는 175,000명 입니다. 또한 34개의 병원에서 112,000명의 EHR 데이터의 업로드를 완료했다고 합니다.
현재 매주 약 3,100명의 ‘핵심 참가자’가 리크루팅되고 있는 등의 추세를 보면 100만 명의 ‘핵심 참가자’를 모으는 목표는 2024년에 달성할 수 있을 것으로 예측하고 있습니다. 더불어 이러한 코호트를 기반으로 2022년, 2027년 및 그 이후까지 질병 바이오마커의 발견, 새로운 질병 분류의 개발, 임상 시험 보조, 인공지능 애플리케이션 개발, 신약의 개발 등의 세부적인 goal도 단계별로 세워놓고 있습니다.
이러한 프로젝트를 보면 정말정말 많은 생각이 듭니다. 이러한 코호트의 구축은 의학 연구에 매우 근본적인 영향과 큰 파급효과를 만들어낼 수 있는 프로젝트인데요. 아래와 같은 지점에서 너무도 인상적이며, 부럽기도 합니다.
- 국가 주도로 이렇게 중요한 일을 과감하게 시작했다는 점. (여기에는 오바마 대통령의 인사이트와 의지가 강하게 담겨 있는 것으로 알려져 있습니다. 정권 바뀌기 직전에 강하게 드라이브를 걸어서 법안을 통과시켰습니다)
- 번갯불에 콩구워먹듯 하지 않고, 충분한 파일럿 단계를 거쳐서 오랜 기간을 두고 진행하고 있다는 점. 무려 10여 년의 계획을 세워놓고 진행 중이며, 특히 이전 정권에서 시작한 일을 정권이 바뀌어도 예정대로 진행 중이라는 점. (PMI 예산은 HITECT Act에 명시되어 있어서 법안을 수정하지 않으면 다음 정권에서도 그다음 집행된다고 합니다. 한국에서는 불가능한 방식이라고 합니다. (from 성균관대학교 신수용 교수님 코멘트))
- 미국 전역에서 340개에 달하는 병원과 리크루팅 사이트가 공통적인 프로토콜에 따라서, 일사분란하게 체계적으로 움직이고 있다는 점
- 프로젝트 시작 1년 만에, 수십 만 명의 사람들이 자발적으로 자신의 데이터를 기증할 정도로 일반 시민들의 의식이 높다는 점
- 이런 일을 진행할 수 있을 정도로 개인정보보호법, cybersecurity, 비식별화 등에 대한 규제가 명확하고 합리적으로 정비되어 있다는 점.
- 개인정보 등으로 극히 민감할 수 있는 프로젝트를 100만명 규모로 국가 주도로 진행할 수 있을 정도로 이해관계자들의 이해관계 조정이 잘 되어 있다는 점.
읽으면서 내내 드는 생각은, 왜 한국에서는 이런 일을 안 or 못하고 있는지에 대한 원망과 서러움입니다. 정부는 바이오 헬스케어 산업을 육성한다면서 엉뚱한데 돈을 쓰고 있는가. 왜 이런 일을 추진할 인사이트와 추진력, 예산은 없는가. 혹은 이러한 일을 국내에서 추진한다면 걸림돌이 되는 수많은 규제와 불보듯 뻔한 몇몇 이해관계자들의 반발…이 떠오릅니다. 제가 샌디에고에서 관계자들을 만나서 넌지시 (한국에서 이런 일을 진행하면 당연히 문제 제기가 될) 몇가지 이슈에 대해서 물어보았더니 미국에서는 전혀 문제가 되지 않는다는 반응이었습니다.
하기야 All-of-Us에서는 이렇게 모은 익명화된 데이터를 클라우드 기반으로 이미 공개하고 있으니, 우리도 미국에서 잘 만들어주시는 이 데이터를 그저 가져다 쓰면 되기야 하려나요. 부럽고도 씁쓸합니다.