이제 마지막 세 번째 유형의 의료 인공지능에 대해서 알아보자. 바로 생체 신호를 모니터링하고 분석하여 질병을 예측 및 예방하는 인공지능이다. 이 유형의 인공지능에 대한 쉬운 비유는 우리가 ‘디지털 의료는 어떻게 구현되는가’에서 살펴보았던 자동차와 비행기다.
과거에는 자동차 타이어에 펑크가 났는지, 혹은 엔진 오일이 부족하거나 배터리가 부족한지 정기적으로 점검하지 않으면 제때 알기 어려웠다. 내가 어릴 적 아버지는 명절 연휴 장거리 운전을 하시기 전에 타이어를 발로 밟아보거나 차체를 눌러서 타이어 공기압을 가늠하시고, 보닛을 직접 열어서 엔진 오일을 확인하시곤 했다.
하지만 이제 대부분의 자동차에서는 타이어 공기압이 부족하거나, 엔진 오일의 보충이 필요하면 미리 경고등으로 알려준다. 이는 자동차에 내장된 수많은 센서가 주행 중에도 자동차의 상태를 모니터링하여 이상이 있는 경우 조기에 경고함으로써 사고를 예방하는 것이다. 이는 비행기 터빈의 경우에도 마찬가지다. 수많은 센서가 비행 중에도 터빈의 기능을 모니터링하고 점검한다.
필자는 자동차와 비행기에 전문가는 아니지만, 사람의 생명과 건강도 자동차와 비행기 못지 않은 복잡한 원리에 의해서 유지된다는 것은 알고 있다. 자동차와 비행기에서 지속적인 데이터의 측정을 통해 사고를 미연에 방지할 수 있다면, 우리의 신체와 건강, 질병에 대한 데이터를 측정함으로써 질병을 예측하고 예방하는 의료적 효용을 얻을 수 있지 않을까. 만약 혈당 수치를 바탕으로 저혈당 쇼크의 가능성을 한 시간 전에 예측할 수 있다면, 혹은 가슴에 부착하는 심전도 센서를 통해 심장 마비의 징후를 하루 일찍 파악할 수 있다면 많은 생명을 구할 수 있을 것이다. 이는 결국 예방 의료, 예측 의료의 구현을 의미한다.
빅데이터 분석을 통한 예방, 예측 의료
한 사람이 생명을 유지한다는 것은 결국 끊임없이 데이터를 만들어내는 과정이기도 하다. 우리가 살아있는 이상 숨을 쉬고, 심장이 뛰고, 혈압이 바뀌며, 먹고, 싸고, 움직이며, 잠을 잔다. 이 과정에서 호흡수, 체온, 심전도, 심장박동, 혈당, 체온, 산소포화도, 활동량, 뇌파, 피부전도도, 장내 미생물의 구성 등이 끊임없이 바뀐다. 이러한 다양한 수치들은 우리의 건강 상태를 직간접적으로 나타내는 지표이다.
이러한 데이터는 병원에 있는 환자로부터는 물론, 우리의 일상생활 속에서도 쏟아지고 있다. 중환자실이나 응급실에 입원한 환자나 수술 중인 환자들의 경우, 활력징후(vital sign)을 비롯한 다양한 데이터를 실시간으로 측정한다. 더 나아가서 우리는 언제 어디서나, 혹은 평생에 걸쳐 지속적으로 이러한 데이터를 일상적으로 측정하고 저장하며, 전송할 수 있게 되었다. 휴대용 의료기기, 사물인터넷과 웨어러블 센서, 스마트폰 및 클라우드 컴퓨팅 기술 등의 발전 덕분이다.
웨어러블 센서의 발달로 다양한 헬스케어 데이터의 지속 측정이 가능해졌다 (PloS Medicine)
하지만 이러한 데이터를 바탕으로 예방 및 예측 의료를 실현하기 위해서 또 하나의 난관이 있다. 바로 이렇게 모니터링하고 있는 방대하고도 다차원적인 데이터를 어떻게 분석하여 적시에 질병을 예측할 것인지가 문제다. 사물인터넷이나 웨어러블 센서에 의해서 데이터를 측정하는 빈도는 지속적으로 높아질 것이며, 이러한 흐름은 결국 실시간 상시 모니터링으로 이어지게 된다.
수많은 건강에 대한 복잡다단한 데이터를 실시간으로 모니터링한다고 가정해보자. 24시간, 365일 계속 쏟아져 나오는 데이터를 실시간으로 분석하고 지속적으로 예측한다는 것은 인간의 힘으로 불가능하다. 징후의 변화에는 사람이 인식하기에는 어려울 정도로 미세한 것도 있을 것이다. 그렇기 때문에 이 부분에서 인공지능이 위력을 발휘할 수 있다. 인공지능이라면 끊임없이 생산되는 방대한 데이터도 실시간으로 분석하여 결과를 예측하고 위험도를 계산할 수 있으며, 인간이 미처 인지하기 어려운 미세한 변화와 패턴도 찾아낼 수 있다.
인공지능으로 패혈증 예측하기
이렇게 인공지능을 이용하여 질병을 예방 및 예측하는 구체적인 사례들을 살표보도록 하자. 먼저 신생아 중환자실에서 미숙아의 패혈증을 예측하려 했던 IBM과 캐나다 온타리오 공과대학(University of Ontario Institute of Technology)의 ‘프로젝트 알테미스 (Project Artemis)’는 그러한 대표적인 사례 중 하나다.
병원에 입원한 환자들이 사망하는 큰 이유 중의 하나는 바로 병원 내 감염이다. 환자들은 다양한 경로를 통해서 감염되는데, 특히 면역력이 약한 중증 환자, 고령 환자나 신생아의 경우 원내 감염에 취약하다. 특히, 이러한 감염이 진행되어 패혈증(sepsis)으로 발생하면 문제가 심각해진다. 패혈증은 세균이 사람의 면역 체계와 싸워서 이긴 상태로, 세균이 혈액 속에서 번식하여 전신에 감염증을 일으킨다. 중상을 입었을 때 사망하는 직접적인 원인 중의 하나가 바로 이 패혈증이다.
패혈증은 조기에 발견하고, 초기에 항생제를 집중적으로 투여하여 적절히 치료하면 사망률을 크게 낮출 수 있다. 하지만 조기 발견에 실패하면 시간이 흐름에 따라서 치사율이 크게 높아진다. 감염 직후 한 시간 내에 진단 및 치료가 되면 생존율이 80%이지만, 여섯 시간이 지난 후라면 생존율이 30%로 낮아지게 된다. 패혈증은 적절한 치료를 받지 못할 경우, 중증 패혈증, 그리고 패혈성 쇼크로 발전하게 되며 이 과정에서 치사율은 크게 올라가게 된다.
패혈증의 초기에는 체온의 변화, 자극에 대한 반응 감소, 혈압 저하, 호흡수 증가 등의 변화가 나타나므로, 이러한 수치의 변화를 정확하게 감지한다면 초기에 패혈증을 진단할 수 있을 것이다. 더 나아가, 이런 징후의 미세한 변화를 파악한다면 아예 패혈증이 발생하기 전에 감염의 징후를 미리 파악할 수 있을지도 모른다.
IBM의 신생아 패혈증 예측 프로젝트
IBM은 2008년부터 캐나다의 온타리오 공과대학의 연구진과 공동연구를 통해 신생아 중환자실에 입원한 미숙아들의 패혈증 등의 이상 징후를 사전에 예측하는 ‘프로젝트 알테미스’를 진행한다고 밝혔다[1, 2, 3, 4].
기존의 연구를 통해 밝혀진 바에 따르면, 조산아들의 패혈증 증상이 나타나기 전 최대 24시간까지 먼저 활력 징후에 미세한 변화가 나타난다. 그 변화 중의 하나는 심박의 변화가 낮아진다는 것이다. 시간에 따라 심박 수가 변화하는 정도를 심박변이도(heart rate variability)라고 한다. 정상적인 상태에서 심박은 시간에 따라 자연스럽게 오르거나 내리면서 변화한다. 하지만 패혈증에 걸린 조산아의 경우에는 심박의 변화가 지나치게 규칙적으로 변한다는 것이 알려진 것이다.
미숙아의 패혈증을 예측하기 위한, 프로젝트 알테미스 (출처: IBM)
프로젝트 알테미스에서는 이러한 심박의 변화 정도와 혈압, 호흡수 등을 바탕으로 패혈증을 예측하려고 시도했다. 사실 신생아 중환자실에서는 기존에도 환자들의 상태를 모니터링하기 위해 다양한 데이터를 측정한다. 하지만 이는 1초에 수천 개의 데이터가 쌓일 정도로 방대한 데이터이기 때문에 기존의 병원 시스템에서는 저장되지 못하고 버려지기 마련이었다. 2010년 발표된 알테미스 관련 논문에서 저자들은 ‘의사와 간호사들은 온라인 쇼핑, 금융, 음악 등에서는 최신 기술을 활용하지만, 정작 신생아 중환자실 내에서는 20년 전의 기술을 여전히 활용하고 있다’고 지적했다.
이러한 연구를 진행하기 위해서 신생아들의 데이터를 측정하는 것에서 시작했다. 2009년 토론토의 아동병원(The Hospital for Sick Children)에는 이 프로젝트를 위해 200명의 신생아 데이터를 연구했다. 이후 2010년에는 프로비던스의 여성아동병원(Women and Infants Hospital)의 신생아 중환자실 80병상에서 클라우드를 이용해 데이터를 측정하기 시작했다. 이후 이 프로젝트는 중국의 상하이와 선전, 그리고 호주의 신생아 중환자실로 확대되었다.
사실 이 프로젝트 알테미스의 결과는 아직 논문으로 출판되지는 않았다. 하지만 IBM의 자료에 따르면 이 시스템을 통해서 신생아 중환자실의 감염 징후를 최대 24시간까지 미리 파악할 수 있으며, 연구를 이끄는 온타리오 공과대학의 캐롤린 맥그레거(Carolyn McGregor) 박사 역시 연구의 초기 결과는 매우 유망하다고 밝힌 바 있다.
존스 홉킨스의 패혈증 예측
더 나아가 존스 홉킨스 의과대학의 연구진은 IBM의 프로젝트 알테미스와 유사한 목적의 인공지능을 개발하여 2015년 논문으로 발표했다. 이 연구는 신생아 환자가 아니라 일반 중환자실의 환자를 대상으로 진행된 것이다. 논문에 따르면 패혈증이나 패혈성 쇼크가 진행 중인지 포착하는 방법은 기존에도 존재했지만, 패혈성 쇼크를 사전에 예측하기 위한 목적의 연구는 최초라고 언급하고 있다.
이 연구에서는 전자의무기록에 매일 기록되는 체온, 호흡수, 심장박동 수, 혈압 등 환자의 일상적인 데이터를 바탕으로 패혈성 쇼크의 위험이 높은 환자를 예측할 수 있는 TREWScore (Targeted Real-Time Early Warning Score), 즉 ‘실시간 조기 경고 점수’를 개발했다.
13,014명 환자의 데이터로 학습시킨 TREWScore를 새로운 환자에게 적용해보았더니 AUC가 0.83으로 상당히 우수했다. 특히 패혈성 쇼크 발생보다 평균 28.2시간이나 일찍 예측할 수 있었다. (footnote: 더 엄밀히 말하면 평균(average)가 아니라 평균값(median)을 기준으로 한 것이다) 이렇게 인공지능 기반의 패혈성 쇼크 예측의 성능은 기존에 병원에서 사용되던 다른 방식들에 비해서도 민감도와 특이도가 모두 우수했다.
또한 TREWScore는 장기 기능 장애도 사전에 예측할 수 있었다. 앞서 언급했듯이, 패혈성 쇼크와 관련된 중요한 기준이 바로 장기 기능 장애로, 이후부터 사망률이 급격히 증가한다. TREWScore는 민감도 0.85의 수준으로 68.8%의 환자에 대해 평균 7.43시간 미리 패혈증과 관련된 장기 기능 장애를 예측할 수 있었다.
이러한 수준의 정확도는 병원에서 본격적으로 활용되기 위해서는 부족할 수 있으며, 추가적인 임상시험이 필요할 수 있다. 또한 이런 시스템이 실제 병원에서 활용되기 위해서는 많은 수의 환자에 대해서 다양한 데이터를 지속적으로 측정하고, 저장하며, 실시간으로 분석할 수 있어야 할 뿐만 아니라, 이 분석 결과를 의료진의 기존 진료 프로세스에 적절하게 녹여낼 수 있어야 하므로 그리 간단한 문제는 아니다. 하지만 이렇게 환자의 위험을 사전에 정확하게 알려줄 수 있다면 결과적으로 환자의 건강뿐만 아니라, 의료진의 업무와 의료 비용 측면에서도 긍정적인 효과를 기대할 수 있다.
인공지능을 통한 혈당 관리
다음으로 살펴볼 사례는 인공지능을 통한 당뇨병 환자의 혈당 관리에 관한 것이다. 혈당 역시 우리가 살아가면서 끊임없이 변화하는 중요한 수치 중의 하나이다. 탄수화물 함량이 높은 음식을 먹으면 혈당이 올라가고, 운동과 같은 신체 활동을 하면 혈당이 내려가게 된다.
정상인의 경우 과식을 하거나 격렬한 운동을 하더라도 대개 호르몬 등의 정상적인 조절을 통해서 혈당은 적정한 수준에서 유지된다. 하지만 당뇨병 환자의 경우는 혈당을 적절한 수준에서 조절하지 못한다. 혈당이 지나치게 높게 유지되면 앞서 살펴본 당뇨성 망막병증 등 각종 합병증의 원인이 되고, 너무 낮으면 저혈당 쇼크로 생명이 위험해질 수도 있다. 당뇨병 환자의 혈당은 식습관, 생활 습관, 인슐린 사용 등에 따라서 급격히 바뀔 수도 있으므로, 이들에게 적정 수준에서 혈당을 유지하는 것은 어렵고도 번거로운 일이다.
일반적인 혈당계는 손가락에 피를 내어서 혈당을 측정한다. 이 경우에는 피를 내어야 하기때문에 불편함이 있을 뿐만 아니라, 그 ‘순간’의 혈당만을 측정하므로 현재 혈당이 오르는 중인지 혹은 내려가는 중인지의 추이를 알기 어렵다. 하지만 메드트로닉이나 덱스콤 등의 회사가 개발한 연속혈당계가 상용화되면서, 혈당을 실시간에 가깝게 ‘지속적’으로 측정할 수 있게 되었다. 이는 혈당 변화 추이를 파악할 수 있을 뿐만 아니라, 이 데이터에 기반한 인공지능으로 향후 혈당 변화를 예측하여 당뇨병 환자의 혈당 관리에 큰 도움을 수 있다.
IBM 왓슨을 이용한 혈당 관리 앱
앞서 ‘디지털 의료는 어떻게 구현되는가:인공지능’ 챕터에서 메드트로닉의 연속혈당계와 IBM 왓슨이 결합하여 만들어진 슈거아이큐(Sugar.IQ)라는 앱을 이미 소개한 바 있다. 이번에는 조금 더 구체적인 데이터와 함께 이야기해보려 한다.
슈거아이큐
의료기기 회사 메드트로닉은 2016년 9월 연속 혈당계로 얻은 혈당 수치와 사용자가 입력한 식습관, 인슐린 사용법 등의 데이터를 토대로 IBM 왓슨이 몇시간 뒤의 혈당 변화를 예측해주는 슈거아이큐 앱을 발표했다. 하지만 발표 당시 이 앱의 구체적인 정확도와 환자 대상의 성과에 대해서는 언급하지 않았다. (footnote: 이 경우 IBM의 인공지능 기술을 활용하였기 때문에 왓슨이라는 브랜드를 사용한 것으로 보인다. 앞서 언급한 IBM 왓슨 포 온콜로지 등의 자연어 처리 기반의 솔루션과는 다소 차이가 있는 방식이다)
이후 2017년 6월 샌디에이고에서 열린 미국 당뇨 협회(ADA 2017)학회에서 메드트로닉의 연구자는 2017년 3월부터 5월까지 이뤄진 81명의 환자 대상의 소규모 임상 연구 결과를 발표했다. 환자들은 평균 2주간 앱을 사용하였고, 사용하기 한 달 전의 혈당과 사용하는 경우의 혈당이 어떻게 관리되었는지를 비교하였다. 이 연구는 비록 단기간에 걸쳐 이뤄진 소규모 연구였지만, 그 결과 나타난 혈당 관리 성과는 놀라울 정도였다. (이 자료는 ADA 2017에 참석하신 서울의료원 김태호 과장님께서 보내주셨습니다. 다시 한번 감사드립니다!)
슈거아이큐를 활용하면 혈당이 적절한 범위 안에 유지되는 시간이 하루 평균 37분이 늘었으며, 저혈당이나 고혈당을 겪는 횟수가 각각 11.4%, 8.4% 감소했다. 또한 이 앱을 통해서 혈당 관리에 대한 조언(insight)을 받기 3일 전과 받고 난 뒤 3일 후를 비교해보면 저혈당과 고혈당을 겪는 빈도가 각각 65%, 55% 감소했다. 뿐만 아니라 저혈당증을 예측하는 인공지능의 정확도에 대해서도 구체적으로 공개했다. 만 명 이상의 데이터 학습을 통해서 2시간에서 4시간 이후의 혈당을 AUC 90% 이상의 상당한 정확도로 예측할 수 있다고 한다.
슈거아이큐의 활용 사례
이 앱은 개별 환자의 혈당 변화와 인슐린 사용 습관 등을 바탕으로 혈당 변화를 예측하고, 혈당 관리에 유용한 조언(insight)를 실시간으로 제공한다. 이를 통해 혈당 관리에 좋은 습관은 더 강화하고, 좋지 않은 습관은 줄이도록 유도하는 것이다. 예를 들어, 환자가 특정 요일이나 시간대, 혹은 특정 장소에서 혈당 관리가 잘 되지 않는다면 이러한 패턴을 파악하여 적절한 조언을 제공한다.
발표에서는 두 환자의 사례가 소개되었다. 첫번째 환자는 28년 동안 인슐린을 사용해온 제 1형 당뇨병 환자로 49살의 여성이었다. 그녀는 혈당이 200 mg/dL로 높아졌을 때 고용량의 인슐린을 종종 사용했다. 이런 인슐린 때문에 오히려 혈당이 지나치게 낮아져서 50 mg/dL 이하의 저혈당을 겪곤 했다. 슈거아이큐 앱은 환자의 이러한 습관을 파악하고 인슐린의 용량을 줄이라는 조언을 제공했고, 그 결과 야간 저혈당의 발생이 줄어들게 되었다.
두 번째 환자는 65세의 남성 환자로 20년 동안 인슐린을 사용해왔던 제 2형 당뇨병 환자이다. 이미 많은 합병증을 겪고 있는 환자였다. 슈거아이큐는 이 환자가 점심으로 45~60g의 고탄수화물 식사를 하는 경우에는 식사 후 2.5시간 동안 고혈당 상태가 유지되는 것을 발견했다. 반면 45g 이하의 낮은 함량의 탄수화물로 이루어진 식사를 하는 경우 고혈당의 빈도가 낮았다. 슈거 아이큐는 저 탄수화물 점심식사를 권유했고, 그 결과 식후 고혈당이 1.5시간으로 줄어들었다.
이 연구 결과는 짧은 기간 동안 제한적인 숫자의 환자를 대상으로 하였기 때문에, 슈거아이큐가 혈당 관리에 정말 도움이 되는지를 밝히기 위해서는 추가적인 연구가 필요하다. 하지만 연속 혈당계를 통해서 환자들의 혈당 상태를 실시간으로 모니터링할 수 있으며, 이 연속 혈당 데이터가 식습관, 생활 습관, 인슐린 사용 등의 데이터와 결합되면서 혈당 관리에 인공지능의 역할은 향후 더욱 커질 것으로 본다.
(계속)