미국에서 인허가 받은 의료 인공지능이 보험 급여를 얼마나 받고 있는지를 CPT 코드에 대한 청구 건수를 통해 분석한 논문이다. NEJM AI 에 2023년 11월에 출판되었다.
의료 인공지능이 FDA 등 규제 기관에서 의료기기 인허가를 받는 것은 의료 현장 활용 및 사업화를 위한 시작에 불과하다. 미국에서는 이제 700여 개에 달하는 (논문이 집필되는 시점에서는 500개 이상의) 머신러닝 및 인공지능 기반의 의료기기가 FDA 인허가를 받았다. 하지만 인허가 이후에 이런 인공지능 의료기기가 의료 현장에 얼마나 활발하게 도입되어서, 실제로 사용되고 있는지에 대해서는 알기가 어렵다.
이 논문에서는 미국의 의료기관이 공보험 및 사보험의 보험 수가를 청구하기 위해 사용하는 CPT 코드를 분석해서 실제로 어떤 의료 인공지능이, 어떻게, 얼마나 사용되고 있는지를 분석했다. 이 논문의 결론도 중요하기는 하지만, 그 결론이 나오기 위해서 이런 CPT 코드를 어떠한 방식으로 분석했는지에 대해서 파악하는 것이 필요한 연구이다. (CPT 코드가 상당히 복잡하고, 현실적으로 의료 현장에서 청구에 대한 변수가 많기 때문에, 본질적으로 여러 가정과 제약이 들어갈 수밖에 없는 구조의 연구이다.)
이 연구는 CPT 코드 Category I, II, III 에서 인공지능과 관계된 코드를 발라내는 것부터 시작한다. 코드의 descriptor에 인공지능과 기계학습과 관련된 용어가 포함된 것도 있고, 혹은 보험사의 정책 문서에 관련된 디테일이 설명된 것도 있다. (이 과정에서 후술할 다양한 한계점들이 들어간다.) 이를 바탕으로 2018년 1월부터 2023년 6월까지 미국 전역의 11 billion 개의 CTP 청구를 분석했다.
표면적 결론
이 논문의 결론은 미국에서 의료 인공지능의 의료 현장 도입은 여전히 초기이고, 대부분의 사용은 한 손으로 꼽을만한 적은 숫자의 인공지능에 의해서 선도되고 있다는 것이다.
총 16개의 의료 인공지능 관련된 procedure를 찾아내었고 (한 precedure에 여러 CPT 코드가 해당되는 것도 있어서, CPT 코드로 치면 32개에 해당), 어떤 procedure가 가장 많이 청구되었는지를 살펴보았다.
가장 많이 청구된 것은 HeartFlow로 대표되는 Coronary Artery Disease 관련 인공지능으로, 67,000건이 넘는다. 두번째로 많은 것은 LumineticsCore로 대표되는 Diabetic retinopathy 관련 인공지능으로 청구가 15,000건이 넘는다.
놀랍게도(?) 그 이외에는 청구 건수가 1만건이 넘는 CPT 코드가 없다. 3위는 Coronary Atherosclerosis 으로 약 4,400건, 4위는 Liver MR로 2,438건에 불과하다. 심지어 16개의 procedure 중에서 6가지는 청구 건수가 총 10건도 되지 않는다.
더 중요한 것은 증가 추이
중요한 것은 단순 숫자보다도 이런 청구 건수의 증가 추세이다. 왜냐하면 이런 수가 코드는 대부분 최근에 만들어졌기 때문이다. 이 논문에서 분석한 코드가 만들어진 기간의 중간값은 약 1년에 불과하다. 코드가 만들어진지 1년도 되지 않았기 때문에 절대적인 수치 자체는 의미가 없을 수 있고, 사용량이 얼마나 빠르게 증가하는지가 중요할 수 있다.
인공지능과 관련된 청구 건수는 크게 증가하고 있고 (특히 1, 2위로 꼽힌 procedure의 경우), 관련해서 청구할 수 있는 medical procedure도 2019년 1개 -> 2021년 4개 -> 2023년 16개로 크게 증가했다. 이런 부분이 단순히 청구 건수보다는 더 중요해보인다.
주의: 연구 방법의 한계
마지막으로 언급하고 싶은 것은 이 논문의 Methods 측면의 한계이다. 최근에 들었던 어느 강의에서 연자가 이 논문을 언급하시면서 ‘미국에서는 심혈관계 의료 인공지능의 청구가 가장 많다’는 이야기를 하신적이 있다. 이 논문의 표면적인 결론으로는 정확하지만 Method의 한계에 대한 이해가 필요하다. 이 논문은 구조적으로 실제 의료 현장에서의 의료 인공지능의 전체 그림을 담지는 못하고 있다.
일단 이 논문이 분석한 (IQVIA) 청구 데이터베이스가 65세 이하의 환자에 대한 데이터만 담고 있다. 또한 CPT 코드만 대상으로 했기 때문에, 또 다른 중요한 급여 지불 채널인 메디케어의 NTAP은 분석 대상에서 아예 빠져 있다. 이 때문에 미국에서 주요한 ‘청구가능한’ 인공지능인 Viz.ai의 대동맥폐색 판별 인공지능은 이 논문의 범위에 누락되어 있다.
내가 보기에 연구방법론적 측면의 가장 큰 한계는 AI-specific CPT 코드만을 발라내기 위해서 non-AI 도 함께 청구할 수 있는 코드는 모조리 제외해버렸다는 것이다. 예를 들어서 mammogram CAD와 관련된 CPT code는 과거의 전통적인 CAD로도 청구할 수 있고, 최근의 딥러닝 기반으로 새롭게 허가 받은 인공지능으로도 청구할 수 있다. 이런 코드는 AI-specific 한 청구과 그렇지 않은 청구가 혼재되어 있기 때문에, 아예 분석에서 빼버렸다. 이런 이유로 이 연구에서는 영상의학 분야의 인공지능이 구조적으로 underrepresentation 될 수밖에 없다.
이 분야를 좀 아는 사람이 Table 1을 보면, 좀 이상할 정도로 radiology와 관계된 인공지능이 너무 적다 싶을텐데, 이런 이유가 있는 것이다. 때문에 이 테이블만 보고 ‘미국에서는 심혈관계 관련 인공지능이 가장 많이 청구된다’고 해석하는 것은 주의해야 할 부분이다.
연구의 의의와 미래
인공지능이 인허가 이후에 실제로 의료 현장에서 어떻게 사용되고 있는지를 분석하는 것은 매우 중요하다. 최근에도 내가 참여한 전문가 인터뷰에서 ‘의료 인공지능이 인허가는 많이 받았는데, 의료 현장에는 도입이 별로 안 되고 있다. 이걸 보면 의료 인공지능의 가치가 별로 없는 것 아닌가?’ 하는 질문을 받은 적도 있다. 이는 사실 너무 시기상조의 질문인 것이, 이 논문에 나오는 것처럼 아직 미국에서도 관련 수가 청구 코드가 만들어진지 (중간값으로) 1년 정도 밖에 되지 않은 초창기 분야이기 때문이다.
그리고 의료 현장에서의 도입을 위해서는 단순히 수가가 ‘청구 가능한지’의 여부 뿐만 아니라, 그 가격, 이 논문에서도 언급되듯이 임상 워크플로우, 의료진과 인공지능의 상호 작용 방식, 환자 동의, 더 나아가서는 인터넷 속도 (..)까지너무도 많은 추가적인 변수가 작용한다. 이런 변수를 감안하면 도입에는 시간차가 들어갈 수밖에 없다.
그래서 방법론적인 한계는 있지만, 이런 연구를 진행하는 것은 중요해보인다. 특히 지금까지의 청구 건수를 분석하는 것도 중요하겠지만, 수년을 주기로 이런 청구 건수가 어떻게 증가하는지 ‘추세’를 분석하는 것이 더 중요할 것이다. 그리고 국내에서도 이제 혁신의료기기통합심사평가 및 신의료기술평가 유예제도를 통해서 임상 현장에 도입되는 경우들이 생기고 있으니, 이런 인공지능들이 현장에서 얼마나 활용되고 있는지에 대한 분석도 진행되면 좋을 것이다.