* 본 칼럼은 제가 매일경제에 기고한 것입니다. 분량 제한 때문에 실리지 못했던 원문을 올려드립니다. 매경의 칼럼은 여기에서 보실 수 있습니다.
최근 국내외를 막론하고 신기술 분야를 통틀어서 가장 뜨거운 관심을 받는 주제를 하나만 고르라면 아마도 인공지능이 될 것이다. 인공지능은 불과 1년 전만 하더라도 한국에서 크게 관심을 받지 못했지만, 지난 3월 알파고 사태 이후로 돌연 국가적인 관심사로 떠올랐다. 정부에서는 부처별로 앞다투어 인공지능 관련 컨트롤 타워를 만들겠다고 하며, 소위 ‘제 4차 산업 혁명’이라는 (국내에서만 사용되는 용어가) 언론, 도서, 강의 뿐만 아니라, 대선 주자들의 공약에도 등장하고 있다.
최근 인공지능에 대한 열풍은 다소 과도해보이지만, 장기적으로 인류의 미래에 인공지능이 큰 영향을 미치리라는 전제 자체를 부인하는 사람은 별로 없어 보인다. 그리고 그런 인공지능의 영향을 가장 크게, 먼저 받고 있는 분야가 바로 의료 분야이다.
국내 병원의 왓슨 도입
이러한 인공지능의 거센 파도를 맞이하는 것은 한국 의료계도 예외는 아니다. 병원과 학회에서도 인공지능이 화두로 등장하고, 몇몇 대학병원은 이미 관련 연구소와 센터를 만들어서 발빠르게 관련 연구를 선도하려고 하고 있다. 식약처는 의료 인공지능 소프트웨어와 관련한 규제 가이드라인을 만들었다.
최근에는 국내 병원에 IBM 왓슨이 잇따라 도입되며, 한국 병원의 진료실도 인공지능을 본격적으로 활용하기 시작했다. 지난 9월 가천대 길병원에 이어, 부산대학병원, 건양대학병원까지 IBM의 인공지능, ‘왓슨 포 온콜로지’를 도입한 것이다. 다른 몇몇 병원들도 추가적으로 도입을 고려한다는 이야기도 들려온다.
‘왓슨 포 온콜로지’는 암 환자의 진료 기록을 바탕으로 치료법을 권고해주는 인공지능이다. 최근 IBM의 발표에 따르면 이를 도입한 병원은 미국, 중국, 태국, 인도를 포함한 전세계 11곳 정도이다. 그중 세 개가 한국 병원이니 적지 않은 비중이라고 할 수 있다.
그런데 우리는 과연 닥터 왓슨을 진료실로 모실 준비가 되어 있는가? 인공지능 의사는 앞으로 많은 논쟁과 이슈를 낳을 것이다. 하지만 우리는 아직 이 부분에 대한 깊은 고민이 부족한 것만 같다. 의료계 일각에서, 병원들이 충분한 고민 없이 왓슨을 무분별하게 경쟁적으로 도입하는 것이 아닌지 하는 우려 섞인 목소리가 나오는 이유이기도 하다.
증명되지 않은 왓슨의 정확성
무엇보다 ‘왓슨 포 온콜로지’의 정확성은 아직 증명된 바 없다. 그 정확성에 대해서 참고할 수 있는 근거는 지난 12월 발표된 인도 마니팔 병원의 연구 정도가 유일하다. 이 병원에서 지난 3년간의 유방암, 대장암, 직장암, 폐암 등 4개 암종의 환자 1,000명의 치료법에 대해서 왓슨과 의료진의 일치도를 평가했다.
그 결과 80%의 경우 왓슨과 의료진의 결정은 일치했다. 하지만 암종 별로 일치도는 크게 달랐다. 직장암은 85%로 높았지만, 폐암은 17.8%로 낮았다. 삼중음성 유방암의 경우 67.9%였으나, HER2 음성 유방암은 35%였다. 즉, 왓슨의 실력은 아직 암종 별로 들쭉날쭉 하다고 볼 수 있다.
IBM은 왓슨이 의사를 대체하는 것이 아니라 보조하기 때문에 문제가 없다는 입장이다. 이 주장도 일리는 있다. 의료에서 최종 의사 결정권자는 의사이며, 만약 의료 사고가 났을 경우 이에 대한 책임도 의사가 진다. 아무리 인공지능이 발전하더라도 의료적 의사 결정에서 의사의 개입을 완전히 배제할 수는 없을 것이다.
이러한 측면에서 자율주행차와 의료 인공지능은 다르다. 자율주행차에서 차선을 바꾸거나, 브레이크를 밟고, 유턴을 할 때 매번 운전자의 허락을 받지는 않는다. 하지만 의료는 의사결정에 대해서 의사가 허가를 해야 한다는 점에서 최소한의 안전판이 있다고도 볼 수 있다.
- 관련 포스팅
의사는 최후의 보루인가
하지만 의사라는 최후의 보루 때문에 왓슨이 환자에 미치는 위해가 적다는 주장은 재고의 여지가 있다. 흔히 왓슨을 자동차 네비게이션에 비유하기도 한다. 네비게이션이 가장 빠른 길을 나름대로의 계산을 통해 알려주기는 하지만, 그 경로를 따를지는 온전히 운전자의 몫이다. 하지만 네비게이션 때문에 운전자들은 과거에 비해 지리를 잘 알지는 못하게 되었다. 네비가 알려준대로 가면 되기 때문이다. 하지만 네비게이션이 오작동할 경우 가끔 엉뚱한 곳에서 길을 헤매거나, 심한 경우 사고의 원인이 되기도 한다.
이러한 ‘탈숙련화’는 비행기 파일럿에게도 영향을 미쳤다. 자동 항법 시스템이 발달하면서, 비행기 파일럿은 이착륙 시 이외에는 이제 조종간을 거의 잡지 않는다. 그 결과 사고 빈도와 이로 인한 인명 피해도 크게 줄었으며, 이에 따라 조종실에 들어가는 인원도 1970년대 5명에서, 현재의 2명으로 감소했다. (이제는 2명도 많다는 주장도 나온다) 하지만 연구에 따르면 이러한 자동화 때문에 조종사들이 비상시에 대처하는 조종 기술이 크게 약화된 것으로 나타났다.
비행기에 오토파일럿 시스템을 도입할 때에도, ‘인간’ 파일럿이라는 최후의 수단이 있기 때문에 안전하다고 생각했을지 모른다. 하지만 자동화로 인한 파일럿의 탈숙련화라는 변수를 고려하지 못했던 것이다. 이와 유사하게 왓슨도 시간이 지남에 따라서 의사들의 탈숙련화를 야기하지 않는다는 법은 없다.
의료 인공지능 규제의 어려움
왓슨을 의료기기로 분류할지, 혹은 어떻게 규제할 것인지, 더 나아가 규제가 현실적으로 가능한지 판단하는 것도 어려운 문제다. 필자도 최근 식약처의 전문가 협의체의 일원으로 다른 의료 전문가들과 함께 이 문제를 고민했다. 결론적으로 의료기기로 분류하지 않기로 방향을 잡았지만, 그 과정에는 많은 고민이 있었다.
필자는 왓슨이 기본적으로 의료기기의 성격을 가진다고 생각한다. 치료법을 분류하여 우선순위를 매기는 것은 의료적 의사 결정이라고도 볼 수 있기 때문이다. 하지만 현실적으로 왓슨 포 온콜로지와 같은 시스템을 규제할 수 있는가?
IBM은 왓슨 포 온콜로지의 장점으로 매일같이 쏟아져 나오는 암 관련 최신 논문을 반영한다는 점을 꼽는다. 그 결과 어제의 왓슨보다 오늘의 왓슨은 진화된 버전일 수 있다. 만약 왓슨을 의료기기로 분류한다면, 매일 진화하는 왓슨은 매일 인허가를 새로 받아야 할까? 이러한 잣대라면 왓슨은 의료 현장에서 영원히 활용되기 어려울지도 모른다.
여러 상황을 고려하면, 왓슨은 추가적인 임상 연구는 필수적으로 보인다. 하지만 왓슨의 정확성 검증을 임상 연구를 통해서 증명하려고 한다고 해도, 어떤 수치를 기준으로 해야 할 것인지도 무척 애매하다. 최근 필자가 만난 IBM 본사의 종양 전문의도 이에 동의했다.
다각도의 고민이 필요
뿐만 아니라, 왓슨을 어떻게 활용할지에 따라서도 환자에 미치는 영향은 달라질 수 있다. 예를 들어, 어떤 환자의 경우 왓슨에게 의견을 물을 것인지, 왓슨의 의견을 환자에게 공개할 것인가, 왓슨과 의료진의 판단이 다른 경우 어떻게 할 것인가 등등. 이러한 질문에 어떻게 답할 것인지가 의료 서비스의 질, 환자의 치료 결과, 더 나아가 국가 건강보험 재정에도 영향을 미칠 수 있다. 하지만 지금으로써는 이러한 기준이 부재한 상황에서 국내 세 병원이 왓슨을 활용하게 된다.
왓슨의 병원 도입은 첨단 기술을 활용하여 환자의 치료 효과를 높이기 위한 노력의 일환일 것이다. 하지만 왓슨을 도입하고 활용하기에 앞서, 의료계 전반에서 반드시 해야만 하는 깊은 고민이 아직까지 부족하다는 느낌을 지울 수 없다. 사실 이는 미국에서도 마찬가지로 겪는 문제다.
이러한 문제의 근본 원인 중 하나는 기술의 발전이 지나치게 빠르다는 것이다. 기술의 기하급수적 발전에 따라 이런 사례는 향후 필연적으로 더 늘어날 것이다. 하지만 이러한 어려움이 있다고 해서, 인간의 생명을 책임지는 의료 분야에서 이 문제를 그저 좌시할 수는 없다. 왓슨의 도입에 대해서도 보다 복합적이고 다각적인 고민이 필요하다.