> 뉴스 > 이슈 > 생활
     
‘왓슨’ 프로그램 실패가 남긴 것
[Life] 인공지능 의학의 현주소
[102호] 2018년 10월 01일 (월) 마르틴 뮐러 economyinsight@hani.co.kr

미국 IBM이 개발한 암 진단 인공지능 프로그램 ‘왓슨’은 300여 종 의학저널, 200여 종 교과서, 1200만여 쪽에 이르는 전문자료와 임상사례를 학습·분석해 환자에게 적합한 치료법을 의사에게 제안한다. 왓슨과 의사의 의견 일치율이 88%에 이른다고 한다. 그럼에도 진료에 인공지능을 활용한다는 IBM의 계획은 이렇다 할 성과를 내지 못하고 있다.

마르틴 뮐러 Martin Müller <슈피겔> 기자
 
   
▲ 컴퓨터 서버를 90개나 장착한 슈퍼컴퓨터 ‘왓슨’은 2011년 미국 텔레비전 퀴즈쇼 <제퍼디>에서 당시 여러 챔피언 기록을 보유한 퀴즈 영웅들을 물리치고 승자가 됐다. 이제는 암과 각종 질병을 진단하고 최적의 치료법을 제공하는 역할을 하려 한다. REUTERS
지금 당신이 많이 아프다고 상상해보자. 병원에 갔더니, 둘 중 하나를 선택하라고 한다.
 
첫째, 과장 선생님의 진료를 받는 것. 굉장한 연륜이 있는 전문가처럼 보인다. 그가 부드러운 어조로 당신을 안심시킨다. “35년째 의사로 일하고 있다. 건강에 어떤 이상이 있는지 확실히 밝혀내겠다.” 이 의사를 신뢰하겠는가.
 
둘째, 의사 자격증을 딴 지 갓 3개월 된, 진료 경험이 거의 없는 인턴한테 진료를 받는 것. 단, 그가 옆구리에 끼고 있는 태블릿컴퓨터에는 각종 의료정보가 저장돼 있다. 인턴이 자신 있는 목소리로 말한다. “과장 선생님들의 600년치 진료 경험이 이 컴퓨터에 모두 들어 있다. 나는 언제든 기록을 찾아 처방에 참고할 수 있다. 환자는 아무 걱정 할 필요가 없다. 건강 문제를 확실히 진단해줄 수 있다.”
 
절대 비현실적인 시나리오가 아니다. 이 상상이 현실성을 갖는 데는 여러 이유가 있다. 독일의 일반지역 의료보험조합인 아오카(AOK)에 따르면, 독일에서 의료 과실로 사망하는 환자가 매년 2만여 명에 육박한다. 희귀한 질병의 경우 확실한 진단이 나오기까지 5년이 걸리기도 한다. 의사가 국가고시를 치르기 위해 암기하는 질병 수는 현재까지 알려진 3만 개 질병 중에서 기껏해야 1천 개 정도다. 
 
<제퍼디> 퀴즈쇼 이후 왓슨
컴퓨터 데이터와 인공지능을 활용하면 이런 상황을 바꿀 수 있다. ‘기계 의학’, 데이터에 의거한 질병의 진단과 치료는 1816년 청진기, 1895년 엑스레이 촬영, 1978년 자기공명영상(MRI)이 이뤄냈던 것보다 훨씬 영향력 있게 의술 분야를 개혁하고 있다. 가장 선구적인 기업은 ‘왓슨’(Watson)을 개발한 IBM이다. 
 
컴퓨터 서버를 90개나 장착한 슈퍼컴퓨터 ‘왓슨’은 2011년 미국 텔레비전 퀴즈쇼 <제퍼디>에서 당시 여러 챔피언 기록을 보유한 퀴즈 영웅들을 물리치고 승자가 됐다. 왓슨은 인간의 개입 없이 영화 명장면을 자발적으로 골라내는 프로그램을 갖고 있다. 이 소프트웨어로 왓슨은 영화 예고편을 혼자 만들어낸다. IBM은 이 기능을 형사사건에서 변호인 기능을 할 수 있도록 개발한 것은 물론 무인 열차 운행에도 응용하도록 만들어 시장에 내놓았다. 
 
왓슨은 광범위한 자료를 신속하게 분석하는 능력이 있다. IBM은 왓슨을 이용해 수십억달러에 이르는 의료시장을 개혁하려 한다. 기침·코감기 같은 잔병이 아니라, 암과 지금껏 원인을 규명하지 못한 질병까지 다루겠다는 것이다. 
 
의학 지식은 3년마다 두 배로 증가한다. 의사 개개인이 그 많은 양의 전문지식과 서적을 통달하는 것은 불가능하다. 환자 병력 역시 천차만별이다. 왓슨은 수많은 데이터와 지식을 총체적으로 검토해 환자 개개인에게 맞춤 치료법을 제시하려 한다. 검사 결과서, 문진, 엑스레이, CT, MRI 등의 자료를 모두 스캔해 그것을 바탕으로 진단을 내리거나 환자에게 치료법을 추천한다. 의사 개인이 절대 혼자서 해낼 수 없는 일이다. 
 
기센대학병원과 마르부르크대학병원에서 왓슨 프로그램을 시험했다. 기대와 달리 지능이 현저히 떨어지는 것으로 드러났다. 아주 간단한 증상조차 제대로 분석하지 못했다. 의사가 ‘환자가 가슴 통증을 호소함’이라고 컴퓨터에 입력했다. 진단서 목록 상위권에 당연히 올라야 할 심장마비, 협심증, 심근경색, 대동맥 균열 등의 병명이 전혀 언급되지 않았다. 대신 왓슨은 ‘드물게 발생하는 특수한 전염병이 가슴 통증을 유발했을 가능성이 없지 않다’고 진단했다. IBM이 왓슨을 의료산업에 활용하겠다고 발표할 때, 의사들이 품었던 의혹이 현실로 나타났다. IBM이 슈퍼컴퓨터라고 자랑하는 왓슨은 최첨단 인공지능 제품이 어쩌면 기능을 과장한 정교한 마케팅의 산물이 아닐까라는 우려가 나온다.
 
뢴클리닉 주식회사(기센대학병원과 마르부르크대학병원도 이 회사의 일부임) CEO 슈테판 홀칭거는 왓슨을 냉정하게 본다. 그는 2017년 2월 사장에 취임하자마자, 왓슨 프로젝트를 평가하기 위해 마르부르크에 있는 마르부르크대학병원에 갔다. 홀칭거가 당시를 회상했다. “인정하기 어려운 결과가 나왔다. IBM은 의학 지식을 보유하지 못했다. 의학이라는 학술 분야의 기본 지침조차 제대로 파악하지 않은 상태였다. 이렇게 더 진행하다가는 ‘미국 라스베이거스 쇼에 돈을 쏟아붓는 격’이란 생각이 들었다.”
 
문제는 돈이 아니었다. “IBM은 자신들이 완전히 새롭게 의학을 발명한 듯한 태도를 보였다. 하지만 실상은 속 빈 강정이었고, 계획이나 대책을 전혀 갖고 있지 않았다. 우리 쪽 전문가들이 일일이 그들을 도와줘야 할 형국이었다.” 홀칭거는 ‘닥터 왓슨’에게 단 한 명의 환자라도 치료받기 전에 이 프로젝트를 중단시켰다. “IBM은 우리 실험이 중요한 쇼윈도 역할을 할 것으로 본 것이 분명하다. 그래서인지 모든 채널에서 관련 책임자에게 영향력을 행사했다.” 반면 IBM 쪽은 “이 실험 프로젝트가 성공적으로 마무리됐다”고 발표했다. 
 
마르부르크에서 확인된 왓슨의 문제점은 언어 인식이었다. 언어 인식은 인공지능의 본질적인 능력이자, 능력을 확장할 수 있는 기본 토대다. 왓슨은 마르부르크에서 의사 보고서와 검사결과서 같은 환자의 서류를 스캔했다. 이를 바탕으로 질병의 진단과 결과를 암시하는 신호와 단어를 검토했지만, 만족할 만한 능력을 보여주지 못했다. 
 
인간의 복잡한 문장구조는 오늘날까지 모든 소프트웨어에 어려운 과제다. 특히 부정문은 끊임없이 문제를 일으킨다. ‘…를 배제할 수 없다’처럼 의사들이 널리 쓰는 문구는 컴퓨터 프로그램이 해석하기에 역부족이다. 
 
게다가 의사들은 속기 스타일로 문장 쓰는 걸 좋아한다. ‘기지(旣知), 이첨판(二尖瓣), 대동맥판의 사인(sin) 리듬으로 측정한 심장 박동 횟수 75’를 뜻하는 ‘HF 75, SR, 기지 BAK’ 표기를 왓슨이 이해하려면, 소프트웨어도 훈련을 받아야 한다. 한 번 훈련을 받은 뒤, 왓슨은 비교적 일을 잘해냈다. 하지만 이보다 더 난해한 문장은 왓슨이 이해하고 처리하기에 여전히 버거운 장애물이다.
 
의사들을 위한 보조 소프트웨어가 완벽하게 작동하지 못하는 건 왓슨만이 아니다. 이자벨 헬스케어와 샤리테(독일 베를린 의과대학병원)의 온라인 진단 시스템인 페노마이저(Phenomizer) 등 다른 보조 시스템도 완벽한 결과를 내지 못한다. 다만 IBM만 왓슨의 우월한 능력을 가장 맛깔스럽게 과대포장해 선전할 뿐이다. 
 
   
▲ 컴퓨터 데이터와 인공지능을 활용한 질병의 진단과 치료는 1816년 청진기, 1895년 엑스레이 촬영, 1978년 자기공명영상(MRI)이 이뤄냈던 것보다 훨씬 영향력 있게 의술 분야를 개혁하고 있다. 가장 선구적인 기업은 ‘왓슨’(Watson)을 개발한 IBM이다. REUTERS
완벽한 성능 ‘역부족’
왓슨은 자신의 가장 중요한 적용 분야인 암 치료에서도 IBM이 장담하는 업무를 겨우 처리할 뿐이다. 그럼에도 IBM이 왓슨에 기대를 거는 이유가 있다. 작업 속도가 빨라졌고, 컴퓨터로 유전자를 해석하는 일이 돈을 벌어다주는 수단이 됐다. 질병 치료에서 유전학 역할이 커질수록 소프트웨어의 중요성도 함께 커진다. 의사 능력이 한계에 다다르기 때문이다. 
 
IBM은 왓슨 능력에 전혀 문제가 없다고 호언장담한다. 왓슨은 환자 프로필만 입력하면 의사 메모, 임상 연구 결과, 각종 지침, 의학 논문, 환자 서류, 개별 병력, 돌연변이 등 수집 가능한 모든 의학 지식을 검토한다. 그다음 자신의 클라우드에서 이 데이터를 일일이 다 분석한 뒤 적절한 치료법을 추천한다고 강조한다.
 
그러나 의사들은 암 치료 분야에서도 이내 왓슨에 실망했다. “의과 수업 교과서에 나온 치료법조차 모두 정확하게 맞추지 못했다.” 미국 뉴욕 메모리얼슬로언케터링암센터에서 이 시스템을 수차례 사용했던 한 여의사의 경험담이다. “우리는 왓슨에 대한 인터넷 인쇄물이나 유튜브 광고를 보고 찾아온 환자를 치료했다. 기계 힘을 빌려 암을 완치하기를 원하는 환자들이었다. 하지만 훌륭한 인턴들이 종종 왓슨이 해낼 수 있는 것보다 더 좋은 치료법을 추천해줄 때가 있었다.”
 
미국 텍사스주 휴스턴에 자리잡은 MD앤더슨암센터는 왓슨과 진행한 공동 프로젝트를 조기 중단했다. 2013년부터 3년간 약 6천만달러를 쏟아부었지만 ‘낭비’ ‘결과 보고 지체’ ‘경영 실패’ 등의 비난 여론이 커지면서 내린 결정이었다.
 
벤처캐피털리스트 차마트 팔리하피티야는 왓슨을 ‘농담’이라는 단어로 일축한다. 인공지능으로 치면 구글과 아마존이 왓슨보다 훨씬 앞서 있다는 것이다. 독일 하이델베르크의 암연구센터 역시 ‘왓슨 프로젝트’ 계약 기간을 연장하지 않았다. 투자은행 제퍼리스그룹 분석가들은 인공지능에 관한 한 IBM을 신뢰하지 않는다. 최악의 경우 수십억달러 투자금이 쓸모 없는 휴지 조각으로 전락할 수 있다고 본다.
 
이에 반해 IBM은 왓슨 프로그램이 성공 일로에 있다고 본다. 더 나아가 “의사들이 ‘왓슨 프로그램’(Watson Health)을 긍정적으로 경험하고 있다”고 장담한다. 1년 전만 해도 150곳에 불과했던 ‘왓슨-종양학’을 사용하는 병원이 현재 전세계 230여 곳으로 확대됐고, 왓슨 관련 학술 논문이 지속적으로 느는 데서 확인할 수 있다는 것이다.
 
IBM의 이런 시각은 놀라운 일이 아니다. 클라우드를 기반으로 한 인공지능 사업은 IBM의 미래 전략을 구성하는 기본 요소다. IBM은 향후 몇 년간 의료건강 분야에 수십억달러를 쏟아부을 계획이다. 현재까지 인공지능 사업 중 전망이 밝다고 평가받는 분야는 오로지 금융뿐이다.
 
의학 분야에서 왓슨 프로그램의 현실은 ‘인공지능이 경험 많은 의사의 판단보다 월등해질 때까지 얼마나 더 시간이 걸릴 것인가’라는 근본 의문을 제기한다. 더 나아가 ‘의사 능력보다 뛰어나다는 걸 어떻게 증명할 수 있을까’라는 질문에 해답을 찾는 것이 관건이다. 
 
의학 애플리케이션 ‘아다’(Ada)를 개발 중인 마르틴 히르슈가 말했다. “디지털 의학에선 치료 효과를 에피소드로 증명하는 사례가 많다. 이 분야에 대한 고전적 학술 연구가 적어 아쉽다. 이전 치료법과 디지털 의학 치료법을 비교하는 좋은 논문들이 필요하다. 연구 결과 디지털 의학이 이전 의학과 비슷한 수준의 효과를 낸다고 판명되면, 우리는 이 새로운 분야의 도입을 위해 싸울 것이다.”
 
독일 쾰른에서 병원을 운영하는 의사이자 디지털 사업가 토비아스 간트너 생각 역시 히르슈와 비슷하다. “많은 데이터를 바탕으로 미래를 내다볼 수 있다는 왓슨 프로젝트는 원칙적으로 꽤 매력적인 아이디어다. 하지만 IBM의 마케팅은 현실에 부합하지 않다. 왓슨 시스템의 임상 투입을 진지하게 의논하기에 앞서, 실제 경험을 바탕으로 한 데이터를 확보해야 한다.”
 
왓슨 같은 소프트웨어가 개인병원뿐 아니라 종합병원까지 엄청나게 변화시키리라는 건 분명하다. 인공지능이 언젠가 ‘인간’ 의사보다 능력이 뛰어나게 된다면 말이다. 그렇다고 진료실에 의사가 단 한 명도 근무하지 않는 일은 없을 것이다. 환자를 돌보는 것은 단순한 측정치 해석이나 유전자 분석, 데이터 통합 검색 이상의 일이다. 환자에겐 때때로 신뢰 있는 대화, 위로, 격려가 필요하다. “모든 시도가 실패로 돌아갔다면, 환자와 대화하라.” 미국 하버드대학 심장 전문의 버나드 라운의 말을 새겨볼 필요가 있다. 

*2018년 10월호 종이잡지 50쪽에 실렸습니다.
 
ⓒ Der Spiegel 2018년 32호
Dr. Watson versagt
번역 장현숙 위원
정기구독자는 과거 기사 전체와 2016년 6월 이후 온라인 기사 전체를,
온라인 회원은 과거 기사 일부와 2016년 6월 이후 온라인 기사 전체를 보실 수 있습니다.

  

마르틴 뮐러의 다른기사 보기  
ⓒ Economy Insight(http://www.economyinsight.co.kr) 무단전재 및 재배포금지 | 저작권문의  

     
전체 기사의견(0)  
 
   * 300자까지 쓰실 수 있습니다. (현재 0 byte/최대 600byte)
   * 욕설이나 인신공격성 글은 삭제합니다. [운영원칙]
매체소개 구독신청 구독문의기사문의개인정보취급방침청소년보호정책 이메일무단수집거부찾아오시는 길
한겨레신문(주) | 제호 : 이코노미 인사이트 | 등록번호 : 서울 아 01706 | 등록일자 : 2011년 07월 19일 | 발행인 : 양상우 | 편집인 : 권태호
발행주소 : 서울특별시 마포구 효창목길 6 (공덕동, 한겨레신문사) | 한겨레 고객센터 1566-9595 | 청소년보호 책임자 : 장철규
Copyright 2010 Hankyoreh. All rights reserved.