"의료빅데이터 신뢰 어렵다..조작적 정의·데이터 질 관리 중요"

서울성모병원 김헌성 교수 "데이터 이해와 분석 중요..인공지능은 실제 적용 낮아"
서민지기자 mjseo@medipana.com 2019-11-08 12:20
[메디파나뉴스 = 서민지 기자] 단순하게 모아진 병원의 진료기록이나 건강보험공단과 심사평가원의 자료, 유전체 정보 등 빅데이터를 바로 분석할 경우, 많은 제한점이 발생하고 분석방법 적용에 따라 결과가 달라지는 문제도 발생할 수 있다.
 
서울성모병원 내분비내과 김헌성 교수는 8일 의료인공지능의 현재와 미래 심포지엄에서 이같이 지적하고, 데이터 질 관리와 조작적 정의의 중요성을 강조했다.
 
김 교수는 "의료계의 빅데이터는 '리얼월드데이터(RWD)'라는 용어를 사용하는 게 맞는 표현이다. 다양한 소스를 통해 생성된 모든 데이터, 즉 작위적으로 이뤄진 임상연구를 목적으로 하지 않는 모든 데이터를 의미한다"면서 "이를 분석하면 현재의 트렌드를 분석할 수 있다"고 설명했다.
 
이어 "의료계는 에비던스(근거)가 중요한 학문이기 때문에 빅데이터에 대해 보수적으로 접근할 수밖에 없다"면서 "진단기기의 발달로 더욱 정확한 빅데이터를 얻을 수 있게 되면서, 의학도 발달하고 있다"고 말했다.
특히 의료분야는 빅데이터 분석이 제대로 이뤄지지 않을 경우 의료사고로 이어지기 때문에 매우 정확하게 가야 하며, 이 과정에서 기계와 의사의 협업이 매우 중요하다고 시사했다.
 
김 교수는 "부교수급 이상은 원격의료, CDM, CDSS, CCM, SaMD 등을 안 배워도 되지만, 앞으로 미래의료를 이끌 의료진들은 데이터 관리와 분석에 대해 알아야 한다"면서 "특히 지금의 의료빅데이터들은 제대로 관리가 안 돼 있어 그냥 분석하면 잘못된 결과가 나오기 때문에 이에 대한 질 관리부터 제대로 해야 한다"고 밝혔다.
 

방대한 빅데이터가 쌓여 있어 30분만에 10만건 이상의 케이스를 뽑을 수 있을 정도로 양적인 발전이 있었지만, 실상을 들여다보면 분석이 어려운 자료들이 대다수기 때문에 질적인 관리가 시급하다는 것이다.
 
또한 어떻게 연구를 설계하느냐에 따라 결과가 달라질 위험이 높기 때문에 '조작적 정의'를 매우 세심하게 해야 한다는 입장이다.
 
김 교수는 "조작적 정의는 개념적인 정의와 다르다. 당뇨병을 예로 들면 개념적 정의는 '1 HbA1c ≥ 6.5% 또는 2 fasting plasma glucose level ≥ 126mg/dL 또는 2-h plasma glucose ≥200 mg/dL during an OGTT 또는 classic symptoms of hyperglycemia or hyperglycemic crisis, a random plasma glucose ≥200 mg/dL' 등이지만, 조작적 정의는 진단시점과 약물처방시점, 검사시행 날짜 등에 따라 달라지게 된다"고 말했다.
 
이어 "리얼월드데이터는 표본수가 많지만 인과관계 파악이 어렵다는 한계를 이해해야 한다. 다양한 치우침이나 편견을 통제해서 조작적 정의를 시행해야 한다"고 밝혔다.


<© 2019 메디파나뉴스, 무단 전재 및 배포금지>'대한민국 의약뉴스의 중심'메디파나뉴스

[의약정책] 최근기사

많이 본 뉴스

댓글 쓰기

실명인증

독자들이 남긴 뉴스댓글

서민지기자의 다른 기사

로그인 닫기