2019년 9월 15일~17일 3일간 미국 North Bethesda에서 OMOP CDM을 기반으로 하는 의료 심포지움인 OHDSI가 개최했다. IQVIA나 얀센 등 글로벌 기업뿐 아니라, 산업에서 두각을 나타내고있는 여러 기업들이 참가하여 현재의 트렌드나 앞으로의 방향성을 알 수 있는 자리였다.
표준화 되어있지않은 데이터를 표준화하기위한 여러 노력들이 있고 그중 OMOP CDM(Observiational Medical outcomes partnership Common data model)을 통하여 의학근거의 수준을 높이고, 발전시킬수 있도록 하기 위하여 많은 연구자들이 노력하는 것을 느낄수 있었다.
특히나 그 결과물로서 이번 OHDSI에서는 특히나 지금까지 없었던 Book of OHDSI를 처음 공개하여 사람들의 박수갈채를 받는 모습도 보였다.

발표자는 Atlas를 만든 사람으로 Book of OHDSI에 대해 발표해주었다.
OHDSI 심포지움은 2개의 튜토리얼과 하나의 세션(Oral + Poster presentation)으로 구성되어있다. 첫 날 튜토리얼은 CDM & vocabulary와 cohort 2개로 구성되어있다.
[CDM & vocabulary]에서는 실제 CDM table에 대한 내용을 설명하며, 표준화하기 위한 standard에 내용을 설명했다. 또한 실제로 cloud 서버를 열어서 접속하여 SQL query를 통해 standard concept id를 찾아가는 과정역시 실습으로 진행했다.
[Cohort] 튜토리얼에는 ETL (Extract, Transform, Load), PLE (Population level Estimation), PLP (patients level prediction), data quality 등이 있고, ETL은 기존의 병원 데이터를 OMOP CDM 데이터로 변환하는 과정을 의미한다. PLE는 cox regression, logistic regression 등을 통해 실제 feature의 estimation 값을 확인할수 있으며 PLP는 각 환자별 예측값을 확인하기 위해서 여러가지 machine learning 알고리즘에 대한 과정을 볼수있다.
[ETL] 에서는 직접 데이터를 Extract하는것 에서부터 시작해서 Ohdsi tool을 활용해보았다. WhiteRabbit을 통해서는 데이터의 특성을 확인하여 탐색적을 자료를 볼수있으며 그 결과물로 scanfile을 얻을수 있다. Scanfile을 input으로하여 rabitinaHat 프로그램으로는 ETL을 디자인하고 Query를 작성하기위한 기본 틀로 사용될 수 있다. 그 이후에는 실제로 SQL 또는 R 등의 프로그램으로 쿼리를 실제로 작성하게 된다. 또한 usagi라고하는 mapping을 도와주는 tool을 사용할수 있었다. Usagi는 단어의 similarity를 기반으로하여 비슷한 concept id를 추정할수 있도록 도와주는 툴이다. 마지막으로 quality문제를 해결하기위해 아킬레스라는 툴 또는 DQD (data quality Dashboard)에 대한 내용을 다루었다.
삼성서울병원에서는 총 4편의 poster가 제출되었다.




글쓴이 : 유재용(박사과정)