질병청 국립보건연구원, '한영 이중언어 AI 모델' 개발
![[세종=뉴시스] 질병관리청 국립보건연구원은 한국어와 영어가 혼합된 '국내 병원 전자의무기록(EMR)'을 보다 정확하게 분석하고 활용할 수 있는 '한·영 이중언어 인공지능(AI) 모델'을 국내 최초로 개발했다고 27일 밝혔다. (사진=질병청 제공) 2026.02.27. photo@newsis.com *재판매 및 DB 금지](https://img1.newsis.com/2026/02/27/NISI20260227_0002072145_web.jpg?rnd=20260227105605)
[세종=뉴시스] 질병관리청 국립보건연구원은 한국어와 영어가 혼합된 '국내 병원 전자의무기록(EMR)'을 보다 정확하게 분석하고 활용할 수 있는 '한·영 이중언어 인공지능(AI) 모델'을 국내 최초로 개발했다고 27일 밝혔다. (사진=질병청 제공) 2026.02.27. [email protected] *재판매 및 DB 금지
질병청에 따르면 국내 의료기관에서 생성되는 전자의무기록의 약 80%는 자유서술 형태의 비정형 문서로 구성돼 있다.
또 한국어와 영어 의학 용어가 혼합된 형태로 작성되는 경우가 많아, 단일 언어 기반 AI 모델을 적용할 경우 분석 정확도가 떨어지는 한계가 제기돼 왔다.
이에 따라 국립보건연구원은 한·영 의료 어휘 체계와 말뭉치를 활용하고 추가 사전학습을 수행한 이중언어 AI 모델 개발에 나선 것이다.
특히 연구진이 이중언어 AI 모델을 의료현장에서 수집한 흉부 컴퓨터단층촬영(CT) 판독문에 적용해 다중 질환 분류를 분석한 결과, 최대 종합정확도 0.94를 달성한 것으로 나타났다.
종합정확도는 질환 판별의 정확도와 검출 능력을 종합적으로 평가하는 지표로, 0.9 이상일 경우 임상 활용 가능성을 검토할 수 있는 수준으로 평가된다.
연구를 주도한 주형준 고려대 의과대학 교수는 "이번 연구는 국내 임상 현장 특성을 반영한 이중언어 의료 언어모델을 구현하고, 실제 의료데이터 검증을 통해 임상 적용 가능성을 확인한 점에서 의미가 있다"고 전했다.
국립보건연구원 헬스케어인공지능연구과는 코호트 기반의 멀티모달 데이터를 활용한 AI 모델 개발 연구를 수행하고 있으며, 연구자와 의료기관이 활용할 수 있는 의료 AI 데이터와 연구 생태계 조성을 지속적으로 지원한다는 계획이다.
임승관 질병청장은 "이번 성과는 국내 의료기관에서 생성되는 전자의무기록 데이터를 보다 체계적으로 분석·활용할 수 있는 AI 기반을 구축했다는 점에서 중요하다"며 "의료데이터의 활용 가치를 높이고, 국내 AI 연구 역량을 한 단계 끌어올리는 계기가 될 것"이라고 밝혔다.
그러면서 임 청장은 "이번 기술 개발이 의료정보 활용 체계 고도화와 공공보건 정책의 정밀도 향상으로 이어지기를 기대한다"고 덧붙였다.
◎공감언론 뉴시스 [email protected]









English (US) ·