“13개 병명 추출 가능” 카카오브레인, 의료영상 판독 프로그램 공개
개발자 플랫폼에 오픈 소스로 공개… “정확도 90% 이상”
레이블러 프로젝트는 정리되지 않은 자연어로 작성된 판독문에서 특정 병명을 추출하는 프로그램이다. 흉부 엑스레이 결과를 바탕으로 진단 가능한 병명 중 발병 빈도가 높거나 중요도가 높은 골절, 흉막 병변, 기흉 등 13가지 병명을 추출할 수 있다.
카카오브레인은 의료 진단 업무를 개선하고자 기존에 공개된 타사 모델보다 정확하고 효율적으로 병명을 추출하는 레이블러 프로젝트 연구에 착수했다고 설명했다. 카카오브레인이 병명 추출 정확도를 자체 측정한 결과, 정확도가 90.39%로 타사 모델(약 76%) 대비 현격히 높은 것으로 나타났다.
카카오브레인은 해당 프로그램을 개발자 플랫폼 ‘깃허브’에 오픈소스 형태로 공개하는 한편 학습법과 성능 비교 결과를 담은 논문을 게재하기도 했다. 카카오 측 관계자에 따르면 이는 AI 오픈소스 생태계를 활성화하고 기술 노하우를 공유해 새로운 가치를 창출하기 위함이다.
카카오브레인 김일두 각자 대표는 “많은 연구자들이 당사의 레이블러 프로젝트를 테스트 벤치마크로 활용할 수 있도록 직접 제작한 테스트 셋을 공개할 예정”이라며 “당사 언어 모델을 활용하는 한편 흉부 엑스레이 데이터를 추가로 학습시켜 프로젝트의 성능을 더욱 높일 계획”이라고 전했다.