병리 슬라이드를 이용한 종양 탐지 AI 모델 개발
테서는 인공지능을 활용하여 유방 병리조직에서 순도 높은 종양 영역을 검출하고 실제 임상 환경에서 성능을 검증하는 프로젝트를 진행했습니다.
![병리 슬라이드를 이용한 종양 탐지 AI 모델 개발](/content/images/size/w2000/2023/11/-----2023-11-30----9.59.32.png)
![](https://miro.medium.com/v2/resize:fit:1200/1*v2uIW-_BzoFhbNOgDlF-Uw.png)
테서 팀 블로그에서 발췌한 포스트입니다.
안녕하세요, 테서 연구개발팀의 이창석입니다.
저희 팀은 인공지능을 활용하여 유방 병리조직에서 순도 높은 종양 영역을 검출하고 실제 임상 환경에서 성능을 검증하는 프로젝트를 진행했습니다.
본 프로젝트에서는 딥러닝을 포함한 인공지능 기술을 활용하여 병리 조직 슬라이드 내의 종양 영역을 보다 정확하게 식별하는 것을 목표로 삼았습니다.
병리 조직 슬라이드는 염색 과정의 차이, 스캐너의 종류 및 설정 등으로 인해 데이터에 큰 편차가 있습니다. 이러한 다양한 조건에서도 일관된 성능을 보이는 인공지능 모델을 개발하는 것이 중요한 과제였습니다.
저희의 목표는 이러한 모델을 통해 임상 현장에서 병리학자가 보다 신속하고 정확한 진단을 내릴 수 있도록 보조하는 것입니다. 이 과정은 의료 AI 기술의 발전은 물론, 환자 진단 및 치료에도 중요한 기여를 할 것으로 기대하고 있습니다.
이를 위해, 임상 현장에서 병리학자가 인공지능 모델을 쉽게 사용할 수 있도록 사용자 친화적인 그래픽 사용자 인터페이스(GUI) 프로그램을 개발했습니다. 이 GUI 프로그램은 병리학자가 복잡하지 않고 직관적으로 데이터를 분석하고 결과를 해석할 수 있도록 설계하였으며, 병리학적 분석의 정확성과 효율성을 높이고, 진단 과정을 간소화하는 데 기여하고자 합니다.
본 글은 저희 팀의 연구 진행 과정, 도전 과제, 그리고 이를 해결하기 위한 접근 방법에 대해 서술하고자 합니다.
연구 배경
![](https://miro.medium.com/v2/resize:fit:1400/1*QvrWvSQeM1Jv7-fvE4e6uQ.png)
유방암은 전 세계적으로 여성에게 가장 흔한 암 중 하나이며, 조기 진단과 효과적인 치료 방법의 개발이 매우 중요합니다. 이러한 맥락에서 병리학적 분석은 유방암 진단과 치료 과정에서 중추적인 역할을 합니다. 주로 병리 조직 슬라이드를 통해 이루어지는 이 분석은 종양의 성질과 단계를 평가하는 데 필수입니다.
최근 몇 년간 인공지능, 특히 딥러닝 기술은 의료 영상 분석 분야에서 중요한 발전을 이루었습니다. 이러한 기술은 병리 조직 슬라이드에서 암세포를 검출하고 분석하는 데 큰 기여를 하였습니다. 병리학자의 작업을 보조하여 정확하고 신속한 진단을 가능하게 하는 데 중요한 역할을 했습니다.
그러나 본 프로젝트에서 마주한 주요 도전 과제는 병리 조직 슬라이드 데이터의 다양성이었습니다. 다양한 염색 방법, 농도, 스캐너의 종류 및 설정은 데이터의 특성을 달리하게 만들었습니다. 이러한 데이터 다양성은 인공지능 모델이 일관된 정확도를 유지하는 데 어려움을 초래했습니다. 이에 대응하여, 저희 팀은 이러한 다양성을 고려하여 강건한 모델을 설계하고 최적화하는 데 집중했습니다.
위 배경을 바탕으로, 저희 팀은 유방 병리조직에서 순도 높은 종양 영역을 정확하게 검출하는 인공지능 모델을 목표 삼아 프로젝트를 진행했습니다.
연구 목적
유방 병리 조직 슬라이드가 무엇인가요?
![](https://miro.medium.com/v2/resize:fit:1400/1*vcweSdASvWN_i6aEpcxRFw.png)
유방 병리 조직 슬라이드 데이터는 유방암 진단을 위해 병리학적으로 검사하는 조직 샘플입니다. 이 샘플은 미세하게 절단되어 유리 슬라이드에 놓이며, 염색 과정을 통해 암세포와 정상 세포를 구분할 수 있게 합니다.
![](https://miro.medium.com/v2/resize:fit:1400/1*9YgmN8fJT3wxa5u3ryVuNQ.png)
조직 슬라이드는 디지털 이미지로 변환되며, 여기서 데이터의 특징이 드러납니다. 디지털 슬라이드는 다양한 확대 레벨을 포함하는 피라미드 구조를 가지고 있어, 높은 해상도의 전체 이미지부터 더 작은 영역에 대한 상세한 분석까지 가능합니다. 이 데이터는 유방암의 종류, 크기, 성장 패턴 등을 파악하는 데 사용 되어, 정확한 진단과 치료 계획을 수립하는 데 중요한 역할을 합니다.
유방 병리 조직 슬라이드에서 얻을 수 있는 정보는 무엇인가요?
유방 병리 조직 슬라이드에서 얻을 수 있는 정보는 매우 광범위합니다. 이 데이터는 우선적으로 유방암의 존재 여부를 확인하고, 암의 유형을 식별하는 데 사용됩니다.
저희는 유방 조직 병리 슬라이드에서 종양 영역을 정확하게 분할하기 위해 다음 과정들을 중심으로 프로젝트를 진행했습니다.
인공지능 기반 종양 탐지 모델 및 GUI 프로그램 개발
유방 조직 병리 슬라이드에서 종양 영역을 정확하게 분할하고 분석하기 위한 인공지능 모델과 사용자 친화적인 GUI 프로그램 개발에 초점을 맞췄으며 유방암의 존재와 유형을 식별하는 데 필수적인 데이터 처리와 학습 방법을 채택했습니다.
개발된 GUI 프로그램은 병리학자가 분석 결과를 쉽게 이해하고 활용할 수 있도록 설계되었습니다. 이를 통해 다량의 병리 슬라이드의 종양 영역을 빠른 시간 내에 확인 가능하며, 검체 분석 시 걸리는 소요 시간을 획기적으로 단축할 수 있었습니다.
또한 인공지능에서 도출된 영역을 GUI 상에서 보여주므로써, 일관된 결과를 받아볼 수 있습니다. 이는 분석 결과에 대한 신뢰도와 재현성을 높이는 이점이 있습니다.
연구 진행
유방암의 종류
유방 조직 병리 슬라이드에서 확인할 수 있는 유방암의 종류는 다양합니다. 주요 유형으로는 IDC(침윤성 유관암), DCIS(비침윤성 유관암), ILC(침윤성 소엽암), LCIS(비침윤성 소엽암) 등이 포함됩니다.
본 프로젝트에서는 이러한 여러 유형의 유방암을 하나의 클래스로 합쳐서, 초기 단계에서 넓은 범위의 종양 영역을 식별하는 인공지능 모델을 개발하는 것에 중점을 두었습니다.
데이터셋 생성 프로세스
![](https://miro.medium.com/v2/resize:fit:1400/1*t7ohVzczRy_p9bGwcAej4A.png)
학습을 위한 데이터 생성 과정은 아래와 같이 진행했습니다.
- 병리 슬라이드에서 종양 영역을 수동으로 라벨링
- 세포, 정상 조직, 종양 영역의 이진 마스크를 생성
- 학습을 위한 비종양/종양 패치를 구분하여 데이터 생성
위 과정은 여러 실험을 거쳐 최적화하였으며, 이는 모델 학습의 정확도와 효율성을 높이는 데 중요한 역할을 했습니다.
인공지능 모델 학습
![](https://miro.medium.com/v2/resize:fit:1400/1*aGtceIPlwYXgP1Yjf46Xvw.png)
AI 모델 학습 및 최적화는 아래와 같은 과정으로 진행했습니다.
- 비종양 패치가 대부분을 차지하는 클래스 불균형 문제를 해결하기 위해 종양/비종양 패치 비율을 조절하여 종양 검출에 효율적인 모델 학습 진행
- SOTA 모델을 이용하여 병리 슬라이드 내 종양을 탐지하는 패치 기반 딥러닝 모델 개발
- 5-fold 교차 검증을 통해 5개의 모델 테스트를 진행하여 더욱 일반화된 모델 생성
- 하이퍼 파라미터 튜닝 과정을 통해 모델 최적화 진행 및 과적합 방지
뿐만 아니라, 위 과정 내 Sliding window 추론 및 Small Area Filter 알고리즘을 적용하여 순도 높은 종양 영역을 정확하게 검출하는 인공지능 모델을 개발했습니다.
GUI 프로그램 개발
![](https://miro.medium.com/v2/resize:fit:1400/1*JvGGJiug9BTAaIj6fZZCRg.png)
윈도우 기반의 사용자 친화적인 그래픽 사용자 인터페이스(GUI) 프로그램을 개발하여 병리학자가 임상 현장의 PC에서 쉽게 접근하고 사내 서버를 사용할 수 있게 하여 편리성과 보안적인 측면도 고려하여 프로젝트를 진행하였습니다.
이 프로그램은 다양한 기능을 갖추고 있어, 사용자는 종양 영역과 인공지능 모델이 제공하는 결과를 효과적으로 확인하고 분석할 수 있습니다.
연구 결과
패치 기반 종양 탐지 인공지능 모델 결과
![](https://miro.medium.com/v2/resize:fit:1400/1*rxRcMbr1tQPqkp7YJtxFTA.png)
![](https://miro.medium.com/v2/resize:fit:1400/1*fF0fkYc8j10NBTlYpoUazA.png)
저희는 모델의 일반화 성능을 향상시키기 위해 5-fold 교차 검증 방법을 사용했습니다. 이 접근법을 통해, 데이터셋을 5-fold로 나누어, 동일한 모델 구조에 대해 다섯 번의 학습 및 검증을 진행했습니다.
학습한 모델은 외부(External) 데이터셋을 이용하여 평가한 결과, 각각의 폴드에서 인상적인 정확도를 달성했으며 그 결과는 다음과 같습니다.
- Fold 0: 0.9532
- Fold 1: 0.9518
- Fold 2: 0.9513
- Fold 3: 0.9506
- Fold 4: 0.9498
이러한 결과들을 바탕으로, 이 다섯 모델의 평균 F1 점수는 0.95 이상을 달성했습니다. 이는 모델이 높은 수준의 성능과 일관성을 가지고 있음을 보여줍니다.
![](https://miro.medium.com/v2/resize:fit:1400/1*MaWrw6XsOrq3k-vsoFOuCA.png)
GUI 프로그램
![](https://miro.medium.com/v2/resize:fit:1400/1*v2uIW-_BzoFhbNOgDlF-Uw.png)
임상 환경에서 사용할 수 있는 병리 슬라이드 내 종양 검출 GUI 소프트웨어는 사진과 같이 개발이 되었으며, 종양 분석 결과를 빠르고 효과적으로 확인할 수 있도록 설계되었습니다.
![](https://miro.medium.com/v2/resize:fit:1400/1*mIM6oBSJfNoSTOvbLYMzgg.png)
사용자는 Tumor Confidence 조절 기능을 사용하여 원하는 종양 신뢰도 수준을 선택할 수 있습니다:
- ‘Soft’는 종양 영역의 50% 이상을 표시합니다.
- ‘Moderate’는 70% 이상의 종양 영역을 표시합니다.
- ‘Hard’는 90% 이상의 종양 영역만을 표시합니다.
더불어, 사용자는 종양 추론 결과를 바탕으로 상세분석 리포트(Report)와 데이터 시트를 생성하는 기능을 이용할 수 있습니다, 이를 통해 진단 정보를 체계적으로 문서화하고 필요 시 즉시 공유가 가능합니다.
마치며
본 프로젝트를 통해, 저희 팀은 유방암 진단의 정확성과 효율성을 높이기 위한 인공지능 모델과 GUI 프로그램을 개발하였습니다. 이러한 기술은 의료 현장의 전문가들이 보다 빠르고 정확한 진단을 내리는 데 큰 도움이 될 것입니다.
높은 비용의 고해상도 현미경이 없더라도 다양한 임상 환경에서 빠르게 병리 슬라이드를 분석할 수 있다면, 병리검사의 효율을 높일 뿐 아니라, 정량적 측정을 통해 대규모의 데이터를 지속적으로 구축할 수 있도록 하는 효과가 있습니다.
이러한 데이터는 다양한 다른 의료 데이터들(혈액 검사, 유전자 검사, 비정형 텍스트 추출 정보, CT/MRI 정량 분석 정보 등)과 결합되어 통합적인 모델링을 보다 광범위한 데이터셋에서 시도할 수 있습니다. 이를 통해 정확한 예후 예측과 함께 치료 결정에 있어서 보다 개인화된 치료계획(personalized medicine)과 정밀의학(precision medicine)적 접근에 한걸음 더 다가갈 수 있습니다.
인공지능 기술이 의료 분야에 가져올 변화는 매우 크고 앞으로의 잠재력도 무한합니다. 의료 AI의 미래를 형성하는 데 있어 테서 연구개발팀과 모든 팀원이 함께 성장하고 발전해 나가는 모습이 기대됩니다.
테서와 함께 인공지능 병리 이미지 분석 솔루션을 구축하고 연구, 임상 환경에 도입하실 수 있습니다. 데이터 준비단계부터 AI 개발, 현장 도입까지 지속적으로 지원합니다.
메일 문의: solution@tesser.co.kr