@@@ 인공지능/수학·통계를 몰라도 이해할 수 있는 쉬운 딥러닝

2 - 3. CNN 활용하기(1)

HTG 2021. 7. 28. 00:01
728x90

2-3-1. [의료 AI] 현미경 영상 분석을 통한 암 진단

데이터 살펴보기

정상 세포의 현미경 영상과 암세포의 현미경 영상

정상 조직 사진 : 3,750장

암 조직 사진 : 625장

데이터의 모든 수치는 0 ~ 1 사이의 숫자로 노멀라이즈하여 사용.

 

●어떤 인공지능 사용?

층수 종류 크기 활성화 함수
1층 CNN 16, (3, 3) ReLu
- MaxPool (2, 2) -
2층 CNN 32, (3, 3) ReLu
- MaxPool (2, 2) -
3층 CNN 64, (3, 3) ReLu
- MaxPool (2, 2) -
4층 CNN 64, (3, 3) ReLu
- MaxPool (2, 2) -
5층 CNN 64, (3, 3) ReLu
- MaxPool (2, 2) -
6층 Flatten - -
7층 FNN 512 ReLu
8층 FNN 1 -

전에 사용하였던 CNN 분류 AI와 기본적인 구조는 동일.

7층의 FNN사이즈가 512.

2개의 클래스를 구분하는 문제이기 때문에 출력층 사이즈는 1.

 

●딥러닝 코딩

- 인공신경망 컴파일

옵티마이저(optimizer) - Adam

메트릭(metrics) - accuracy

로스(loss) - BinaryCrossentropy

 

●인공지능 학습

- 인공신경망 학습

 

 

- 학습 결과 출력

그래프로 출력

 

●인공지능 학습 결과 확인

- 인공지능 성능 확인하기

저자의 경우 인공지능의 최종 성능은 96.34%. 

인간이 수년간의 경험을 통해 쌓아 올려야 하는 전문지식을 AI는 고작 20 에포크만에 확포.

난 뭐지 왜 이러지 이상하네 몇 번을 돌리고 바꿔봐도 이상하네 ....

 

- 학습 기록 확인하기

빨간 선이 train, 파란 선이 test

저자의 경우 Loss와 Accuracy 모두 10 에포크 근처 부터 오버피팅의 양상이 보임.

그래프는 또 왜이래... 로스는 왤케 튀고 accuracy는 왜 지진....

 

의료용 AI, 왜 필요한가?

의사 한명의 능력을 갖추는 것 보다 효율.

효용성에도 좋은 점이 있음.

 

오버피팅 회피

에포크를 줄이거나 CALLBACK 조정.