728x90

이미지분류 14

2 - 3. CNN 활용하기(3)

2-3-3. [의료 AI] 흉부 CT영상 분석을 통한 폐암 진단 시맨틱 세그멘테이션이 가장 많이 연구되는 분야는 의료영상 분야. 시맨틱 세그멘테이션 기술을 응용해 흉부 CT영상을 분석하여 폐암을 진단 ●데이터 살펴보기 images와 annotations을 활용 ●어떤 인공지능 사용? U-Net을 사용 ●딥러닝 코딩 - 인공신경망 컴파일 옵티마이저(optimizer) - Adam 메트릭(metrics) - accuracy 로스(loss) - BinaryCrossentropy ●인공지능 학습 - 인공신경망 학습 - 학습 결과 출력 그래프로 출력 ●인공지능 학습 결과 확인 - 인공지능 성능 확인하기 저자의 경우 인공지능의 최종 성능은 99.89%. - 학습 기록 ..

2 - 3. CNN 활용하기(2)

2-3-2. [의료 AI] 현미경 영상 분석을 통한 세포 종류 진단 ●데이터 살펴보기 8 종류의 조직 분류 각각 625장씩 데이터의 모든 수치는 0 ~ 1 사이의 숫자로 노멀라이즈하여 사용. ●어떤 인공지능 사용? 층수 종류 크기 활성화 함수 1층 CNN 16, (3, 3) ReLu - MaxPool (2, 2) - 2층 CNN 32, (3, 3) ReLu - MaxPool (2, 2) - 3층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 4층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 5층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 6층 Flatten - - 7층 FNN 512 ReLu 8층 FNN 8 SoftMax 2-3-..

2 - 3. CNN 활용하기(1)

2-3-1. [의료 AI] 현미경 영상 분석을 통한 암 진단 ●데이터 살펴보기 정상 세포의 현미경 영상과 암세포의 현미경 영상 정상 조직 사진 : 3,750장 암 조직 사진 : 625장 데이터의 모든 수치는 0 ~ 1 사이의 숫자로 노멀라이즈하여 사용. ●어떤 인공지능 사용? 층수 종류 크기 활성화 함수 1층 CNN 16, (3, 3) ReLu - MaxPool (2, 2) - 2층 CNN 32, (3, 3) ReLu - MaxPool (2, 2) - 3층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 4층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 5층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 6층 Flatten - - 7층..

2 - 2. 이미지 학습 기법 활용하기(4)

2-2-2. AI는 사진을 완벽하게 이해할 수 있을까? - Semantic Segmentation ●Semantic Segmentation Semantic Segmentation은 앞서 배운 것의 한발 더 나아간 것. 이미지 속의 모든 픽셀을 완벽히 분석하여, 각각의 픽셀이 어디에 속하는지 분류하는 과제. 결과적으로 모양이 불규칙적이거나 작은 물체도 경계선을 따라 분리해 낼 수 있으며, 한 장의 사진 속에 포함된 여러 가지 물체를 동시에 분류. ●데이터 살펴보기 사진 데이터는 0 ~ 1 사이의 값을 가진 (128, 128, 3) 사이즈 데이터로 변환. annotation의 경우 배경은 0, 하얀 영역은 1로 노멀라이즈된 (128, 128, 1)사이즈 데이터로 변환하여 사용. ●어떤 인공지능 사용? U-N..

2 - 2. 이미지 학습 기법 활용하기(3)

2-2-3. AI는 현실 세계의 사물을 이해할 수 있을까? - Object Detection ●YOLO - You Only Look Once 객체 탐지(object detection) 분야의 혁신적인 해결수단으로 각광받고 있음. ●Object Detection 목표 영상 속의 물체를 인식하는 인공지능을 만드는 것. 자율주행이나 농업 등 시각적 정보에 대한 판단이 필요한 영역에 적용하기 좋음. ●어떤 인공지능을 만들 건가요? YOLO는 입력받은 이미지를 바둑판처럼(grid) 가로세로로 잘게 쪼개고, 각각의 조각이 '어떤 클래스에 속하는지' 분류하는 기계. CNN을 활용한 딥러닝 모델이 적용. 텐서플로 라이트 이용. ●인공지능 학습 결과 데이터가 ImageNet이라는 데이터셋을 대상을 학습된 것이다 보니 정..

2 - 2. 이미지 학습 기법 활용하기(2)

2-2-2. AI는 창의력을 발휘할 수 있을까? - GAN ●GAN - Generative Adversarial Networks Adversarial Networks GAN은 두 개의 신경망으로 구성. 이 두개의 신경망이 서로 게임을 하면서 상대방으로 이기기위해 노력. AI끼리 서로 싸우는 과정에서 양쪽 모두의 실력이 향상, 결과적으로 엄청난게 성능이 좋은 인공지능 탄생. 두 개의 신경망이 서로 적대적(adversarial)으로 경쟁하므로 이 기술 이름에 adversarial network라는 이름이 붙음. Generative Networks GAN은 새로운 데이터를 생성하는 생성적(generative) 인공지능. GAN이 생성하는 이미지는 마치 사람이 제작한 데이터처럼 리얼함. GAN 성능이 발달하면서..

2 - 2. 이미지 학습 기법 활용하기(1)

2-2-1. AI는 거장의 화풍을 따라 할 수 있을까? - Style Transfer ●데이터 살펴보기 데이터 - 2개의 이미지 파일 A의 화풍을 학습하여 B를 A화풍으로 변환시킴. ●어떤 인공지능 사용? Neural Style Transfer을 만들 것. 인공지능의 구조가 상당히 복잡하고 어려움. 쉽게 말해 인공지능이 피쳐맵을 활용하여 A의 화풍을 학습하고 B를 대상으로 사진에 담겨있는 콘텐츠를 학습. 이렇게 학습된 AI는 A의 화풍과 B의 콘텐츠를 섞어서 새로운 이미지를 출력. 제대로 학습하고 싶으면 검색을 통해서. ●딥러닝 코딩 - 텐서플로 허브(Tensorflow Hub) 이번에는 딥러닝 인공지능을 직접 코딩하는 것이 아니라 "텐서플로 허브"를 활용. 텐서플로 허브에는 'Neural Style T..

2 - 1. 이미지 분류(Classification) 기법 활용하기(6)

2-1-6. AI는 가위바위보를 할 수 있을까? ●데이터 살펴보기 데이터 - 가위, 바위, 보 사진이 각각 964장씩 준비. 데이터의 픽셀값을 0 ~ 1 사이로 노멀라이즈. ●어떤 인공지능 사용? 5층짜리 CNN, Flatten, 2층짜리 FNN 이전의 예제와 출력층을 제외하고 같은 인공지능. 층수 종류 크기 활성화 함수 1층 CNN 16, (3, 3) ReLu - MaxPool (2, 2) - 2층 CNN 32, (3, 3) ReLu - MaxPool (2, 2) - 3층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 4층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 5층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 6층 Flat..

2 - 1. 이미지 분류(Classification) 기법 활용하기(5)

2-1-5. AI는 사람과 말을 구분할 수 있을까? ●데이터 살펴보기 데이터 - 게임 엔진을 통하여 모델링된 사람 이미지 527장과 말 이미지 500장 데이터의 픽셀들은 기본적으로 0 ~ 255까지의 숫자. 이를 노멀라이즈 시킴. ●어떤 인공지능 사용? 5층짜리 CNN, Flatten, 2층짜리 FNN 층수 종류 크기 활성화 함수 1층 CNN 16, (3, 3) ReLu - MaxPool (2, 2) - 2층 CNN 32, (3, 3) ReLu - MaxPool (2, 2) - 3층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 4층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 5층 CNN 64, (3, 3) ReLu - MaxPool (2, 2) - 6층..

2 - 1. 이미지 분류(Classification) 기법 활용하기(4)

2-1-4. CNN AI는 사물을 구분할 수 있을까? ●데이터 살펴보기 데이터 - CIFAR10 데이터셋 사용 이전에 FNN은 색상 정보를 처리할 수 없으므로 Flatten을 실행하기에 앞서 이미지를 흑백으로 변환시키는 과정이 필요했음. 하지만 CNN은 컬러 채널 정보를 처리할 수 있으므로 별도로 흑백으로의 변환없이 데이터를 사용. 단, 노멀라이즈는 수행. 원본 이미지는 0 ~ 255 사이의 숫자로 표현된 데이터. 이를 255.0으로 나누어 0 ~ 1 사이의 숫자로 변환. ●어떤 인공지능 사용? - 신경망 구조 3층짜리 CNN 층수 종류 크기 활성화 함수 1층 CNN 32, (3,3) - - BatchNorm - ReLu - MaxPool (2,2) - 2층 CNN 64, (3,3) - - BatchNo..

728x90