오늘부터 Stanford University School of Engineering 에서 강의한 자료를 바탕으로 Visual Recognition을 위한 Convolutional Neural Networks에 대하여 요약해보겠다.
Stanford University School of Engineering
The Stanford School of Engineering has been at the forefront of innovation for nearly a century, creating pivotal technologies that have transformed the worlds of information technology, communications, medicine, energy, business and beyond. The faculty, s
www.youtube.com
컴퓨터가 특정 이미지가 무엇인지 아는데 많은 어려움이 있다. 만약 그 Image가 무엇인지 알 수 있다고 해도 pixel값으로 이미지를 이해하는 컴퓨터는 이미지의 관점의 변화, Illumination(밝기등의 변화), Deformation(다른 자세), Occlusion(사물의 일부만 보임), background clustter(물체가 배경과 비슷함), intraclass variation(비슷한 물체가 여러개 있음)등의 변화가 발생하면 그 Image인지 모를것이다.
-- KNN(k nearest neighbor algorithm) : k개의 까까운 이웃의 속성에 맞게 분류한다. 가까운 이웃을 나누는 기준은 픽셀값을 빼는 L1 distance와 제곱근을 이용해 거리를 구하는 L2 distance가 있다.
K값과 distance는 좋은 결과에 맞게 직접 조절해야할 hyperparameter이다.
> 이미지 분류에서는 사용하지 않음
1. predict시 training이미지와 전부 비교해야 하므로 시간이 오래 걸림
2. L1,L2 distance등이 정보를 의미하지 않음 ( 사진의 모든 색을 바꿔도 distance값이 같은 수 있음)
-- 학습할 때 Data분류
Trainingset, Validationset, Testset으로 나눠서 학습, 평가를 해야한다.
-- Cross Validation (Kfold 이용)
small dataset에서 overfitting을 방지 해줘 유용하다.
-- Linear Classification
각층의 layer들을 의미한다. CNN에서 중요하다.
weight값 W를 구해 결과를 결과를 도출
단점 : 직선으로 분류되지 않는 분류를 잡을 수 없다.
'AI_theory > Stanford cs231(Vision)' 카테고리의 다른 글
AI_CNN_Stanford CS231n강의_5 (0) | 2022.05.17 |
---|---|
AI_CNN_Stanford CS231n강의_4 (0) | 2022.05.17 |
AI_CNN_Stanford CS231n강의_3 (0) | 2022.05.05 |
AI_CNN_Stanford CS231n강의_2 (0) | 2022.05.04 |