Group Study (2024-2025)/Machine Learning 심화 8

[ML 심화] 8주차 스터디 - U-Net , CS231n - Assignment1 inline question 답

U-Net: Convolutional Networks for Biomedical Images Segmentation 논문 리뷰[배경 지식]이미지를 인식하는 다양한 방법이미지 내에서 사물 인식하는 방법에는 다양한 유형 존재Segmentation은 각 픽셀마다 클래스를 할당하는 작업을 의미Semantic Segmentation이미지 내 있는 각 물체(object)들을 의미 있는(semantic) 단위로 분할(segmentation)하는 작업을 의미함분할에서는 각 픽셀마다 하나의 클래스로 분류Semantic Segmentation의 목표이미지가 주어졌을 때, (높이 x 너비 x 1)의 크기를 가지는 한장의 분할 맵을 생성각 픽셀마다 N개의 클래스에 대한 확률을 뱉어, 정답은 (높이 x 너비 x N)의 형태를 ..

[ML심화] 7주차 스터디

논문리뷰 _ YOLOv3 : an incremental improvement1, 2 stage detector / YOLOYOLO의 motivationYOLO는 정확한 성능보다는 real-time application을 위한 빠른 속도의 알고리즘에 초점을 둠1 stage detectorregion proposal과 object분류 과정이 별도의 네트워크로 분리됨 (2개의 stage로 분리됨)detection의 성능은 상대적으로 낮지만 inference 속도가 상대적으로 높음2 stage detectorregion proposal과 object분류 과정이 별도의 네트워크로 분리되지않음 (1개의 stage로)detection의 성능은 상대적으로 높지만 inference 속도가 상대적으로 낮음주요 내용boun..

[ML 심화] 6주차 스터디 - YOLO

[Paper Review] You Only Look OnceIntroduction이미지가 클래스에 속할 확률이미지 클래스 뿐만 아니라 어디에 위치하는 지에 대한 물체의 위치이미지 내 멀티 오브젝트 파악 가능고양이 강아지 각각 예측 가능클래스에 속할 확률1- stage vs 2 - stage 1-stagelocalization과 classification을 동시에 수행하여 결과를 얻음이미지 내 모든 위치를 물체의 잠재영역으로 보고 각 후보영역에 대해 class 예측2-stagelocalization을 하고 classification을 하는 방식으로 순차적으로 수행하여 결과를 얻음region proposal을 통해 후보 object 위치를 먼저 제안하고 object의 클래스를 예측한다는 차이점 존재You O..

[ML 심화] 5주차 스터디 - Object Detection: 2-stage-detector

이미지 내 사물을 인식하는 방법Semantic Segmentation이미지 내에서 픽셀 단위로 categorize하는 작업instance 간의 구분은 없음 Classification이미지 내 사물이 “무엇인지”만을 판단Classification + Localization이미지 내 사물이 무엇인지 판단 + 어느 위치에 있는지 바운딩Object Detection다수의 사물이 존재하는 상황에서 분류와 위치 찾기를 진행Instance Segmentation각각의 사물을 픽셀 단위로 구분하는 것객체 검출 방식2-Stage Detector물체의 위치를 찾는 문제와 분류하는 문제를 순차적으로 해결하는 방법Region proposals : 사물이 존재할 법한 위치를 찾아 나열Feature Extractor : 각각의 ..

[ML심화 ] 4주차 스터디

이번 주차는 CNN, VGGNet, GoogLeNet, ResNet 코드리뷰입니다. CNN (Convolution Neural Network)LeNet-5 LeNet은 Yann LeCun과 그의 팀이 개발한 초기의 합성곱 신경망(CNN, Convolutional Neural Network) 모델로, 주로 이미지 인식 작업을 위해 설계되었습니다. LeNet-5라는 이름으로도 잘 알려져 있으며, 특히 손글씨 숫자 인식을 목적으로 개발되었습니다. LeNet 모델은 MNIST 데이터셋(손글씨 숫자 0~9)을 분류하는 데 큰 성과를 보였고, 이후 CNN의 발전에 중요한 기초를 마련했습니다.입력 레이어 (Input Layer): 32x32 크기의 이미지를 입력으로 받습니다. MNIST 이미지의 원래 크기는 28x2..

[ML심화] 3주차 스터디

Lecture 5 Convolutional Neural NetworksCNNCNN의 역사"perceptron"을 구현한 최초의 기계Perceptron"은 우리가 배운 Wx + b와 유사한 함수 사용 → 하지만 출력 값이 1 또는 0임가중치 w를 update하는 rule 존재 → Backprop 과 유사 (그 당시에는 backprob이라는 개념이 없어서 가중치를 이리저리 조절하면서 맞춤)Frank Rosenblatt의 Mark I Perceptron machine (1957)최초의 Multilayer Perceptron Network → 이 시점에 neural network와 비슷한 모양 하기 시작 BUT Backprob 같은 학습 알고리즘 안 존재Widrow와 Hoff가의 Adaline and Madal..

[ML심화] 2주차 스터디 - Loss Function, Optimization, Back Propagation, Neural Network

- Stanford University 의 Convolutional Neural Networks for Visual Recognition 강의를 바탕으로 작성하였습니다.Lecture 3 | Loss Functions and Optimization손실함수 (Loss Function)생성한 W가 좋은지 나쁜지를 정량화 할 방법 필요.W를 입력으로 받아 각 스코어를 확인하고 이 W가 현재 얼마나 나쁜지를 정량적으로 말해주는 것우리가 원하는 것 = 행렬 W가 될 수 있는 모든 경우의 수 중 가장 “괜찮은” W를 찾는 것.→ 최적화 과정 (Optimization)x 는 알고리즘의 입력, y는 예측하고자 하는 값 (레이블, 타겟값)f 는 예측함수→ 손실함수(L_i)는 예측함수(f)와 정답값(y)을 받아 데이터들을 ..

[ML심화]1주차 스터디

Lecture 1 | Introduction to Convolutional Neural Networks for Visual Recognitioncomputer vision : 컴퓨터로 시각데이터를 처리하는 분야 => 사람과 컴퓨터가 받아들이는 것은 다르기에 시각적데이터의 내용을 자동으로 이해하고 분석할 수 있는 기술을 개발하는 것이 중요!컴퓨터비전은 다양한 분야에서의 능력이 필요함 (물리학, 생물학, 생리학, 수학, 공학...)비전의 역사1. 시력 앤드류파커, 최초의 동물은 눈을 발달시켰고 시력이 발달되며 폭발적인 종분화 단계가 시작. 진화의 빅뱅 시작이 5억 4천만년후에 동물의 시각에서 시작- 시각의 중요성 : 지능이 높은 인간의 가장 큰 감각시스템으로 발전. 시각처리에 관여하는 피질 뉴런의 거의 50..