머신러닝 4

[ML입문] week4 - 비지도 학습

비지도 학습이란? 정답(target, label)이 없고 특성 데이터만 주어지는 학습 방법이다. 종류는 군집과 차원 축소로 나눌 수 있다. 1. 군집 알고리즘 군집 (클러스터) : 비슷한 패턴들을 묶어놓은 집단 1) 데이터 준비 가로 100px, 세로 100px의 사과, 파인애플, 바나나 사진을 각 100개씩 준비하여 numpy 배열로 변환한다. # !: shell 명령어 !wget https://bit.ly/fruits_300_data -O fruits_300.npy import numpy as np import matplotlib.pyplot as plt fruits = np.load('fruits_300.npy') print(fruits.shape) # (300, 100, 100) 10000 pin..

[ML입문] week2 - 회귀 알고리즘과 모델 규제, 분류 알고리즘(1)

1. K - 최근접 이웃 회귀 회귀 (Regression) : 임의의 숫자(target)를 예측하는 것 => 타깃을 따로 만들 필요 없이, 훈련 데이터의 특성 중 하나가 타깃값이 된다 [문제] 농어의 길이와 무게를 학습하여, 농어의 길이를 통해 무게를 예측해보자. 1) 데이터 준비 from sklearn.model_selection import train_test_split train_input, test_input, train_target, test_target = train_test_split(perch_length, perch_weight, random_state=42) K - 최근접 이웃 분류 때와 마찬가지로 사이킷런의 train_test_split을 이용해 훈련 세트와 테스트 세트를 나눈다. 이..

[Machine Learning] REST API를 이용해 손글씨 숫자 예측 웹 만들기

이 글은 2021.02.15 에 진행된 코어멤버 세령님의 ‘REST API를 이용해 손글씨 숫자 예측 웹 만들기’ 세션을 바탕으로 작성된 블로그 포스팅입니다. 새 창에서 열기 (발표자 노트를 참고하실 수 있습니다) 1. RESTful API REST API란? HTTP URI를 통해 자원을 명시 HTTP Method(POST, GET, PUT, DELETE)를 통해 해당 자원에 대한 Operation을 적용 REST API 호출 머신러닝이랑 무슨 상관? REST API 장점 REST API 메시지를 읽는 것 만으로도 메시지가 의도하는 바를 명확하게 파악 해당 URI와 원하는 메소드 자체만 독립적으로 이해 client와 server 각자의 역할이 명확하게 분리 - REST API에 대해 더 자세히 알고 싶..

[Machine Learning] 3주차 스터디 - 텍스트 분석 기초

3주차 목표: 텍스트 분석 프로세스 이해하기 참고 자료: wikidocs.net/21694 1. 텍스트 분석 기본 용어 1. 토큰화 (Tokenization) 자연어 처리에서 크롤링 등으로 얻어낸 코퍼스 데이터가 필요에 맞게 전처리되지 않은 상태라면, 해당 데이터를 사용하고자하는 용도에 맞게 토큰화(tokenization) & 정제(cleaning) & 정규화(normalization)하는 일을 하게 된다. 주어진 코퍼스(corpus)에서 토큰(token)이라 불리는 단위로 나누는 작업을 토큰화(tokenization)라고 부른다. 토큰화의 단위가 상황에 따라 다르지만, 보통 의미있는 단위로 토큰을 정의한다. (e.g. 단어, 문장) Corpus: 말뭉치 또는 코퍼스는 자연언어 연구를 위해 특정한 목적을..