ml 5

[ML입문] week4 - 비지도 학습

비지도 학습이란? 정답(target, label)이 없고 특성 데이터만 주어지는 학습 방법이다. 종류는 군집과 차원 축소로 나눌 수 있다. 1. 군집 알고리즘 군집 (클러스터) : 비슷한 패턴들을 묶어놓은 집단 1) 데이터 준비 가로 100px, 세로 100px의 사과, 파인애플, 바나나 사진을 각 100개씩 준비하여 numpy 배열로 변환한다. # !: shell 명령어 !wget https://bit.ly/fruits_300_data -O fruits_300.npy import numpy as np import matplotlib.pyplot as plt fruits = np.load('fruits_300.npy') print(fruits.shape) # (300, 100, 100) 10000 pin..

[Machine Learning] 2주차 스터디 - Multi variable linear regression & Logistic Regression

04 Multi-variable linear regression Hypothesis Cost function Matrix multiplication Hypothesis using matrix 앞 matrix의 열의 개수와 뒤 matrix의 행의 개수가 일치해야 함 Many x instances data의 instance가 많은 경우에도 동일하게 표현 가능 matrix를 쓰는 큰 장점 Hypothesis using matrix (n output) n은 instance의 개수, 2는 결과 값의 개수 이 때 W[?, ?] => [3, 2] WX vs XW Lecture (theory) Implementation (TensorFlow) 행렬 계산이기 때문에 Code import tensorflow as tf i..

[DeepSleep] 딥러닝 스터디 OT

🙋🏻‍♀️ Summary 팀명: DeepSleep 😴 팀원: 남수연(팀장), 서희, 이도연, 이하람, 전혜주 목표: 딥러닝 모델 직접 구현하기 매주 회의: 금요일 10:30 ~ 12:30 🌳 Ground Rules 말 편하게 하기 회의 시작 전 근황 공유하기 회의시간 꼭 지키고, 불참시 최소 하루 전에 알려주기 📑 스터디 자료 수연, 하람: 부스트코스 - 파이토치로 시작하는 딥러닝 기초 도연, 서희, 혜주: 부스트코스 - 텐서플로우로 시작하는 딥러닝 기초 🖍 스터디 진행 방식 1주차: Basic ML / DNN 개념 + 모델 구현 2주차: CNN 개념 + 모델 구현 3주차: RNN 개념 + 모델 구현 팀원이 돌아가며 자신이 구현한 모델에 대해서 소개, 리뷰 개인 Github에 코드 올리기 + 발표자료는 ..

[Kaggle/ML] 캐글(Kaggle) 시작하기

이 글은 2020.11.23 에 진행된 코어멤버 하람님의 ‘머신러닝과 데이터 사이언스 커뮤니티, 캐글 시작하기’ 세션을 바탕으로 작성된 블로그 포스팅입니다. 새 창에서 열기 (발표자 노트를 참고하실 수 있습니다) 1. 캐글(Kaggle) 이란? 🤔 📌 머신러닝과 데이터 과학 커뮤니티 경진대회를 주최하는 플랫폼 2017년 3월에 구글의 모회사인 알파벳(Alphabet)에 인수됨 📌 캐글에서 캐글러가 캐글링하기 캐글러(Kaggler) : 캐글에 모이는 사용자 또는 대회 참가자 캐글링(Kaggling) : 캐글에서 활동하거나 경진대회에 참가해 경쟁하는 것 공용어 : 영어, 영문 데이터, Python과 R 📌 캐글링에 필요한 지식 프로그래밍이나 머신러닝 지식이 없어도 누구나 참가 가능 머신러닝 입문용 온라인 강..

[Machine Learning] 3주차 스터디 - 텍스트 분석 기초

3주차 목표: 텍스트 분석 프로세스 이해하기 참고 자료: wikidocs.net/21694 1. 텍스트 분석 기본 용어 1. 토큰화 (Tokenization) 자연어 처리에서 크롤링 등으로 얻어낸 코퍼스 데이터가 필요에 맞게 전처리되지 않은 상태라면, 해당 데이터를 사용하고자하는 용도에 맞게 토큰화(tokenization) & 정제(cleaning) & 정규화(normalization)하는 일을 하게 된다. 주어진 코퍼스(corpus)에서 토큰(token)이라 불리는 단위로 나누는 작업을 토큰화(tokenization)라고 부른다. 토큰화의 단위가 상황에 따라 다르지만, 보통 의미있는 단위로 토큰을 정의한다. (e.g. 단어, 문장) Corpus: 말뭉치 또는 코퍼스는 자연언어 연구를 위해 특정한 목적을..