5월 1주차 GDSC Sookmyung Weekly AI Trend LLM을 이해하기 위한 ‘Must-Read’ 같이 읽어요 😀 (2) 에디터 | 정시은 지난주에 이어 이번주에는 본격적으로 DeepMind가 작년에 발표한 Formal Algorithms for Transformers에 대해 알아보도록 하겠습니다. Transformer가 어디에 사용되는지, Transformer의 주 아키텍쳐 구성요소들, 토큰화에 대해 다뤄보도록 하겠습니다. 논문을 이해하기 위한 notation 먼저 논문을 쉽게 이해하기 위해 읽어보면 좋을 notation입니다. $[N]:=\{1,2,…,N−1,N\}$ 1~N까지 정수를 포함한 집합 $N_v: V$ vocabulary size $V ~= [N_v]$ vocabulary $..