๐ 6์ฃผ์ฐจ ๋ฐํ ๋ด์ฉ
โ๏ธ ํ์ฃผ
- ์ ์ ํ ๋ ผ๋ฌธ: Neural Machine Translation by Jointly Learning to Align and Translate [pdf]
- ๋ฐํ ์๋ฃ: https://github.com/dsc-sookmyung/2021-DeepSleep-Paper-Review/blob/main/Week6/align.md
- ์ฃผ์ : Alignment model ์ ๋ฑ์ฅ๊ณผ ์ ๋ ฅ ๋ฌธ์ฅ ๋ฒกํฐ์ ์ฐ๊ด ์์ ์ฑ ์ ์ ๋ฐ๋ฅธ ๋ฒ์ญ ํจ์จ ํฅ์
- ๋ฐฐ๊ฒฝ: ๊ธฐ์กด์ฒ๋ผ ์ ๋ ฅ ๋ฌธ์ฅ์ ๊ณ ์ ๋ ๊ธธ์ด์ context vector ๋ก ๋ณํํ ์, ๊ธธ์ด๊ฐ ๊ธด ์ ๋ ฅ ๋ฌธ์ฅ์ ๋ํด์๋ ๋ฒ์ญ ์ฑ๋ฅ์ด ๊ธ๊ฒฉํ ์ ํ๋๋ ๋ฌธ์ ์ ์ด ๋ฐ์
- ๋ด์ฉ
- decoder ์์ output ์ ์ถ๋ ฅํ ๋, ์ ๋ ฅ ๋ฌธ์ฅ์ ์์ฐจ์ ์ผ๋ก ํ์ํด์ ํ์ฌ ์์ฑํ๋ ค๋ decoder์ output ๊ณผ ๊ฐ์ฅ ๊ด๋ จ์๋ ์์ญ์ ์ ์ฉ์ํด
- ๋ฐ๋ผ์ ๊ณ ์ ๋ ๊ธธ์ด์ context vector ๋ฅผ ์ฌ์ฉํ์ง ์๊ณ , encoder ์์ ์์ฑํ ์ฌ๋ฌ context vector ๋ฅผ ๊ณ์ํด์ ์ฐธ์กฐํ๋ฏ๋ก ๋ฌธ์ฅ์ ๊ธธ์ด๊ฐ ๊ธธ์ด๋ ์ฑ๋ฅ ์ ์ง ๊ฐ๋ฅ
โ๏ธ ๋์ฐ
- ์ ์ ํ ๋ ผ๋ฌธ: Effective approaches to attention-based neural machine translation [pdf]
- ๋ฐํ ์๋ฃ: https://github.com/dsc-sookmyung/2021-DeepSleep-Paper-Review/blob/main/Week6/Effective%20approaches%20to%20attention-based%20neural%20machine%20translation.pdf
- ์ฃผ์ : Attention์ ๊ธฐ๋ฐ์ผ๋ก ํ NMT ๋ชจ๋ธ
- ๋ด์ฉ
- local attention๊ณผ global attention๊ฐ์ ๋น๊ต
- Neural Machine Translation์์ attention์ ์ ์ ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ
- ๊ธด input sequence์์ attention์ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ
๐ 7์ฃผ์ฐจ ๋ฐํ ๊ณํ
โ๏ธ ์์ฐ
- ์ ์ ํ ๋ ผ๋ฌธ: Attention Is All You Need [pdf]
- ์ฃผ์ : ์ํ ๊ตฌ์กฐ ์์ด Attention๋ง์ ์ฌ์ฉํ ์๋ก์ด ๋ชจ๋ธ(Transformer) ์ ์
'Group Study (2020-2021) > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DeepSleep] ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ์คํฐ๋ 8์ฃผ์ฐจ (0) | 2021.08.23 |
---|---|
[DeepSleep] ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ์คํฐ๋ 7์ฃผ์ฐจ (0) | 2021.08.17 |
[DeepSleep] ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ์คํฐ๋ 5์ฃผ์ฐจ / ์ดํ ๊ณํ (0) | 2021.08.02 |
[DeepSleep] ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ์คํฐ๋ 4์ฃผ์ฐจ (0) | 2021.07.26 |
[DeepSleep] ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ์คํฐ๋ 3์ฃผ์ฐจ (0) | 2021.07.19 |