Juver

pointwiseFFN

Posted on 2021-04-13 Edited on 2021-04-14

Transformer 為什麼需要一層 pointwiseFFN ?

一開始看 “Attention is all you need” 時，心裡隱隱有這個疑問。我以為對於 contexual representation 而言 “Attention is all I need”，self-attention 的機制可以讓模型直接獲得前後文本資訊，且經由訓練學習每個 token 要花多少注意力在哪些其他 token 上。那 pointwiseFFN 究竟是要學習什麼呢？後來上網搜尋發現鄉民也有同樣的疑問，以下就統整我目前所發現的解釋跟我一些想法。

《游牧人生》影評：所有的相遇都是久別重逢

Posted on 2021-04-13

玉山人工智慧公開挑戰賽2020夏季賽 - NLP應用挑戰賽

Posted on 2020-08-17 Edited on 2021-04-13

今年玉山比賽真的很充實，幾天以來也已經看到許多強者貼出比賽心得了，例如

玉山 NLP 應用挑戰賽、玉山人工智慧公開挑戰賽 2020 夏季賽 — Brainchild。