Chuning Li

1 posts

Chuning Li

Chuning Li

@ChuningLi

MSc @UofTCompSci @VectorInst

가입일 Ekim 2022

50 팔로잉77 팔로워

Chuning Li 리트윗함

Lorenzo Noci

Lorenzo Noci@lorenzo_noci·13 Tem

How do you scale Transformers to infinite depth while ensuring numerical stability? In fact, LayerNorm is not enough. But *shaping* the attention mechanism works! arxiv.org/abs/2306.17759 w/ @ChuningLi @mufan_li @bobby_he @THofmann2017 @cjmaddison @roydanroy

Lorenzo Noci tweet media

English

33

210

81.5K

탐색

@mufan_li @bobby_he @THofmann2017 @cjmaddison @roydanroy @elonmusk @BarackObama @taylorswift13