Heejune Sheen

2 posts

Heejune Sheen

Heejune Sheen

@HeejuneSheen

Katılım Şubat 2024

45 Takip Edilen23 Takipçiler

Heejune Sheen retweetledi

Zhuoran Yang

Zhuoran Yang@zhuoran_yang·18 Haz

🚀 We're excited to share our paper, "Taming Polysemanticity in LLMs," which introduces Group Bias Adaptation (GBA)—the FIRST Sparse Autoencoder (SAE) training method with a provable guarantee for untangling monosemantic concepts! 📄 Paper: arxiv.org/abs/2506.14002 🌐 Website: y-agent.github.io/taming-sae-gba… 🎯 Demo (Layer 26 of Qwen 2.5B-Base): y-agent.github.io/taming-sae-gba… Joint work with @siyuc3141, @HeejuneSheen, Xuyuan Xiong, and @0920wth

Zhuoran Yang tweet media

Zhuoran Yang tweet media

Zhuoran Yang tweet media

English

24

110

10.2K

Heejune Sheen retweetledi

Zhuoran Yang

Zhuoran Yang@zhuoran_yang·18 Eyl

[New Paper on In-Context Learning] Title: Unveiling Induction Heads: Provable Training Dynamics and Feature Learning in Transformers Joint work with @siyuc3141 @HeejuneSheen @0920wth Link: arxiv.org/abs/2409.10559

English

29

144

19K

Keşfet

@siyuc3141 @0920wth @elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA