uint256_t

50.3K posts

uint256_t

@uint256_t

compiler and uarch

Katılım Ağustos 2014

298 Takip Edilen4.5K Takipçiler

Sabitlenmiş Tweet

uint256_t@uint256_t·21 Haz

Championship Branch Prediction 2025 で 1st place でした

日本語

159

15.6K

uint256_t retweetledi

shinichiro hamaji@shinh·1d

MN-Coreは「データ移動は高いので、全PE共有メモリなんてあるわけない」というノリがあり、LシリーズはDRAMすらPE localな領域になりました特にKVキャッシュはDRAM領域をかなり上のレイヤでもメモリレイアウトを把握する必要があり、vLLMを使うとはいかず…… みたいなのが楽しそうと思う人はぜひ

Preferred Networks@PreferredNetJP

【中途採用】現在PFNで開発中の生成AI推論向け半導体 MN-Core™ LシリーズのLLMサービングエンジン開発チームでエンジニアの募集を開始しました！ MN-Coreシリーズのコンパイラエンジニア、ランタイムソフトウェアエンジニアも引き続き募集中です（リプライ参照）👇 Lシリーズは生成AIの推論に必要な高帯域幅を実現するため、3D積層DRAM技術を採用したアクセラレータです。本LLMサービングエンジンは、コンパイラが生成したプログラム、ランタイム環境、DRAM上でのデータ処理を緊密に協調させることで、超低遅延なLLM推論を実現することを目的としています。ハードウェア開発者と密接に連携しながら最先端のLLM推論アクセラレータ向けソフトウェアの開発に携わってみたいという方は、募集の詳細をご覧ください！ open.talentio.com/r/1/c/preferre…

日本語

19.1K

uint256_t retweetledi

κeen@blackenedgold·6d

今年もコンパイラのテーマのインターンやるよ!! インターンシップ｜採用情報｜株式会社Preferred Networks preferred.jp/ja/careers/int…

日本語

uint256_t retweetledi

はすじょい (hsjoihs)@hsjoihs·5d

セキュリティ・キャンプ2026全国大会では、私はCコンパイラゼミを「担当いたしません」。つまり、気兼ねなく夏コミに参加できるということです。ということで、受かれば #コミックマーケット108 にてサークル名『「低レイヤを知りたい人のためのCコンパイラ作成入門」愛好会』での頒布を行います。

日本語

200

9.8K

uint256_t retweetledi

Akira Kawata (a_kawashiro)@a_kawashiro·9 Nis

非常に珍しいLLMの推論エンジンを0から(半導体から)作る仕事があります。dl.acm.org/doi/10.1145/36… を見てもわかるようにLLMというよりもむしろOS自作みたいな仕事です。

日本語

155

10.9K

uint256_t@uint256_t·9 Nis

そろそろ頑張ろうとおもう。

日本語

403

uint256_t@uint256_t·9 Nis

@s_isshiki1969 すごい時代ですね.

日本語

monochrome@s_isshiki1969·9 Nis

@uint256_t claude code, 怖い

日本語

uint256_t@uint256_t·8 Nis

i didn't know of jit spraying

English

911

uint256_t@uint256_t·1 Nis

@s_isshiki1969 そうですね

日本語

359

monochrome@s_isshiki1969·31 Mar

@uint256_t Nで終わる会社？

日本語

396

uint256_t@uint256_t·31 Mar

ありがとう大学院. 明日からは大手町勤務です :)

日本語

uint256_t@uint256_t·28 Mar

@megumish_unsafe ありがとうございます！

日本語

megumish(めぐみっしゅ)@megumish_unsafe·26 Mar

@uint256_t おめでとうございます！

日本語

134

uint256_t@uint256_t·26 Mar

大学院を卒業しました.

日本語

178

10K

uint256_t@uint256_t·26 Mar

@yuki_arano ありがとうございます！

日本語

Yuki Obuchi (新野ユキ)@yuki_arano·26 Mar

@uint256_t おめでとうございます！！！

日本語

192

uint256_t@uint256_t·26 Mar

@saka1_p ありがとうございます

日本語

saka1@saka1_p·26 Mar

@uint256_t おめでとうございます

日本語

105

uint256_t@uint256_t·26 Mar

@orumin ありがとうございます.

日本語

147

orumin@orumin·26 Mar

@uint256_t おめでとうございます

日本語

282

uint256_t@uint256_t·26 Mar

@shiomiolog ありがとうございます🎉

日本語

汐猫みお / SHIONE Mio@バーチャル猫@shiomiolog·26 Mar

@uint256_t おめでとうございます🎉

日本語

uint256_t@uint256_t·26 Mar

@Queue_sys ありがとうございます

日本語

きゅーしす🇺🇦@Queue_sys·26 Mar

@uint256_t おめでとうございます

日本語

196

uint256_t@uint256_t·26 Mar

@hikettei 🎉

QME

128

:hikettei🌙@hikettei·26 Mar

@uint256_t 🥳

QME

227

uint256_t@uint256_t·26 Mar

修了, か.

日本語

909

uint256_t@uint256_t·25 Mar

@hikettei @trymirai congrats 🎉

English

287

:hikettei🌙@hikettei·24 Mar

(1/n) I recently joined @trymirai, where we are working on LLM inference targeting Apple Silicon. Lately I've been digging into quantization. LLM inference is mostly memory-bound. The byte/FLOP ratio is high enough that a lot of the machine's time goes to moving data around instead of doing compute. Quantization helps with that in general, but on Apple Silicon there's an extra payoff: the GPU has a fast W8A8 path. If both weights and activations are INT8, you can use that path for prefill and speculative-decoding verification. Weights are easy since they're static and can be quantized offline. Activations are where the real pain starts.

English

3.4K

uint256_t@uint256_t·8 Mar

@s_isshiki1969 かっこいいですよね

日本語

119

monochrome@s_isshiki1969·8 Mar

@uint256_t おー　バベッジの階差機関ですね。カッコいい！

日本語

141

uint256_t@uint256_t·8 Mar

階差機関が映える賞牌をいただきました.