
きしだൠ(K1S)
367.3K posts



4/27 高市首相「 現時点で補正予算の編成が必要な状況とは考えていない」 と明言。 案の定、補正予算が必要になり赤字国債予定。 一ヶ月先の国家予算すら読めない政権と石油危機なのに補助金垂れ流してお金が足りないという戦略性の無さ。 円が信用を失うのも当然の流れ。


これはえぐい。。。 Karachiの開発者が、「LLMをゼロから作る方法」を1つのJupyter notebookにまとめて無料公開しています。 名前は「Train LLM From Scratch」。 GPT-4品質のモデルを再現するものではありません。 むしろ、Transformerがどう動き、データをどう処理し、どう学習して、どう文章を生成するのかを、手を動かしながら理解するための学習リポジトリです。 すごいのは、最終的に2Bパラメータ級の言語モデルまで、1枚のGPUでスケールさせる流れが入っていること。 使うのはA100やRTX 4090。 データセットはThe Pileの825GB。 コードはPyTorchで、multi-head attentionもゼロから実装します。 学べることはかなり実践的です。 ・Transformerの仕組み ・The Pileのダウンロードとトークナイズ ・PyTorchでのmulti-head attention実装 ・単一GPUでメモリを枯らさず学習する方法 ・学習済みモデルからテキストを生成する方法 ・13Mパラメータから2Bパラメータまで拡張する流れ しかもMITライセンスで、GitHub上に無料公開。 正直、出力は小さく粗いです。 プロダクション用のモデルではありません。 でも「LLMって結局どう動いているのか?」を、論文とコードを往復しながら理解する教材としてはかなり面白いです。 大規模AIの中身がブラックボックスに見えている人ほど、一度こういうリポジトリを追う価値があります。 github.com/FareedKhan-dev…

논알콜맥주 1짱 추천좀

福岡の居酒屋の5000円なら結構うまいものが食えるのでよかった。


ローカルLLM、現実的なとこだと、300B-A15Bくらいを100Kコンテキストで35tok/secで回すというところかなぁ。 プロセッサが年率30%成長、バンド幅が年率20%成長と考えると、5年でもそのくらいが実用域じゃないかと。 メモリは需給の問題だから落ち着けば256GBくらいは使いやすくなるはず。



飲み会で5000円は一般的 だけどうなぎなら5000円で結構うまいものが食える これなんだよ 5000円での満足度が居酒屋ではそこまで高くないことを感じている人が多いんじゃない アルコールが体にかなり悪いというのも知られてきたし

会議室のモニターのケーブルに付いてた




