きしだൠ(K1S)

367.3K posts

きしだൠ(K1S) banner
きしだൠ(K1S)

きしだൠ(K1S)

@kis

楽しく仲よく

Katılım Mayıs 2007
20.3K Takip Edilen25.3K Takipçiler
Sabitlenmiş Tweet
きしだൠ(K1S)
きしだൠ(K1S)@kis·
サブスクリプション始めてみた。 2週に1回くらい技術まとめをやる予定。 あと、関連トピックの投稿をまとめます。 とりあえず、業務システム開発にスピードが求められてる話をまとめています。 x.com/kis/creator-su…
日本語
1
1
27
22.6K
きしだൠ(K1S)
@ryo_aiwork そういうインフラは、原価割れでサービス提示して原価かんがえると10倍、みたいにはならないので、ちょっと違う気がします。 水道代毎年倍になるから井戸掘るかーみたいになりそう
日本語
0
0
0
30
Ryo|AI×副業
Ryo|AI×副業@ryo_aiwork·
@kis AI課金って、だんだん電気代や水道代に近づいていきそう。 昔は「ネット代を払う」が特別だったけど、今は当たり前。 AIもそのうち、開発者だけじゃなく個人や会社の基礎インフラ費になる気がします。
日本語
1
0
0
45
きしだൠ(K1S)
ITエンジニア、基本的にはちょっとまともなパソコンさえあればプロアマ問わず同等の開発ができる、趣味でも開発ができる、というのが特徴だったけど、AIに関しては、数十万、数百万、数億の設備が用意できるか、もしくは数万円のサブスク払えるかが開発にも必要になって、装置産業になったな
日本語
15
181
970
95.3K
きしだൠ(K1S)
あれだな。プログラミングの勉強しますで、コマンドラインでforとかifの結果だけ見せられてもようわからんってなるやつ。 記号接地て大事で、ちゃんと実用とどう結びつくかをやったほうが理解につながりやすい
日本語
0
5
47
4.7K
きしだൠ(K1S)
なんか、「LLMの原理をしりたい!」でも、もう「理論を実装しました」では足りなくなってるのよなー
日本語
0
0
10
1.3K
きしだൠ(K1S)
まあ、そういう手順かけよという話なので、そこは頑張る
日本語
0
0
2
914
きしだൠ(K1S)
スクラッチから少し工夫するだけでQwen3うごくはずなので。 そしてそこはAIさんに書かせればよい
日本語
1
0
1
1K
きしだൠ(K1S)
「LLMって結局どう動いているのか?」だと、こういうスクラッチよりQwen3を実装するのがいいなぁと思うようになった。「GPT-4品質」が動くし。 がんばれば画像対応できるし。 学習の学習はべつにやるほうがいいな。
AI駆動塾@L_go_mrk

これはえぐい。。。 Karachiの開発者が、「LLMをゼロから作る方法」を1つのJupyter notebookにまとめて無料公開しています。 名前は「Train LLM From Scratch」。 GPT-4品質のモデルを再現するものではありません。 むしろ、Transformerがどう動き、データをどう処理し、どう学習して、どう文章を生成するのかを、手を動かしながら理解するための学習リポジトリです。 すごいのは、最終的に2Bパラメータ級の言語モデルまで、1枚のGPUでスケールさせる流れが入っていること。 使うのはA100やRTX 4090。 データセットはThe Pileの825GB。 コードはPyTorchで、multi-head attentionもゼロから実装します。 学べることはかなり実践的です。 ・Transformerの仕組み ・The Pileのダウンロードとトークナイズ ・PyTorchでのmulti-head attention実装 ・単一GPUでメモリを枯らさず学習する方法 ・学習済みモデルからテキストを生成する方法 ・13Mパラメータから2Bパラメータまで拡張する流れ しかもMITライセンスで、GitHub上に無料公開。 正直、出力は小さく粗いです。 プロダクション用のモデルではありません。 でも「LLMって結局どう動いているのか?」を、論文とコードを往復しながら理解する教材としてはかなり面白いです。 大規模AIの中身がブラックボックスに見えている人ほど、一度こういうリポジトリを追う価値があります。 github.com/FareedKhan-dev…

日本語
1
19
202
29K
tilt
tilt@barTILT·
맥주 재현도 : 하이네켄, 칭따오 맛 : 아사히 비경의 개척자 : 하이트제로 유통되는 논알콜 '거의 다' 마셔보고 결론. 하이네켄/칭따오가 유알콜에 가까운 맛인데 둘다 개성이 쎈 맥주라 호불호 갈릴. 아사히가 확실히 편하고. 하이트제로는 맥주맛이 아니라 '무알콜맥주'라는 독립 장르로 재밌음.
깨소미@u7ki89i89u7

논알콜맥주 1짱 추천좀

한국어
4
100
148
50.7K
きしだൠ(K1S)
@everes 鎌倉だとよさげな魚は全部築地にいきそう。いまは豊洲ですかね。 福岡はそこらへんのいい魚が集まる、外海に面したほどほどの都会ってとこがいいんでしょうね。
日本語
0
0
1
50
ツユキマコト
ツユキマコト@everes·
@kis デカい漁港ありますもんね。ズルですわー!
日本語
1
0
0
37
きしだൠ(K1S)
おうちのOpenCodeに指示をだす仕組みも必要やな
日本語
0
0
2
831
きしだൠ(K1S)
@AkiraKidoX 300Bくらいだと、130kくらいからは性能劣化が目に見えて出てくるので、100kでcompactionって感じが。 あと、200kになるとプロンプト読み込みに15分くらいかかるようになりそう
日本語
0
0
1
211
きしだൠ(K1S)
@CookieySun 異常な犯罪を犯すのは異常な風体の人で自分たちには関係ない、としたいのは正常性バイアスのひとつだと思いますよ。
日本語
0
0
0
62
🍪☀️
🍪☀️@CookieySun·
@kis 正常性バイアスの使い方が間違ってそうなのが気になる。。。
日本語
1
0
0
77
きしだൠ(K1S)
実際の移送はセレナだったし紺のパーカーで顔を隠してたし、それでもこの画像の投稿で盛り上がってたの、凶悪な犯罪に関わる人はこういう風体であってほしいっていう正常性バイアスもあるんだろうな。 digital.asahi.com/sp/articles/AS…
日本語
1
1
7
1.5K
きしだൠ(K1S)
ローカルLLM、現実的なとこだと、300B-A15Bくらいを100Kコンテキストで35tok/secで回すというところかなぁ。 プロセッサが年率30%成長、バンド幅が年率20%成長と考えると、5年でもそのくらいが実用域じゃないかと。 メモリは需給の問題だから落ち着けば256GBくらいは使いやすくなるはず。
日本語
0
4
45
4K
きしだൠ(K1S)
APIでホストされてるモデルのメリットは、でかい総パラメータをみんなで共有して小さいアクティブにプロセッサを占有して計算というところにあるから、Qwen3.6-27BのようなDenseモデルはAPIで使うメリットがあまりないのだよな。 300B-15Bのようなモデルのほうが安く賢いはず。
日本語
0
3
21
2.5K
きしだൠ(K1S)
@webbigdata Qwen 27B、なんだかんだでアクティブに動くパラメータがKimi K2.6(A32B)よりちょい少ないくらいで動かすのに金かかりそう。 Denseの30B前後は、APIで使うと割にあわない気がします。
日本語
1
0
1
175
webbigdata
webbigdata@webbigdata·
商用AIとオープンAIの価格比較 Qwenの27Bの値付けが驚き どこも値上げ傾向 Gemini 3.1 (Agent Platform) Pro $2/$12 Flash(3.0) $0.5/$3 Flash-Lite $0.25/$1.5 Gemma 4 26B $0.15/$0.6 Qwen3.6(Alibaba Cloud) Max $1.3/$7.8 27B $0.6/$3.6 Plus $0.5/$3 Flash $0.25/$1.5 35B-A3B $0.248/$1.485
日本語
2
2
21
6.2K
きしだൠ(K1S)
@wlv_myzk 安いしおいしい。ただし、凝った料理はあまりないです。パスタやさん少ない
日本語
0
0
1
37
なおぱん
なおぱん@wlv_myzk·
@kis ほんとそう。博多は飲食代が激安だと思う。
日本語
1
0
1
58