Nuko(՞ . .՞)੭"

28.6K posts

Nuko(՞ . .՞)੭" banner
Nuko(՞ . .՞)੭"

Nuko(՞ . .՞)੭"

@nuko973663

かいしゃのひとへ。みつけてもそっとしておいてください|icon @tanubitUT note

異世界 Katılım Eylül 2020
1.1K Takip Edilen1.7K Takipçiler
Sabitlenmiş Tweet
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
tanukiに改宗しました #新しいプロフィール画像
Nuko(՞ . .՞)੭" tweet media
日本語
9
1
54
14.1K
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
冬は1,000W越えでもオイルヒーター代わりに360mm x 50mmのラジエーター1本でいけたんだけど、気温が上がってしまって流石に厳しくなってきた。1本足して2本構成。 夏にかけて、ラジエーターをベランダに外だしするか、水路のスイッチングを行って熱帯魚のヒーターの代わりに使う? 水槽の熱容量は大
日本語
1
0
1
114
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
オレオレllm-orchestratorの統計をとっているんだけど、routineで回しているタスクが多いので、1 taskで使用するtokenのp95はめっちゃ低い。もっと重めのタスク回せる。122Bは256K tokensまで行けるのに全然使いこなせていないわ。もったいねぇ。
Nuko(՞ . .՞)੭" tweet media
日本語
0
0
1
57
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
claudさん、255並列という暴挙に出る 草生える。絶対失敗するやろ batch sizeあげて並列数をプロセッサ数にするとかなんとかはまだ考えないらしい
Nuko(՞ . .՞)੭" tweet media
日本語
0
0
1
118
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
DeepSeek-OCR2をRTX3090単機で回したら100ページの日本語PDFが約2分。誤変換率はめっちゃ低い。かなり使える。PDFは前処理とかあるのに1ページあたり1秒台ってのはほんとにすごいね。夜間にバッチ処理しようと思ってたけど、すぐ終わるじゃん。
日本語
0
0
4
146
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
touch IDのためだけにMac studioでappleの純正キーボード買ったんだけど、左にHHKB、右につるぺたキーボードだとものすごいストレスを感じる。。。もう身体が拒絶するレベル。。。しかも調べたらtouch IDとして使用可能なサードパーティーデバイスないっぽいじゃん。。。許すまじ。
日本語
0
0
1
355
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
@NeShoeshine usだと$950っぽい情報を見たのですが、これが本当なら救世主かもしれません。会社に持って行こうと思っているeGPU boxの中身がRTX3070で8GBしかなくて心許ないので、買って試してみようかなと思える値段です。
日本語
0
0
2
97
くつねえ(՞ . .՞)੭"
Intel Arc Pro B70は貧乏ローカルLLM勢の救いになるのだろうか
日本語
1
0
2
292
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
@ta1suke 牛肉は高いので長いことスーパーで買っていません。肉の購入見極めラインは1 円/gです。 最近おどろいたことは、500 mlのペットボトル飲料(コーラとか)が150円では手に入らないことです。
日本語
0
0
1
81
中野泰輔 | 株式会社ウォース
最近の多くの人間関係を通じて学んだこと - 金銭感覚の合う人だけと絡もう - 性格が合わない人とはすぐ離れよう - 悪意がなかった、がいちばんの悪意 - 頼れる人は作るものではなくできるもの - 尊敬できる人とだけ付き合おう
日本語
2
0
72
5.6K
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
Macのモデルをllama.cpp backendからmlxに変えたらレスポンスが良くなった気がしなくもない。122Bモデルで256K長だと結構重い。 あと”LLMは内部状態を持たない”っていうやつ、そろそろ live modelでShort-term potentiationとかLong-term potentiation実装されて欲しいな。だんだんぶっ壊れると思うが
日本語
0
0
0
103
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
後学のためにopenclaw触っていて思ったんだけど、skillをダウンロードして使用するのって怖くない?怖すぎるので、自動検閲機能つけて欲しい。
日本語
0
0
4
150
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
ChatGPTにopenclawの今を聞いたら、すでに自分で実装してるやろがって言われて草
日本語
0
0
3
93
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
主治医に「ちょっと気分転換しようかなと思いまして」って言ったら、急に慌てられたので、「そういうのじゃ無いです。お家で映画見たりです。一歩も出ないと思います。」って念押ししといた。
日本語
0
0
2
64
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
DGX-sparkの投稿をめっちゃ見るんだけど、数ヶ月後に実はRAM倍増、inference速度倍増の後継機種でましたみたいなの出てきそうで怖い。
日本語
0
0
1
208
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
昨日あたりから?作っているサイトだけど、治験情報の収集と論文検索やその疾患領域の未解決のニーズをllmで考えさせるようにしている。ちなみにどれぐらいの精度が出るかはこれからの楽しみ。GPUガン回し
Nuko(՞ . .՞)੭" tweet media
日本語
0
0
5
148
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
@NeShoeshine 予約必須なのに待たされるし、担当者が来ても時間かかるし、毎回、気合い入れて行かないといけないお店ですよね。 しかも会話を弾ませないといけないシステムみたいで余計なことをまで聞いてくる 一番使っているアプリはなんですか?って聞かれた時Terminal.appですって答えたら変な顔
日本語
1
0
1
49
くつねえ(՞ . .՞)੭"
くつねえ(՞ . .՞)੭"@NeShoeshine·
実はmacそのものにそこまで強い恨みはないが、Apple公式物理店舗様と自称ジーニアス()には学生時代の非常に深い恨みがあるので自分が関わる領域では公式に二度と金払わんと思っている。
日本語
1
0
4
124
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
今日はiPadで開発してる 治験サイトをプロットして遊んでるところ。 日本はまだグローバルで相手にされているけどそのうち東アジアでは韓国や中国に大きく引き離されて治験過疎地になるんじゃないかと心配している
Nuko(՞ . .՞)੭" tweet mediaNuko(՞ . .՞)੭" tweet media
日本語
0
0
0
123
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
12月からリワークがてらに構築しているAI Agent基盤を使って、業界データの取り込みしている Global Pharmaの進行中の治験を約2,500試験取り込んで、X社がPhase Y試験をZ個してるとか、どこで何社の治験が競合しているとか、丸見えンゴ出来るようにした SQL書くのは35Bのモデルがやってくれている
日本語
0
0
1
128
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
VRAMもりもりMAXのヘビーModelでガン回しするのもいいけど、手のひらの上で動く可愛いAIを育てるのも楽しいです。 子育てと同じでひっじょーに勉強になる。LLMが間違えたりするのは人間側の指示だったり環境が悪いんだなぁってのがよくわかる。
日本語
0
0
1
55
Nuko(՞ . .՞)੭"
Nuko(՞ . .՞)੭"@nuko973663·
iPhone 16Pro上で動かしているLLMの2Bモデルは2歳児に頼み事をする感じでとてもイイ - 雑なツール設計は混乱の元 - User Promptにぶち込みも混乱の元 - slashコマンドでコンテキストを絞ってなんとか成功 頑張れー!頑張れー!って感じ 今日はiPhone nativeアプリの調整とiPad nativeアプリ作ってた
Nuko(՞ . .՞)੭" tweet mediaNuko(՞ . .՞)੭" tweet media
日本語
1
0
3
680
Nuko(՞ . .՞)੭" retweetledi
vLLM
vLLM@vllm_project·
🚀 vLLM v0.17.0 is here! 699 commits from 272 contributors (48 new!) This is a big one. Highlights: ⚡ FlashAttention 4 integration 🧠 Qwen3.5 model family with GDN (Gated Delta Networks) 🏗️ Model Runner V2 maturation: Pipeline Parallel, Decode Context Parallel, Eagle3 + CUDA graphs 🎛️ New --performance-mode flag: balanced / interactivity / throughput 💾 Weight Offloading V2 with prefetching 🔀 Elastic Expert Parallelism Milestone 2 🔧 Quantized LoRA adapters (QLoRA) now loadable directly
vLLM tweet media
English
22
86
949
61.4K