Plat 🖼️

9.1K posts

Plat 🖼️

@p1atdev_art

masterpiece, best quality. bsky→https://t.co/MkTEfxDD96

Neotopia Katılım Eylül 2022

321 Takip Edilen6.8K Takipçiler

Sabitlenmiş Tweet

Plat 🖼️@p1atdev_art·24 Mar

ZXX

7.8K

Plat 🖼️@p1atdev_art·9h

リアルタイム性の需要がないなら多少遅くても待つ価値があるくらい精度がいいと思う

日本語

162

Plat 🖼️@p1atdev_art·9h

なんか結局 openai whisper large v3 が普通に一番書き起こし精度良くないか

日本語

442

Plat 🖼️@p1atdev_art·10h

ストリームをオフにしたら動いた

日本語

191

Plat 🖼️@p1atdev_art·10h

プロセッサーとかのあたりでバグってそうで Gemma4 は動かなかった

日本語

245

Plat 🖼️@p1atdev_art·10h

transformers の CLI に OpenAI API 形式でサーブする機能が入ってるらしい huggingface.co/docs/transform…

日本語

1.4K

Plat 🖼️@p1atdev_art·11h

vllm の依存 transformers のバージョンめっちゃ低いから gemma4 普通に使おうとすると対応してないって言われて docker イメージじゃないと無理っぽい

日本語

420

Plat 🖼️@p1atdev_art·1d

ai.google.dev/gemma/docs/cor…

ZXX

184

Plat 🖼️@p1atdev_art·1d

Gemma4、浅く考えるようにお願いすると thinking が短くなる

日本語

334

Plat 🖼️@p1atdev_art·1d

ggml-anime-whisper-q4_0.bin、確かになぜか冒頭に変な文字が入りやすいな... なんでだろう

日本語

370

Plat 🖼️@p1atdev_art·2d

E4Bで EMOJI_ANNOTATIONS 風のアノテーションつけながら書き起こしさせてみようとしたけど、ちょくちょく絵文字入るものの、そんなに綺麗に差し込まれない感じだった

日本語

256

Plat 🖼️@p1atdev_art·2d

Gemma4 E4B は超短文の日本語音声で書き起こし精度がいい気がする長くなると whisper とか Cohere Transcribe, Qwen3-ASR が安定感強い感じがする

日本語

394

Plat 🖼️@p1atdev_art·2d

参考 zenn.dev/kun432/scraps/…

日本語

198

Plat 🖼️@p1atdev_art·2d

Qwen3-Omni-30B-A3B-Instruct 動かすのそんなに素直にいかないか...? vllm で使いたかったけど thinking 対応してるのに instruct は未対応？ transformers でやるとしたら VRAM 結構いるんかなてっきり GPT-OSS-20B くらいの感覚で動くのかと思っていた...

日本語

464

Plat 🖼️@p1atdev_art·2d

exclude-newer = "7 days" 設定していると、新しいモデルが出た時にバージョン上げれなくてすぐ試せなくなっちゃうw

日本語

274

Plat 🖼️ retweetledi

机器之心 JIQIZHIXIN@jiqizhixin·3d

What if you could generate stunning AI images in a single step, without compromising quality? Researchers from Westlake University, Chinese Academy of Sciences, and DP Technology present a breakthrough. They've introduced a new framework that simplifies the design of 'shortcut' diffusion models. This framework clarifies how to build more efficient one-step image generators by disentangling their core components. Their model achieves a new state-of-the-art FID50k of 2.85 on ImageNet-256x256 with one-step generation, and 2.53 with two steps. Remarkably, it requires NO pre-training, distillation, or curriculum learning! On the Design of One-step Diffusion via Shortcutting Flow Paths Paper: openreview.net/forum?id=k6q8r… Code: github.com/EDAPINENUT/Exp… Project: edapinenut.github.io/explicitshortc… Our report: mp.weixin.qq.com/s/BptmtBa_OGXk… 📬 #PapersAccepted by Jiqizhixin

English

3.1K

Plat 🖼️@p1atdev_art·2d

E4Bの音声認識結構いいね E2Bは厳しい感じだったけど

日本語

234

Plat 🖼️@p1atdev_art·2d

ClaudeにMultiScreen再現実装させようとしたけど、なんかうまく学習できなくてどっかミスってる気がするけどよくわからん

日本語

300

Plat 🖼️@p1atdev_art·4d

iOS / macOS でローカルLLMを超手軽に試したい場合はLocally AIがUI良くていい感じだった面倒な準備がいらない代わりに細かい設定はできないけど、トークン生成のスピード感とかを試したいならかなりいいと思うあとApple Foundation Model対応なのも良 apps.apple.com/app/id67414266…

日本語

463

Plat 🖼️ retweetledi

FA770@ArmorF23679·4d

コンシューマーGPU1枚で画像生成モデルをスクラッチしよう(後編)｜FA770 note.com/fa770/n/n36aee…

日本語

247

117.7K

Plat 🖼️@p1atdev_art·4d

Gemma4 ってツール定義・コールする時に JSON の "" のエスケープで混乱しないように、JSON フォーマットの方はスペシャルトークン <|"|> を使ってるみたい

日本語

405

Keşfet

@elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA @nikifrancismediavine @katyperry