Plat 🖼️

9.1K posts

Plat 🖼️ banner
Plat 🖼️

Plat 🖼️

@p1atdev_art

masterpiece, best quality. bsky→https://t.co/MkTEfxDD96

Neotopia Katılım Eylül 2022
321 Takip Edilen6.8K Takipçiler
Sabitlenmiş Tweet
Plat 🖼️
Plat 🖼️@p1atdev_art·
Plat 🖼️ tweet media
ZXX
1
1
22
7.8K
Plat 🖼️
Plat 🖼️@p1atdev_art·
リアルタイム性の需要がないなら多少遅くても待つ価値があるくらい精度がいいと思う
日本語
0
0
0
162
Plat 🖼️
Plat 🖼️@p1atdev_art·
なんか結局 openai whisper large v3 が普通に一番書き起こし精度良くないか
日本語
1
0
6
442
Plat 🖼️
Plat 🖼️@p1atdev_art·
ストリームをオフにしたら動いた
日本語
0
0
1
191
Plat 🖼️
Plat 🖼️@p1atdev_art·
プロセッサーとかのあたりでバグってそうで Gemma4 は動かなかった
Plat 🖼️ tweet media
日本語
1
0
1
245
Plat 🖼️
Plat 🖼️@p1atdev_art·
vllm の依存 transformers のバージョンめっちゃ低いから gemma4 普通に使おうとすると対応してないって言われて docker イメージじゃないと無理っぽい
日本語
0
0
5
420
Plat 🖼️
Plat 🖼️@p1atdev_art·
Gemma4、浅く考えるようにお願いすると thinking が短くなる
日本語
1
0
1
334
Plat 🖼️
Plat 🖼️@p1atdev_art·
ggml-anime-whisper-q4_0.bin、確かになぜか冒頭に変な文字が入りやすいな... なんでだろう
日本語
0
0
2
370
Plat 🖼️
Plat 🖼️@p1atdev_art·
E4Bで EMOJI_ANNOTATIONS 風のアノテーションつけながら書き起こしさせてみようとしたけど、ちょくちょく絵文字入るものの、そんなに綺麗に差し込まれない感じだった
日本語
0
0
1
256
Plat 🖼️
Plat 🖼️@p1atdev_art·
Gemma4 E4B は超短文の日本語音声で書き起こし精度がいい気がする 長くなると whisper とか Cohere Transcribe, Qwen3-ASR が安定感強い感じがする
日本語
1
0
2
394
Plat 🖼️
Plat 🖼️@p1atdev_art·
Qwen3-Omni-30B-A3B-Instruct 動かすのそんなに素直にいかないか...? vllm で使いたかったけど thinking 対応してるのに instruct は未対応? transformers でやるとしたら VRAM 結構いるんかな てっきり GPT-OSS-20B くらいの感覚で動くのかと思っていた...
日本語
1
0
2
464
Plat 🖼️
Plat 🖼️@p1atdev_art·
exclude-newer = "7 days" 設定していると、新しいモデルが出た時にバージョン上げれなくてすぐ試せなくなっちゃうw
日本語
0
0
3
274
Plat 🖼️ retweetledi
机器之心 JIQIZHIXIN
What if you could generate stunning AI images in a single step, without compromising quality? Researchers from Westlake University, Chinese Academy of Sciences, and DP Technology present a breakthrough. They've introduced a new framework that simplifies the design of 'shortcut' diffusion models. This framework clarifies how to build more efficient one-step image generators by disentangling their core components. Their model achieves a new state-of-the-art FID50k of 2.85 on ImageNet-256x256 with one-step generation, and 2.53 with two steps. Remarkably, it requires NO pre-training, distillation, or curriculum learning! On the Design of One-step Diffusion via Shortcutting Flow Paths Paper: openreview.net/forum?id=k6q8r…  Code: github.com/EDAPINENUT/Exp…    Project: edapinenut.github.io/explicitshortc… Our report: mp.weixin.qq.com/s/BptmtBa_OGXk… 📬 #PapersAccepted by Jiqizhixin
机器之心 JIQIZHIXIN tweet media
English
1
5
29
3.1K
Plat 🖼️
Plat 🖼️@p1atdev_art·
E4Bの音声認識結構いいね E2Bは厳しい感じだったけど
日本語
0
0
1
234
Plat 🖼️
Plat 🖼️@p1atdev_art·
ClaudeにMultiScreen再現実装させようとしたけど、なんかうまく学習できなくてどっかミスってる気がするけどよくわからん
日本語
0
0
2
300
Plat 🖼️
Plat 🖼️@p1atdev_art·
iOS / macOS でローカルLLMを超手軽に試したい場合はLocally AIがUI良くていい感じだった 面倒な準備がいらない代わりに細かい設定はできないけど、トークン生成のスピード感とかを試したいならかなりいいと思う あとApple Foundation Model対応なのも良 apps.apple.com/app/id67414266…
日本語
0
0
3
463
Plat 🖼️ retweetledi
FA770
FA770@ArmorF23679·
コンシューマーGPU1枚で画像生成モデルをスクラッチしよう(後編)|FA770 note.com/fa770/n/n36aee…
日本語
0
36
247
117.7K
Plat 🖼️
Plat 🖼️@p1atdev_art·
Gemma4 ってツール定義・コールする時に JSON の "" のエスケープで混乱しないように、JSON フォーマットの方はスペシャルトークン <|"|> を使ってるみたい
日本語
0
0
3
405