Toshiaki Maki

36.5K posts

Toshiaki Maki banner
Toshiaki Maki

Toshiaki Maki

@making

Senior Principal Architect at @VMwareTanzu / @Broadcom | Ex @Pivotal | Bichon Frise 🍋🐩

Tokyo, Japan Katılım Nisan 2007
199 Takip Edilen3.7K Takipçiler
Toshiaki Maki retweetledi
antirez
antirez@antirez·
For the DGX Spark owners. This is what you get with DS4 in your hardware. I want to post this to show how with fast prefill and not very fast generation, the system remains absolutely fine to use.
English
32
29
404
37.9K
Toshiaki Maki
Toshiaki Maki@making·
reddit.com/r/SpringBoot/c… Spring BootとNode.jsで同じマイクロサービスを作り18ヶ月プロダクション運用で比較。インフラコストはSpring Bootが半額、メモリも安定。 だそうです
日本語
0
15
57
6K
Toshiaki Maki
Toshiaki Maki@making·
例えばSpring DataでRepositoryを作った場合、実体はこういうクラスが使われるけれど、全メソッドにトランザクションがはられている。トランザクションをRepostioryかUsecase(Service)にはるかではなく、ネストさせた上でどう伝播させる(既存に参加、新規作成等)か、だと思う github.com/spring-project…
Toshiaki Maki@making

Javaだと当たり前だけど、他の言語・フレームワークだとそうじゃないのかな。 両方にトランザクション貼ってネストさせて、必要に応じて伝播属性を調整すればええやん。

日本語
0
2
25
11.3K
Toshiaki Maki
Toshiaki Maki@making·
@shinjishim40534 長さの話ではなく境界の話なので、もしその処理のロックが長くなるとしたら言語関係なくそうなります
日本語
0
0
2
272
Toshiaki Maki
Toshiaki Maki@making·
@NoobFunctor I've been using it for over 15 years and have never encountered any problems with propagation. There are many other parts that are more problematic, though.
English
0
0
4
2K
Jarek Ratajski 🇺🇦
Jarek Ratajski 🇺🇦@NoobFunctor·
@making "Given" transaction propagation is maybe the most problematic part of popular java frameworks (it can fail in so many subtle ways)
English
1
0
4
2.3K
Toshiaki Maki
Toshiaki Maki@making·
llama.cppのMTPサポートのおかげで、Qwen3.6-27B on DGX Sparkで、26 tok/s 出るようになった。以前は11 tok/s だったので、だいぶ快適になった。
日本語
0
0
1
566
Toshiaki Maki retweetledi
Georgi Gerganov
Georgi Gerganov@ggerganov·
llama.cpp adds MTP for the Qwen3.6 family This is a significant milestone for the local AI ecosystem. The performance jump with these changes is massive and elevates local inference on commodity hardware further. Special thanks to Aman Gupta for leading this development! github.com/ggml-org/llama…
English
48
185
1.2K
270.1K
Toshiaki Maki
Toshiaki Maki@making·
RabbitMQ 4.3のDelayed Retriesは良い機能だと思う。作り込みが要らなくなる #delayed-retries" target="_blank" rel="nofollow noopener">rabbitmq.com/blog/2026/04/2…
日本語
0
5
9
1.8K
Toshiaki Maki retweetledi
antirez
antirez@antirez·
I just pushed a big refactoring of DS4 backends with CUDA support and single direction activation steering. The Metal path should be unaffected. Note: I only support hardware I have own (or have full access to): so just M3 (no M5 NE for now), DGX Spark.
antirez@antirez

Soon in DS4: 1. CUDA support (14 t/s, 350 t/s prefill on DGX Spark), 2. Single direction steering support. 3. Huge refactoring to support Metal / CUDA / CPU in a more sensible way.

English
6
11
165
18K
Toshiaki Maki
Toshiaki Maki@making·
去年の10月に買ったNAS、同じ構成で今買おうとすると2.5倍かかる
Toshiaki Maki tweet media
日本語
0
0
1
509
Toshiaki Maki retweetledi
antirez
antirez@antirez·
DS4 running on DGX Spark (GB10 / CUDA), private branch for now. 12 tokens/sec, the memory bandwidth is limited in this system, at 270GB/sec. But prefill is ways more alighed to M3 Max at ~200 t/s. I'll release when more mature, but it is almost sure that it will get merged.
English
49
73
788
83K
Toshiaki Maki
Toshiaki Maki@making·
公開していないドメインにアクセスしてくる(404エラー)IPアドレスをhaproxyレイヤーで全部自動でブロックするようにアクセスログを監視しているのだけど、毎日積み上がっていく。既に数千件はブロックした。 github.com/making/k8s-git…
V@voluntas

外部からアクセス可能なhttpsサイトはドメイン設定後「即」攻撃にさらされる件 zenn.dev/kusuke/article… 皆呼んで欲しい。

日本語
0
0
1
1.2K
Toshiaki Maki
Toshiaki Maki@making·
Qwen3.6-27B on DGX SparkはvLLMでNVFP4で幾分かマシになるな
日本語
0
0
0
663
Toshiaki Maki
Toshiaki Maki@making·
@cero_t 前までは再利用可能でいい感じのコンポーネントが使いやすい、作りやすいでReactにしてましたが、どうせAIに丸投げだし、Reactなしでもデザインも良い感じにやってくれるし、作り直しもすぐにできるので素のSSRで良いやってなりました。 ただ管理画面とか状態多めなUIは厳しかったのでReactのまま
日本語
0
0
2
275
谷本 心 (Shin Tanimoto)
「サーバサイドレンダリングとかぜんぜん使わない。サーバサイドはAPI呼び出しだけ、フロントはReactかVueで別に作る。それ以外の選択肢は考えられない」 とかずっと言ってたのに、1人でAIエージェント使って開発する時は楽だからサーバサイドレンダリングとhtmxでやってる。ごめんね。
日本語
1
5
60
8K