Yuki Uchino
77 posts

Yuki Uchino
@uchino_error
Ph.D. in Engineering.HPCの人間ではないので色々教えてください.
Katılım Temmuz 2025
75 Takip Edilen98 Takipçiler

以前のインターンで自分が指導した学生は、インターン内容を修論テーマにしたいとなったので、インターン後も指導を継続し学会発表なども行いました
Yuki Uchino@uchino_error
R-CCS 計算科学インターンシップ・プログラム 2026 r-ccs.riken.jp/outreach/schoo…
日本語
Yuki Uchino retweetledi

—ハードの限界をソフトで超える—
その発想が、いよいよcuBLASの公式機能になりました。
「尾崎スキーム I」をRTX PRO 6000 Blackwell Max-Qで検証したところ、FP64理論性能1.71 TFLOPSのGPUで約8 TFLOPS、ネイティブの約5倍を達成。しかも精度は標準DGEMMより高いという結果に。環境変数1つで既存コードに適用できるのもポイントです。👇
zenn.dev/fixstars/artic…

日本語

Double-Precision Matrix Multiplication Emulation via Ozaki-II Scheme with FP8 Quantization
arxiv.org/abs/2603.10634
English
Yuki Uchino retweetledi

Ozaki-II Library v2.0.0 released.
- Add FP8-based emulation
- Add stream support
- Add cuBLASLt handle support
- Breaking: removed UseExtraWorkspace
- etc.
FP8版を作成しました。詳細はarXivで出します。
github.com/RIKEN-RCCS/GEM…
日本語

The goat @uchino_error
Underfox@Underfox3
In this paper is presented a rigorous error analysis of the Ozaki-II scheme, showing the accuracy behavior of the method and enabling the estimation of the number of low-precision matrix mult. required to achieve a desired level of numerical accuracy #HPC arxiv.org/pdf/2602.02549
English



