pon / Hiromu Nakamura

3.9K posts

pon / Hiromu Nakamura banner
pon / Hiromu Nakamura

pon / Hiromu Nakamura

@po3rin

LayerX Inc. AI-UX/MLOps TechLead. Interested in Information Retrieval. ex: M3, Inc. graduated from Nagoya Univ.

東京 Katılım Nisan 2012
2.4K Takip Edilen4.5K Takipçiler
Sabitlenmiş Tweet
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
こちら!技術書典でオンライン販売開始してます!!LayerX初参加で気合を入れすぎた結果370ページを超えました。中身は全部面白いです!自信あり!! #技術書典 techbookfest.org/product/5zbWgn…
pon / Hiromu Nakamura tweet mediapon / Hiromu Nakamura tweet media
日本語
0
20
102
28.4K
pon / Hiromu Nakamura
三省堂書店ーーー!!俺だーーー!! 本屋ってこんなに混むことあるのか。すご。
pon / Hiromu Nakamura tweet media
日本語
0
2
14
2.6K
pon / Hiromu Nakamura
RLMに自己反省を入れて、複数の推論の軌跡を並列で探索するようにしたSRLM RLMを実践で採用すると精度担保のために再帰レベルを上げなきゃいけないけど、これは並列なスケーリングを可能にしてくれてるのでレイテンシの観点でも良い。 arxiv.org/abs/2603.15653
日本語
0
0
1
647
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
k8s on 社内GPUでLLM推論のScale-to-zeroをしたくて導入したKubeAIが良いかんじ。外部コンポーネント依存なしでOperatorとCustom Resourceだけで実現できるのが良かった。llm-dだとオーバーキルすぎたので github.com/kubeai-project…
日本語
0
0
8
861
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
Claude CodeにSkypilot経由でk8s on GPUを触らせて、実験を並列スケーリングする話。 ローカルのAIにGPU触れるようにする方向は自分も試してて体験が良い。直近だとModal使っていい感じになった。 blog.skypilot.co/scaling-autore…
日本語
0
2
7
725
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
RSA(Recursive Self-Aggregation)。これはパワー。LLM推論を並列にも直列にもスケーリングさせるやつ。 rsa-llm.github.io
日本語
0
0
3
731
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
Software Design 4月号にLayerXの連載第2回が掲載されています!!実務で必ず悩むことになる「LLMにどこまで任せるのか?」の考察は必見です。
pon / Hiromu Nakamura tweet mediapon / Hiromu Nakamura tweet media
日本語
0
10
66
6.7K
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
DeepEvalの合成データセット生成、一回データ作って品質悪いものをFilterしてからEvolutionさせるのか。Ragasとは違うアプローチだ。 #how-does-it-work" target="_blank" rel="nofollow noopener">deepeval.com/docs/synthesiz…
日本語
0
3
14
2K