NVIDIA AI Japan

5.1K posts

NVIDIA AI Japan banner
NVIDIA AI Japan

NVIDIA AI Japan

@NVIDIAAIJP

エヌビディア ジャパンの AI (人工知能) に関するオフィシャルアカウントです。 永久に解けないと思われていた問題や、解けるのは当分先だと思われていた問題が、GPU ディープラーニングによって毎日のように解決されています。

東京都港区赤坂 Katılım Kasım 2016
167 Takip Edilen11.9K Takipçiler
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
オープンな AI ネイティブ イーサネット ファブリック 「NVIDIA Spectrum-X」が、MRC によりギガスケール AI の標準を確立。 ハードウェアで初めて実証、最適化した新トランスポートである「マルチパス信頼性接続 (MRC) 」を業界へ公開します。 nvda.ws/4wxC0aV
NVIDIA AI Japan tweet media
日本語
0
0
2
679
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
NVIDIA は、Adobe と WPP との戦略的提携を拡大しており、クリエイティブな制作から顧客体験のオーケストレーションに至るまで、エンタープライズ マーケティング業務の中核にエージェント型 AI を導入する取り組みを進めています。 nvda.ws/4nHyFSV
NVIDIA AI Japan tweet media
日本語
0
0
3
514
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
OpenAI の最先端モデル「GPT-5.5」を搭載した Codex は、NVIDIA GB200 NVL72 ラックスケールシステム上で稼働しています。 すでに 1 万人超の NVIDIA 社員が活用し、「人生を変えるような」成果を生み出しています。 nvda.ws/4nqLu3R
NVIDIA AI Japan tweet media
日本語
0
0
4
844
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
📍次の目的地は台北! #NVIDIAGTC 台北の Live 基調講演プレゲームが、#COMPUTEX2026 にやってきます。 日本時間 6 月 1 日 (月) 午前 10 時から開催。 ショーの幕開けを一緒に迎えましょう。 詳しい情報は近日公開予定です。 nvda.ws/4wpGwIv
NVIDIA AI Japan tweet media
日本語
0
0
3
595
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
オープンな生成 AI モデルの活用はデータセンターにとどまらず、現実世界で動く機械へと広がっています。 NVIDIA Jetson は、そのエッジ実装を支えるプラットフォームとして普及を後押しします。 nvda.ws/4u5EDiH
NVIDIA AI Japan tweet media
日本語
0
0
4
608
NVIDIA AI Japan retweetledi
NVIDIA Japan
NVIDIA Japan@NVIDIAJapan·
オープンモデルをより安全なエージェントへ:Nemotron & NemoClaw で構築 | Nemotron Labs x.com/i/broadcasts/1…
日本語
0
2
10
2.6K
NVIDIA AI Japan retweetledi
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
Physical AI Days が #NVIDIAGTC に帰ってきました✈今回は台北で開催です。 ロボティクスやインダストリアル AI から、デジタルツイン、シミュレーションまで~フィジカル AI に関する厳選セッションをご用意。 アイデアを実世界での導入につなげるための内容です。 📅 日本時間 2026 年 6 月 4 日 (木)~ 6 月 5 日 (金) 📍 TICC (台北国際会議センター) スケジュールに追加: nvda.ws/49qcsma セッションは主に英語で実施されます。現地参加が難しい方でもご安心ください。後日オンデマンドで視聴できます。
日本語
0
1
2
847
NVIDIA AI Japan retweetledi
Sakana AI
Sakana AI@SakanaAILabs·
Sakana AIは、@NVIDIAとの共同研究で、スパースなTransformer言語モデルの推論・学習を高速化する新しいGPUカーネルとデータ形式を開発しました。 ブログ:pub.sakana.ai/sparser-faster… LLMのコストの大部分を占めるフィードフォワード層では、実は各トークンに対して大半の活性がほぼゼロで無駄な計算に なっています。ReLUと軽いL1正則化を組み合わせれば、性能をほとんど落とさずにスパース率を95%以上まで引き上げられます。ところが現代のGPUは密な行列積に最適化されており、従来のスパース形式は不規則なメモリアクセスのせいで理論上の高速化が相殺されてしまいます。 そこで私たちは、 ① 最適化されたタイル型matmulカーネルにそのまま組み込める新しいスパース格納形式 TwELL (Tile-wise ELLPACK) と、 ② 複数のスパースmatmulを融合してスループットを最大化するカスタムCUDAカーネル を考案しました。 数十億パラメータ規模のスパースLLMを実際に学習・評価したところ、20%以上の高速化と、ピークメモリ・消費電力の大幅な削減を達成しました。 本研究は #ICML2026 にて発表されます。 ぜひブログと論文をご覧ください。 論文:arxiv.org/abs/2603.23198 GitHub:github.com/SakanaAI/spars…
Sakana AI@SakanaAILabs

How do we make LLMs faster and lighter? Don’t force the GPU to adapt to sparsity. Reshape the sparsity to fit the GPU! ⚡️ Excited to share our new #ICML2026 paper in collaboration with @NVIDIA: "Sparser, Faster, Lighter Transformer Language Models". This work introduces new open-source GPU kernels and data formats for faster inference and training of sparse transformer language models: Paper: arxiv.org/abs/2603.23198 Blog: pub.sakana.ai/sparser-faster… Code: github.com/SakanaAI/spars… While LLMs are undoubtedly powerful, they are increasingly expensive to train and deploy, with a large part of this cost coming from their feedforward layers. Yet, an interesting phenomenon occurs inside these layers: For any given token, only a small fraction of the hidden activations actually matter. The rest approximate zero, wasting computation. With ReLU and very mild L1 regularization, this sparsity can exceed 95% with little to no impact on downstream performance. So, can we leverage this sparsity to make LLMs faster? The challenge is hardware. Modern GPUs are optimized for dense matrix multiplications. Traditional sparse formats introduce irregular memory access and overheads that cancel out their theoretical savings for GEMM operations. Our contribution is twofold: 1/ We introduce TwELL (Tile-wise ELLPACK), a new sparse packing format designed to integrate directly in the same optimized tiled matmul kernels without disrupting execution. 2/ We develop custom CUDA kernels that fuse multiple sparse matmuls to maximize throughput and compress TwELL to a hybrid representation that minimizes activation sizes. We used our kernels to train and benchmark sparse LLMs at billion-parameter scales, demonstrating >20% speedups and even higher savings in peak memory and energy. This work will be presented at #ICML2026. Please check out our blog and technical paper for a deep dive!

日本語
14
89
529
79.7K
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
4 月 20 日から 24 日までドイツで開催された Hannover Messe 2026 では、NVIDIA とパートナー企業が AI 駆動型製造の最前線を紹介。 来場者は、先進技術が産業イノベーションを支える様子を体感しました。 nvda.ws/3QwZBZ2
NVIDIA AI Japan tweet media
日本語
0
1
1
517
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
x.com/NVIDIARobotics… Physical AI Days が #NVIDIAGTC に帰ってきました✈今回は台北で開催です。 ロボティクスやインダストリアル AI から、デジタルツイン、シミュレーションまで~フィジカル AI に関する厳選セッションをご用意。nvda.ws/4ddVR6eアイデアを実世界での導入につなげるための内容です。
日本語
0
0
9
1K
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
AI 開発者必見👀 Nemotoron を軸とした NVIDIA オープンソース戦略と OpenClaw のリファレンススタックである「NemoClaw」を解説するライブストリーミング! AI 研究者 今井翔太氏 @ImAI_Eruel と東京エレクトロン @TokyoElectron_J と東京エレクトロン 西口賢弥氏が登壇します。 📅 5 月 13 日 (水) 10 時配信 スタート nvda.ws/4udnza9
日本語
0
0
3
910
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
気候変動対策や自然保護、災害モニタリング、リサイクルなど、さまざまな分野で NVIDIA の AI は地球を守る取り組みを支えています。 今回は NVIDIA の AI が地球を守る 5 つの方法をご紹介します。 nvda.ws/4ufb6CU
日本語
0
0
2
529
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
NVIDIA は、研究者や企業が実用的なアプリケーションを実行可能とする量子プロセッサ構築支援のための、世界初のオープンソース量子 AI モデルファミリー、NVIDIA Ising を発表しました。 nvda.ws/4dbTIIr
NVIDIA AI Japan tweet media
日本語
1
0
4
651
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
Nemotron 3 Nano Omni が、Nemotron Labs のライブ配信に登場します。 📅 日本時間 5 月 6 日: 開発者コミュニティは NVIDIA Nemotron 3 Nano Omni を使ってサブエージェントをどう構築しているのか addevent.com/event/rwnjn543…  📅 日本時間 5 月 13 日: エキスパートに聞く(Ask the Experts):Nemotron 3 Nano Omni addevent.com/event/3myyxpbk…  日程をカレンダーに登録して、当日お会いしましょう。
日本語
0
1
0
277
NVIDIA AI Japan
NVIDIA AI Japan@NVIDIAAIJP·
Nemotron 3 Nano Omni をご紹介します 👋 Nemotron ファミリーに加わった最新モデルは、 優れた精度を備えた、最高水準の効率性を実現するオープンなマルチモーダルモデルです。 パラメータ数は 300 億。コンテキスト長は 256 K。 スレッドで詳しく紹介します👇
日本語
1
1
3
817