HGPU group

10.7K posts

HGPU group

@hgpu

High performance computing on graphics processing units (GPU): AMD/ATI, nVidia, Intel Xeon Phi, CUDA, OpenCL, OpenGL, GPGPU, HPC

Katılım Mayıs 2011

119 Takip Edilen3.9K Takipçiler

HGPU group@hgpu·13 Tem

Enhancing the Performance Analysis of NCCL GPU Collectives #CUDA #Performance #Thesis hgpu.org/?p=30999

English

547

HGPU group@hgpu·13 Tem

Real FP4 Tensor-Core Code in Pure Rust on a Gaming GPU – with NVIDIA’s Own Compiler #CUDA #PTX #Rust hgpu.org/?p=30998

English

968

HGPU group@hgpu·13 Tem

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization #CodeGeneration #Package hgpu.org/?p=30997

English

236

HGPU group@hgpu·13 Tem

Augmenting LLM Code Translation with Compiler Analysis for C to Triton Kernel Generation #Triton #CUDA #LLM hgpu.org/?p=30996

English

209

HGPU group@hgpu·13 Tem

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries #CUDA #LLM #Package hgpu.org/?p=30995

English

300

HGPU group@hgpu·28 Haz

Optimizing CUDA like a Human: Micro-Profiling Tools as Expert Surrogates for LLM-Based GPU Kernel Optimization #CUDA #Triton #LLM #CodeGeneration hgpu.org/?p=30933

English

5.8K

HGPU group@hgpu·28 Haz

SpecGen: Accelerating Agentic Kernel Optimization with Speculative Generation #CUDA #CodeGeneration #LLM hgpu.org/?p=30932

English

1.6K

HGPU group@hgpu·28 Haz

The Correctness Illusion in LLM-Generated GPU Kernels #Triton #CUDA #CodeGeneration #LLM hgpu.org/?p=30931

English

1.9K

HGPU group@hgpu·28 Haz

Probe-and-Refine Tuning of Repository Guidance for Coding Agents #LLM #CodeGeneration #Package hgpu.org/?p=30930

English

1.1K

HGPU group@hgpu·28 Haz

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning #LLM #CodeGeneration #Package hgpu.org/?p=30934

English

1.5K

HGPU group@hgpu·17 Haz

daVinci-kernel: Co-Evolving Skill Selection, Summarization, and Utilization via RL for GPU Kernel Optimization #Triton #CUDA #LLM hgpu.org/?p=30881

English

1.2K

HGPU group@hgpu·17 Haz

Fearless Concurrency on the GPU #CUDA #Rust #Performance hgpu.org/?p=30880

English

329

HGPU group@hgpu·17 Haz

Tangram: Hiding GPU Heterogeneity for Efficient LLM Parallelization #GPUcluster #LLM #Performance hgpu.org/?p=30879

Filipino

381

HGPU group@hgpu·17 Haz

From Tokens to Regions: CUDA-Sensitive Instruction Tuning for GPU Kernel Generation #CUDA #LLM hgpu.org/?p=30878

English

277

HGPU group@hgpu·17 Haz

Leveraging AI Ecosystem for Portable and Sustainable GPU Kernels in HPC #Triton #ROCm #DSL #HPC hgpu.org/?p=30877

English

294

HGPU group@hgpu·8 Haz

Towards Feedback-to-Plan Decisions for Self-Evolving LLM Agents in CUDA Kernel Generation #CUDA #PTX #LLM #Package hgpu.org/?p=30834

English

826

HGPU group@hgpu·8 Haz

CodegenBench: Can LLMs Write Efficient Code Across Architectures? #CUDA #LLM #HPC #Package hgpu.org/?p=30833

English

1.2K

HGPU group@hgpu·8 Haz

KForge: LLM-Driven Cross-Platform Kernel Generation for AI Accelerators #CUDA #PTX #Triton #LLM #CodeGeneration #Intel hgpu.org/?p=30832

Dansk

765

HGPU group@hgpu·8 Haz

MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore Threads GPU #CUDA #LLM hgpu.org/?p=30831

English

2.2K

HGPU group@hgpu·8 Haz

Autonomous heterogeneous catalyst discovery with a self-evolving multi-agent digital twin #Chemistry #LLM hgpu.org/?p=30830

English

231

Keşfet

@elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA @nikifrancismediavine @katyperry