GitHub - jpnavarro-nv/cuda_training

Petrobras CUDA Training

DAY 1: Fundamental CUDA Optimization

Latency Hiding
- Thread and warp scheduling
- Launch configuration
Memory Hierarchy and Access Patterns
- Local storage, shared memory, and global memory
Understanding Bottlenecks
- Memory-bound vs compute-bound codes
- Extracting bandwidth
- Memory alignment
Assignment

DAY 2: Atomics, Reductions, Warp Shuffle

Atomics and Reductions
- Atomic operations
- Classical parallel reduction
- Parallel reduction + atomics
Warp Shuffle Techniques
- Warp-Level reduction
- Reduction with warp shuffle
Assignment

DAY 3: CUDA Concurrency

Pinned Memory
- Definition and benefits
- Usage and functions
- Implications for host memory
CUDA Streams
- Overview, purpose, and semantics
- Creation, Usage, and copy-compute overlap
- Stream behavior examples and default stream considerations
Multi-GPU Concurrency
- Device management
- Streams across multiple GPUs
- Device-to-device data copying
- Peer-to-peer transfers
Assignment

DAY 4: CUDA Performance Optimization

An alternate perspective on all delivered materials, using the GTC presentation as a baseline for CUDA performance optimization CUDA Performance Optimization.

DAY 5: Practical Advice, Example Codes Diving (Wave Propagators)

Nsight Systems & Nsight Compute

To proper open ".nsys-rep" files, please download the tool Nsight Systems [link]

Similarly, use Nsight Compute tool to open ".ncu-rep" files [link].

Name		Name	Last commit message	Last commit date
Latest commit History 76 Commits
1_fundamental_cuda_optimization		1_fundamental_cuda_optimization
2_atomics_reductions_warp		2_atomics_reductions_warp
3_concurrency		3_concurrency
4_performance_optimization_review		4_performance_optimization_review
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Petrobras CUDA Training

DAY 1: Fundamental CUDA Optimization

DAY 2: Atomics, Reductions, Warp Shuffle

DAY 3: CUDA Concurrency

DAY 4: CUDA Performance Optimization

DAY 5: Practical Advice, Example Codes Diving (Wave Propagators)

Nsight Systems & Nsight Compute

About

Releases

Packages

Contributors 2

Languages

jpnavarro-nv/cuda_training

Folders and files

Latest commit

History

Repository files navigation

Petrobras CUDA Training

DAY 1: Fundamental CUDA Optimization

DAY 2: Atomics, Reductions, Warp Shuffle

DAY 3: CUDA Concurrency

DAY 4: CUDA Performance Optimization

DAY 5: Practical Advice, Example Codes Diving (Wave Propagators)

Nsight Systems & Nsight Compute

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages