Petrobras CUDA Training

DAY 1: Fundamental CUDA Optimization

Latency Hiding
- Thread and warp scheduling
- Launch configuration
Memory Hierarchy and Access Patterns
- Local storage, shared memory, and global memory
Understanding Bottlenecks
- Memory-bound vs compute-bound codes
- Extracting bandwidth
- Memory alignment
Assignment

DAY 2: Atomics, Reductions, Warp Shuffle

Atomics and Reductions
- Atomic operations
- Classical parallel reduction
- Parallel reduction + atomics
Warp Shuffle Techniques
- Warp-Level reduction
- Reduction with warp shuffle
Assignment

DAY 3: CUDA Concurrency

Pinned Memory
- Definition and benefits
- Usage and functions
- Implications for host memory
CUDA Streams
- Overview, purpose, and semantics
- Creation, Usage, and copy-compute overlap
- Stream behavior examples and default stream considerations
Multi-GPU Concurrency
- Device management
- Streams across multiple GPUs
- Device-to-device data copying
- Peer-to-peer transfers
Assignment

DAY 4: CUDA Performance Optimization

An alternate perspective on all delivered materials, using the GTC presentation as a baseline for CUDA performance optimization CUDA Performance Optimization.

DAY 5: Practical Advice, Example Codes Diving (Wave Propagators)

Nsight Systems & Nsight Compute

To proper open ".nsys-rep" files, please download the tool Nsight Systems [link]

Similarly, use Nsight Compute tool to open ".ncu-rep" files [link].

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Petrobras CUDA Training

DAY 1: Fundamental CUDA Optimization

DAY 2: Atomics, Reductions, Warp Shuffle

DAY 3: CUDA Concurrency

DAY 4: CUDA Performance Optimization

DAY 5: Practical Advice, Example Codes Diving (Wave Propagators)

Nsight Systems & Nsight Compute

Files

README.md

Latest commit

History

README.md

File metadata and controls

Petrobras CUDA Training

DAY 1: Fundamental CUDA Optimization

DAY 2: Atomics, Reductions, Warp Shuffle

DAY 3: CUDA Concurrency

DAY 4: CUDA Performance Optimization

DAY 5: Practical Advice, Example Codes Diving (Wave Propagators)

Nsight Systems & Nsight Compute