[ Docs ] Overhaul `accelerate` user guide #76

robertgshaw2-neuralmagic · 2024-08-11T20:00:40Z

SUMMARY:

update accelerate examples with README
update accelerate cpu offloading example to use fp8 + be consistent with other examples
update accelerate calibration example to highlight multi-gpu setup

TEST PLAN:

manually running examples

examples/big_model_offloading/big_model_w8a8_calibrate.py

examples/big_model_offloading/big_model_fp8.py

examples/big_models_with_accelerate/README.md

README.md

Allow any future versions of transformers since we are just using it for `AutoConfig` at the moment and would like to support new models.

robertgshaw2-neuralmagic added 5 commits August 11, 2024 17:36

update for fp8 dyanmic

e8227e5

Merge branch 'main' of https://github.com/vllm-project/llm-compressor

4243c8f

stash

a0817a8

updated accelerate examples

0b6fd0f

updated big model examples

b4c60a8

robertgshaw2-neuralmagic changed the title ~~Switch big model example~~ [ DOCS ] Overhaul big-model user guide Aug 11, 2024

robertgshaw2-neuralmagic commented Aug 11, 2024

View reviewed changes

examples/big_model_offloading/big_model_w8a8_calibrate.py Show resolved Hide resolved

robertgshaw2-neuralmagic commented Aug 11, 2024

View reviewed changes

examples/big_model_offloading/big_model_fp8.py Show resolved Hide resolved

robertgshaw2-neuralmagic added 22 commits August 11, 2024 20:03

revert fp8 changes

7ac50dc

style and quality

538610a

fix main README

2a0c245

anothger nit

bfd64eb

remove unnessary changes

b78a0e7

remove spurious changes

94c4415

anoter silly change

1edb96a

udpate

8f6a39d

tweak language

977d7f6

cleanup

b6f41d3

adjust title

82644d2

cleanup example more

f450c52

cleanup readme more

25a9475

cleanup

80333bd

update

1558c24

update

f0ada4f

update

f89ccaf

final cleanup

ad27b4e

update doc

4ad73e9

update

e636000

further cleanup

a82e910

typo

290d984

robertgshaw2-neuralmagic added 7 commits August 11, 2024 21:02

cleanup

3cac6a2

make example inline

d1e702a

more cleanup

130d11a

more nits

6adec54

update

544ab37

update examples

92bca06

update

66ca93a

robertgshaw2-neuralmagic changed the title ~~[ DOCS ] Overhaul big-model user guide~~ [ DOCS ] Overhaul accelerate user guide Aug 11, 2024

robertgshaw2-neuralmagic changed the title ~~[ DOCS ] Overhaul accelerate user guide~~ [ Docs ] Overhaul accelerate user guide Aug 11, 2024

tweak int8 example to make it run

5930f90

Satrat suggested changes Aug 12, 2024

View reviewed changes

examples/big_models_with_accelerate/README.md Outdated Show resolved Hide resolved

examples/big_models_with_accelerate/README.md Show resolved Hide resolved

update big model wording

7b31b06

Satrat self-requested a review August 14, 2024 20:57

Satrat approved these changes Aug 14, 2024

View reviewed changes

Merge branch 'main' into switch-big-model-example

24ce02e

robertgshaw2-neuralmagic commented Aug 14, 2024

View reviewed changes

README.md Outdated Show resolved Hide resolved

Sara Adkins added 2 commits August 14, 2024 21:03

fix repeat in README

8f220e4

revert readme to main

a9ffcae

robertgshaw2-neuralmagic merged commit d1d3d23 into main Aug 14, 2024
7 of 12 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[ Docs ] Overhaul `accelerate` user guide #76

[ Docs ] Overhaul `accelerate` user guide #76

robertgshaw2-neuralmagic commented Aug 11, 2024

[ Docs ] Overhaul accelerate user guide #76

[ Docs ] Overhaul accelerate user guide #76

Conversation

robertgshaw2-neuralmagic commented Aug 11, 2024

[ Docs ] Overhaul `accelerate` user guide #76

[ Docs ] Overhaul `accelerate` user guide #76