@@ -129,14 +129,14 @@ jobs:
129
129
--goldentime-tolerance-multiplier 1.3 \
130
130
--goldentime-rocm-e2e-ms 1100.0 \
131
131
--goldentime-rocm-unet-ms 255.0 \
132
- --goldentime-rocm-clip-ms 14.5 \
133
- --goldentime-rocm-vae-ms 310 .0 \
134
- --goldendispatch-rocm-unet 1236 \
135
- --goldendispatch-rocm-clip 967 \
136
- --goldendispatch-rocm-vae 208 \
137
- --goldensize-rocm-unet-bytes 2280000 \
138
- --goldensize-rocm-clip-bytes 860000 \
139
- --goldensize-rocm-vae-bytes 840000 \
132
+ --goldentime-rocm-clip-ms 12.0 \
133
+ --goldentime-rocm-vae-ms 260 .0 \
134
+ --goldendispatch-rocm-unet 1220 \
135
+ --goldendispatch-rocm-clip 794 \
136
+ --goldendispatch-rocm-vae 176 \
137
+ --goldensize-rocm-unet-bytes 1370000 \
138
+ --goldensize-rocm-clip-bytes 460000 \
139
+ --goldensize-rocm-vae-bytes 430000 \
140
140
--rocm-chip gfx90a \
141
141
--timeout=600 \
142
142
--log-cli-level=info \
@@ -152,22 +152,22 @@ jobs:
152
152
source ${VENV_DIR}/bin/activate
153
153
pytest ./experimental/benchmarks/sdxl/benchmark_sdxl_rocm.py \
154
154
--goldentime-tolerance-multiplier 1.1 \
155
- --goldentime-rocm-e2e-ms 325 .0 \
156
- --goldentime-rocm-unet-ms 80 .0 \
157
- --goldentime-rocm-clip-ms 15 .0 \
158
- --goldentime-rocm-vae-ms 75 .0 \
159
- --goldendispatch-rocm-unet 1236 \
160
- --goldendispatch-rocm-clip 967 \
161
- --goldendispatch-rocm-vae 208 \
162
- --goldensize-rocm-unet-bytes 2270000 \
163
- --goldensize-rocm-clip-bytes 860000 \
164
- --goldensize-rocm-vae-bytes 840000 \
165
- --goldentime-rocm-punet-int8-fp16-ms 50 .0 \
166
- --goldentime-rocm-punet-int8-fp8-ms 52 .0 \
167
- --goldendispatch-rocm-punet-int8-fp16 1419 \
168
- --goldendispatch-rocm-punet-int8-fp8 1699 \
169
- --goldensize-rocm-punet-int8-fp8-bytes 2800000 \
170
- --goldensize-rocm-punet-int8-fp16-bytes 2560000 \
155
+ --goldentime-rocm-e2e-ms 305 .0 \
156
+ --goldentime-rocm-unet-ms 78 .0 \
157
+ --goldentime-rocm-clip-ms 9 .0 \
158
+ --goldentime-rocm-vae-ms 62 .0 \
159
+ --goldendispatch-rocm-unet 1220 \
160
+ --goldendispatch-rocm-clip 794 \
161
+ --goldendispatch-rocm-vae 176 \
162
+ --goldensize-rocm-unet-bytes 1400000 \
163
+ --goldensize-rocm-clip-bytes 460000 \
164
+ --goldensize-rocm-vae-bytes 430000 \
165
+ --goldentime-rocm-punet-int8-fp16-ms 45 .0 \
166
+ --goldentime-rocm-punet-int8-fp8-ms 46 .0 \
167
+ --goldendispatch-rocm-punet-int8-fp16 1415 \
168
+ --goldendispatch-rocm-punet-int8-fp8 1695 \
169
+ --goldensize-rocm-punet-int8-fp8-bytes 2200000 \
170
+ --goldensize-rocm-punet-int8-fp16-bytes 2000000 \
171
171
--rocm-chip gfx942 \
172
172
--log-cli-level=info \
173
173
--timeout=600 \
@@ -181,22 +181,22 @@ jobs:
181
181
source ${VENV_DIR}/bin/activate
182
182
pytest ./experimental/benchmarks/sdxl/benchmark_sdxl_rocm.py \
183
183
--goldentime-tolerance-multiplier 1.1 \
184
- --goldentime-rocm-e2e-ms 800 .0 \
185
- --goldentime-rocm-unet-ms 195 .0 \
186
- --goldentime-rocm-clip-ms 15 .0 \
187
- --goldentime-rocm-vae-ms 190 .0 \
188
- --goldendispatch-rocm-unet 1236 \
189
- --goldendispatch-rocm-clip 967 \
190
- --goldendispatch-rocm-vae 208 \
191
- --goldensize-rocm-unet-bytes 2270000 \
192
- --goldensize-rocm-clip-bytes 860000 \
193
- --goldensize-rocm-vae-bytes 840000 \
194
- --goldentime-rocm-punet-int8-fp16-ms 140 .0 \
195
- --goldentime-rocm-punet-int8-fp8-ms 150 \
196
- --goldendispatch-rocm-punet-int8-fp16 1419 \
197
- --goldendispatch-rocm-punet-int8-fp8 1699 \
198
- --goldensize-rocm-punet-int8-fp8-bytes 2800000 \
199
- --goldensize-rocm-punet-int8-fp16-bytes 2560000 \
184
+ --goldentime-rocm-e2e-ms 740 .0 \
185
+ --goldentime-rocm-unet-ms 191 .0 \
186
+ --goldentime-rocm-clip-ms 12 .0 \
187
+ --goldentime-rocm-vae-ms 146 .0 \
188
+ --goldendispatch-rocm-unet 1220 \
189
+ --goldendispatch-rocm-clip 794 \
190
+ --goldendispatch-rocm-vae 176 \
191
+ --goldensize-rocm-unet-bytes 1400000 \
192
+ --goldensize-rocm-clip-bytes 460000 \
193
+ --goldensize-rocm-vae-bytes 430000 \
194
+ --goldentime-rocm-punet-int8-fp16-ms 115 .0 \
195
+ --goldentime-rocm-punet-int8-fp8-ms 115.0 \
196
+ --goldendispatch-rocm-punet-int8-fp16 1415 \
197
+ --goldendispatch-rocm-punet-int8-fp8 1695 \
198
+ --goldensize-rocm-punet-int8-fp8-bytes 2200000 \
199
+ --goldensize-rocm-punet-int8-fp16-bytes 2000000 \
200
200
--rocm-chip gfx942 \
201
201
--log-cli-level=info \
202
202
--timeout=600 \
0 commit comments