Add keccak::f1600x{2,4,8} #4

bwesterb · 2019-07-11T12:53:51Z

I'm working Rust implementations of hash-based signature schemes. For them it would be great to have parallel (x2, x4, x8) versions of f1600.

This simple PR adds such parallel versions using packed_simd.

On my old Haswell I see

test f1600         ... bench:         425 ns/iter (+/- 25)
test simd::f1600x2 ... bench:         648 ns/iter (+/- 13)
test simd::f1600x4 ... bench:         647 ns/iter (+/- 72)
test simd::f1600x8 ... bench:       1,635 ns/iter (+/- 12)

So f1600x4 takes 161ns for a single f1600, which makes it 2.6x faster than four f1600s.

Some notes

packed_simd is still only available for nightly, so I've put these vectorized functions behind a feature gate.
The f1600xn functions are created by a macro. We could instead create a trait for all operations we use on u64xn (and even u64) and make f1600x2, ... f1600x8 and f1600 instances of a _f1600<T>.

dsprenkels · 2019-07-11T13:46:53Z

On a coffeelake laptop (aang):

test f1600         ... bench:         318 ns/iter (+/- 8)
test simd::f1600x2 ... bench:         440 ns/iter (+/- 1)
test simd::f1600x4 ... bench:         457 ns/iter (+/- 143)
test simd::f1600x8 ... bench:       1,045 ns/iter (+/- 29)

On a skylake-AVX512 host (lilo6):

test f1600         ... bench:       1,052 ns/iter (+/- 14)
test simd::f1600x2 ... bench:         761 ns/iter (+/- 3)
test simd::f1600x4 ... bench:         802 ns/iter (+/- 44)
test simd::f1600x8 ... bench:       1,122 ns/iter (+/- 5)

newpavlov · 2019-07-25T10:39:27Z

Sorry for the late reply! I will try to review this PR in near future. Meanwhile can you add test vectors for the added functions?

bwesterb · 2019-07-25T13:22:14Z

I've added tests.

bwesterb · 2020-05-07T10:06:42Z

Have you taken a look?

tarcieri · 2022-05-24T21:17:03Z

Obsoleted by #8

Add keccak::f1600x{2,4,8}

b89b5c3

bwesterb force-pushed the master branch from 6d50611 to b89b5c3 Compare July 25, 2019 13:21

aewag mentioned this pull request May 24, 2022

Add f1600x{2, 4, 8} #8

Merged

tarcieri closed this May 24, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add keccak::f1600x{2,4,8} #4

Add keccak::f1600x{2,4,8} #4

bwesterb commented Jul 11, 2019 •

edited

Loading

dsprenkels commented Jul 11, 2019 •

edited

Loading

newpavlov commented Jul 25, 2019

bwesterb commented Jul 25, 2019

bwesterb commented May 7, 2020

tarcieri commented May 24, 2022

Add keccak::f1600x{2,4,8} #4

Add keccak::f1600x{2,4,8} #4

Conversation

bwesterb commented Jul 11, 2019 • edited Loading

dsprenkels commented Jul 11, 2019 • edited Loading

newpavlov commented Jul 25, 2019

bwesterb commented Jul 25, 2019

bwesterb commented May 7, 2020

tarcieri commented May 24, 2022

bwesterb commented Jul 11, 2019 •

edited

Loading

dsprenkels commented Jul 11, 2019 •

edited

Loading