`unique` vectorization #5092

AlexGuteniev · 2024-11-16T20:59:33Z

Not really unique, modelled on #4987

⏬ Double load

To compare adjacent values, the same memory is loaded twice with an element shift.

It is possible to reuse the previous vector part, and mix it with the current, to save one load, but have some extra instructions to mix values, and a loop-carried dependency. On SSE path it is possible with _mm_alignr_epi8 (except for 8-bit elements). For AVX it would be way more complex due to AVX lanes.

Benchmarking shows that double load is faster than any reuse attempt. To some extent such a result overlaps with #4958

⏱️ Benchmark results

Benchmark	main	this
u<alg_type::std_fn, std::uint8_t>	1166 ns	190 ns
u<alg_type::std_fn, std::uint16_t>	1222 ns	247 ns
u<alg_type::std_fn, std::uint32_t>	1555 ns	310 ns
u<alg_type::std_fn, std::uint64_t>	1470 ns	665 ns
u<alg_type::rng, std::uint8_t>	1230 ns	187 ns
u<alg_type::rng, std::uint16_t>	1204 ns	233 ns
u<alg_type::rng, std::uint32_t>	1268 ns	308 ns
u<alg_type::rng, std::uint64_t>	1505 ns	665 ns

stl/inc/algorithm

Less error prone, especially if implementing _copy someday

CaseyCarter · 2024-11-17T03:06:25Z

Not really unique, modelled on #4987

🤦

unique vectorization

cffb1e7

AlexGuteniev requested a review from a team as a code owner November 16, 2024 20:59

StephanTLavavej added the performance Must go faster label Nov 16, 2024

StephanTLavavej self-assigned this Nov 16, 2024

StephanTLavavej reviewed Nov 16, 2024

View reviewed changes

stl/inc/algorithm Outdated Show resolved Hide resolved

stl/inc/algorithm Outdated Show resolved Hide resolved

AlexGuteniev added 3 commits November 16, 2024 23:18

no point

a0b714d

Not unique problem

cccf693

Pointed out coverage

54781db

AlexGuteniev requested a review from StephanTLavavej November 16, 2024 21:42

Deduplicate

fa4ff20

Less error prone, especially if implementing _copy someday

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

`unique` vectorization #5092

`unique` vectorization #5092

AlexGuteniev commented Nov 16, 2024

CaseyCarter commented Nov 17, 2024

unique vectorization #5092

Are you sure you want to change the base?

unique vectorization #5092

Conversation

AlexGuteniev commented Nov 16, 2024

⏬ Double load

⏱️ Benchmark results

CaseyCarter commented Nov 17, 2024

`unique` vectorization #5092

`unique` vectorization #5092