Постінкремент швидший за преінкремент?

1 Тема від Naomi 20.10.2020 21:36:00

Naomi
Новий користувач
Поза форумом

Дата реєстрації: 10.09.2020
Повідомлень: 9

: 1

Тема: Постінкремент швидший за преінкремент?

Цікаво було перевірити що ж швидше.
В результаті замірів швидкості компайлер Clang видав цікаві графіки.
Де постінкрмент був в біль ніж 5 разів швидшим за преінкремент.
Як думаєте, це бага компайлера чи GoogleBench'а?

2 Відповідь від wander 20.10.2020 22:43:27

wander
Replace Team
Поза форумом

Звідки: No-man's land
Дата реєстрації: 28.02.2019
Повідомлень: 1 356

Репутація

: 1285

Re: Постінкремент швидший за преінкремент?

Якщо натиснути "Open in Compiler Explorer" (перехід на Godbolt), то вилазить такий код для тестових циклів цих двох варіантів:

.LBB0_3:                                # =>This Inner Loop Header: Depth=1
        add     qword ptr [rsp + 8], 1
        add     rbx, -1
        jne     .LBB0_3

.LBB1_3:                                # =>This Inner Loop Header: Depth=1
        lea     rcx, [rax + 1]
        mov     rax, rcx
        cmp     rbx, rcx
        jne     .LBB1_3

Як бачите, в першому випадку компілятор наполіг на тому, щоб зберегти x як фізично існуючу змінну в пам'яті. А в другому випадку представив її регістром. Звідси й різниця в продуктивності. Я б припустив, що це наслідок того, що результат преінкремента в С++ є lvalue. І цей тестбенч з якоїсь причини наполягає на тому, щоб зберегти lvalue-ність результату. Швидше за все це навіть фіча, тобто документована властивість benchmark::DoNotOptimize, про яку потрібно пам'ятати.

Якщо в першому випадку "допомогти" компілятору зрозуміти, що нам нафіг не потрібна lvalue-ність результату ++x, наприклад за допомогою явного приведення типу

benchmark::DoNotOptimize(std::size_t{++x});

, то результати виходять набагато рівніші за продуктивністю.

Подякували: Arete, koala, Naomi3

3 Відповідь від koala 20.10.2020 23:01:28

koala
Лінива тваринка
Поза форумом

Дата реєстрації: 01.05.2013
Повідомлень: 15 820

Репутація

: 13485

Re: Постінкремент швидший за преінкремент?

Так перевіряти ж треба розумно.
benchmark::DoNotOptimize, як я розумію, просто фіксує змінну, щоб оптимізатор її не викинув. А оскільки там параметром іде не змінна, а результат оператора, наслідки дещо неочікувані.
Ось тест, що показує, що вони однакові.
Ну і найголовніше: безглуздо казати про "швидше взагалі", треба дивитися конкретні ситуації. Конкретно в першій ситуації швидший постінкремент, так склалося. Без оптимізації (-O0), гадаю, швидшим буде преінкремент.

Глянув асемблер - щось оптимізатор LLVM себе переграв. Постінкремент виглядає так:

       %lea    0x1(%rax),%rcx
       mov    %rcx,%rax
       cmp    %rcx,%rbx
       jne    211740 <PostInc(benchmark::State&)+0x20>

а преінкремент

       addq   $0x1,0x8(%rsp)
       add    $0xffffffffffffffff,%rbx
       jne    211700 <PreInc(benchmark::State&)+0x40>

Схоже, що тут в преінкременті LLVM намагається записувати стан змінної у пам'ять, чому й гальмує.

koala вебсайт

Ласкаво просимо!

Повідомлення: 3

1 Тема від Naomi 20.10.2020 21:36:00

Тема: Постінкремент швидший за преінкремент?

2 Відповідь від wander 20.10.2020 22:43:27

Re: Постінкремент швидший за преінкремент?

3 Відповідь від koala 20.10.2020 23:01:28

Re: Постінкремент швидший за преінкремент?

Повідомлення: 3

Переглядають тему: 1 гість, 0 користувачів