od satikcz 23. 2. 2017 09:56
AVX umožňujou načíst několik čísel najednou a provést se všema stejnou operaci za pomoci jedné instrukce, to se hodí třeba pro operace s maticema nebo vektorama, kdy chceš celej vektor vynásobit nějakým číslem.
256bit (AVX2) akorát znamená, že jich to umí 2x víc za jednu instrukci než 128bit - zpětně kompatibilní to není, když by se tam naprasila rovnou ta AVX2 instrukce, ale každej normální soft si zkontroluje, jestli tam AVX2 je a kdyžtak použije 128bit AVX nebo třeba SSE.
A bacha, ono to s těma instrukcema a jejich počtem cyklů není tak jednoduchý, instrukce maj obvykle i nějakou latency, takže třeba musíte několik cyklů počkat, než ji můžete použít znova apod., to má každá CPU architektura pro různý instrukce jinak.
Ohledně výkonu - u toho Blender Cycles přineslo AVX v první implementaci 3% výkonu navíc proti SSE, takže je otázka, jestli to má tak malej vliv nebo tam jen ty AVX instrukce nepoužili optimálně.
Určitě by to nemělo znamenat poloviční výkon
3x AOC AG271QG (2560x1440, IPS, 165Hz, GSync), ASUS Strix RTX3090 OC, Intel Core i7 8700K@5GHz+EKWB L360, ASUS Maximus X, 32GB G.SKILL TridentZ@3466 MHz, ADATA SX8200 2TB + 1TB + Crucial BX 500 GB + Kingston UV400 1TB, Seasonic P-860 Platinum, FD Define S