Zdravím,
řeším následující problém. Dělám nějaké simulace, které spočívají v opakovaném volání jednoduché funkce. Problém je v tom, že každý výpočet potřebuje k průběhu výsledek minulého výpočtu. NEJDE TAK ŽÁDNÝM ZPŮSOBEM PARALELIZOVAT. Prosím berte toto jako fakt a dále to neřešte.
Stávající systém je Core2Duo E8400 @ 3.9GHz na kterém trvá jeden průběh cyklu cca 1,7s (cyklus běží až milionkrát, takže každá desetinka je velmi důležitá)
Nový systém, který potřebuji vyladit je Core i7 -950 @ 4.2GHz. Ten začínal na 2,5s / cyklus. Vypnul jsem HT, vitualizaci, speedstep, HW prefetch. Nechal jen puštěné jedno jádro a dostal se na 1,9s
Otázka: Napadají vás další optimalizace, které by snížily čas průběhu cyklu? Proč je na stejné frekvenci i7 pomalejší?
Díky za tipy a nápady