Noi instrucțiuni sse4.2

În noua microarhitectură Nehalem, Intel și-a continuat cursul anterior de creștere a numărului de instrucțiuni SIMD acceptate. Setul de instrucțiuni actualizat a fost extins cu șapte instrucțiuni noi și a fost numit SSE4.2 (denumirea SSE4.1 a fost folosită pentru sistemul de instrucțiuni SIMD al procesoarelor Penryn). În același timp, Intel atrage în mod special atenția asupra faptului că instrucțiunile introduse în setul SSE4.2 sunt concentrate nu atât pe accelerarea procesării conținutului media în flux, cât pe alte obiective. De aceea, noile instrucțiuni introduse în Nehalem au primit și simbolul ATA (Application Targeted Accelerators). Conceptul ATA este prezentat în așa fel încât procesele tehnologice moderne fac posibilă utilizarea unei părți a tranzistorilor procesorului nu numai pentru blocuri funcționale universale, ci și pentru nevoi specifice, crescând viteza sarcinilor specifice. Deci, în conformitate cu acest concept, SSE4.2 a adăugat cinci instrucțiuni menite să accelereze parsarea fișierelor XML. De asemenea, folosind aceleași instrucțiuni, este posibilă creșterea vitezei de procesare a șirurilor și a textelor. Încă două instrucțiuni noi din setul SSE4.2 vizează aplicații complet diferite. Primul, CRC32, acumulează suma de control CRC32c, iar al doilea, POPCNT, numără numărul de biți non-zero din sursă. Aceste comenzi pot fi, de asemenea, utilizate pe scară largă în diverse aplicații și aplicații de rețea.

Controler de memorie integrat

Nehalem a fost prima microarhitectură Intel care a integrat un controler de memorie în interiorul procesorului. S-ar părea că aici inginerii Intel au împrumutat ideea colegilor lor de la AMD, care au încorporat un controler de memorie în procesoare încă din 2003. Cu toate acestea, acest lucru nu este în întregime adevărat, deoarece primele procesoare cu un controler de memorie integrat trebuiau să fie Intel Timna, care nu a fost lansat niciodată, la care sa lucrat activ în 1999. În plus, ar trebui respinse și acuzațiile de plagiat, deoarece controlerul de memorie dezvoltat de Intel pentru Nehalem este foarte diferit de controlerul folosit la procesoarele AMD existente. Abordarea Intel asupra problemei s-a dovedit a fi mult mai ambițioasă. Principala proprietate a controlerului de memorie a procesorului Nehalem este flexibilitatea acestuia. Având în vedere designul modular al întregii familii promițătoare de procesoare, care poate conține produse care diferă foarte mult în ceea ce privește caracteristicile și poziționarea pe piață, Intel a oferit capacitatea nu numai de a activa sau dezactiva suportul pentru modulele tamponate, ci și de a varia numărul de canale și memorie. viteză. În același timp, primele procesoare cu microarhitectura Nehalem, care vor fi lansate într-o versiune quad-core, vor primi un controler de memorie cu trei canale cu suport pentru DDR3 SDRAM. Astfel, sistemele desktop construite pe procesoare noi se vor putea lăuda cu o lățime de bandă de neegalat a subsistemului de memorie, care în cazul utilizării a trei module DDR3-1067 va ajunge la 25,6 GB/s. Cu toate acestea, principalul avantaj al mutării controlerului DRAM la procesor nu este atât creșterea lățime de bandă cât de mult în reducerea latenței subsistemului de memorie. În ciuda faptului că Intel sugerează utilizarea memoriei DDR3 cu latență relativ mare cu noile procesoare, latențele de acces la memorie ale lui Nehalem vor fi în orice caz mai mici decât în ​​sistemele bazate pe procesoare Core 2 care utilizează DDR3 SDRAM (și, cel mai probabil, DDR2 SDRAM). Pentru a confirma aceste cuvinte, aș dori să citez datele obținute prin măsurarea parametrilor practici ai subsistemului de memorie al unui sistem bazat pe Nehalem în utilitarul de testare Everest 4.60.

Tabelul 2. Testarea performanței memoriei

De fapt, chiar și funcționând în modul cu un singur canal, controlerul de memorie Nehalem este capabil să arate performanțe mai bune decât controlerul de memorie al platformelor LGA775 de astăzi. Acesta este un rezultat complet natural, deoarece nu există dispozitive intermediare pe drumul dintre procesor și memorie în sistemele de nouă generație - în timp ce mai devreme podul de nord al chipset-ului era responsabil pentru lucrul cu memoria, care a introdus propriile întârzieri foarte semnificative cauzate de necesitatea de a sincroniza magistralele de memorie si FSB . Un alt avantaj indirect al memoriei încorporate în procesor este că funcționarea sa este acum independentă fie de chipset, fie de placa de bază. Drept urmare, Nehalem va arăta aceleași performanțe de memorie atunci când rulează pe platforme de la diferiți dezvoltatori și producători.

În urmă cu câteva luni, AMD a introdus o nouă arhitectură care va fi utilizată în noile procesoare începând cu 2011. Noua arhitectură se numește Bulldozer și este complet diferită de arhitectura actuală AMD64 pe care AMD o folosește din 2003.

Arhitectura Bulldozer va moșteni unele dintre soluțiile tehnologice introduse cu arhitectura AMD64, cum ar fi: controler de memorie integrat și utilizarea magistralei HyperTransport pentru comunicarea dintre procesor și chipset.

Buldozer este un nume de cod de arhitectură, nu un nume specific de procesor. Așa cum se întâmplă de obicei, prima lansare a procesoarelor va fi vizată pe piața de servere, urmată de o lansare pentru piața de PC-uri high-end, apoi pentru segmentul de preț mediu și, în sfârșit, pentru piața la nivel de buget.

Deși AMD nu a dezvăluit caracteristicile noilor procesoare, au remarcat că primele procesoare pentru calculator desktop, va fi executat pe noul socket AM3+, care va fi compatibil cu priza AM3 existentă. Cu toate acestea, Socket AM3+ nu va fi compatibil cu plăci de bază pentru priza AM3.

Arhitectura Bulldozer va avea o tehnologie similară cu Turbo Boost de la Intel, permițând overclockarea automată a procesorului.
Înainte de a vorbi despre arhitectura internă a lui Bulldozer, să aruncăm o privire la setul de instrucțiuni susținut de noua arhitectură.

Arhitectura Bulldozer, pe lângă faptul că este compatibilă cu standardul de instrucțiuni x86, va suporta următoarele seturi de instrucțiuni suplimentare:

  • SSE4.1 și SSE4.2
  • AVX (Advanced Vector Extensions) cu două instrucțiuni suplimentare XOP și FMA4
  • AES (Advanced Encryption Standard) - standard avansat de criptare
  • LWP (Profilarea cu greutate redusă)

SSE4.1 și SSE4.2

In cele din urma procesoare AMD va suporta setul de instrucțiuni SSE4. Procesoarele AMD nu acceptă în prezent acest set de instrucțiuni, care îmbunătățește performanța în aplicațiile multimedia (cum ar fi aplicațiile de procesare a imaginilor și video). Pe acest moment Procesoarele AMD acceptă propriul set de instrucțiuni numit SSE4a, care nu este același cu SSE4.

AVX (extensii vectoriale avansate)

La un moment dat, AMD a sugerat utilizarea noului set de instrucțiuni SSE5. De aceea Intel a decis să-și creeze propriul implementare proprie ceea ce s-a numit SSE5 și a numit această instrucțiune - AVX (Advanced Vector Extensions). AMD a decis să adauge acest set de instrucțiuni la arhitectura Bulldozer.

Instrucțiunile AVX vor fi susținute și de noile procesoare Intel Sandy Bridge.

Setul de instrucțiuni AVX adaugă 12 instrucțiuni noi și mărește dimensiunea registrelor XMM de la 128 de biți la 256 de biți.

În arhitectura Bulldozer, AMD a decis să folosească unele dintre instrucțiunile care au fost propuse pentru SSE5. Astfel, utilizarea AVX în arhitectura Bulldozer este mai completă decât cea a Intel. Aceste instrucțiuni suplimentare se numesc XOP și FMA4. AMD a remarcat, de asemenea, că AVX are un subgrup de instrucțiuni FMAC (Fused Multiply Accumulate), dar, de fapt, face parte din setul de instrucțiuni XOP.

AES (Standard de criptare avansat)

Acest set de comenzi este deja folosit în new procesoare Intel, bazat pe arhitectura „Westmere” (cu excepția Core i3) și constă din șase instrucțiuni noi legate de criptare. Intel numește acest set de instrucțiuni AES-NI.

LWP (Profilarea cu greutate redusă)

Instrucțiunile LWP vor îmbunătăți performanța multi-threaded software lucrând la procesoare multi-core. LWP include șase instrucțiuni noi.

Adesea, software-ul sau jocurile moderne necesită ca procesorul să aibă instrucțiuni SSE 4.1 - 4.2. Dacă nu există, fugi aplicatia dorita nu merge, se aruncă o eroare sau nu se întâmplă nimic.

FarCry 5 se plânge de lipsa SSE 4.2

În același timp, puterea procesorului poate fi suficientă pentru un joc mai mult sau mai puțin confortabil (de exemplu, unele procesoare Xeon pentru socket 775 sunt încă capabile să ofere FPS decente în produse noi), iar cerința instrucțiunilor este uneori necesară nu chiar și pentru jocul în sine, dar pentru protecția împotriva copiei de lucru. De exemplu, protecția Denuvo nu le permitea proprietarilor de procesoare vechi să joace Assassin's Creed Origins, deși jocul în sine nu necesita cele mai recente instrucțiuni.

Alte jocuri populare sau componentele lor necesită, de asemenea, SSE 4.1 sau 4.2: No Man Sky, Far Cry 5, Dishonored 2, Mafia 3 și altele.

Cu toate acestea, există o soluție, deși succesul nu este garantat 100%. Pentru a rula aplicația dorită, puteți utiliza emulatorul sde extern, care poate fi descărcat din link (alegeți versiunea pentru Windows) sau în partea de jos a acestui articol.

Cum se utilizează emulatorul SSE 4.1-4.2

  • Descărcați arhiva din sde extern și despachetați-o astfel încât sde.exe să fie în folderul cu jocul sau programul dorit
  • Creați o comandă rapidă pentru sde.exe. Apoi deschidem proprietățile comenzii rapide și adăugăm obiectul în parametru - fișierul .exe dorit. De exemplu: D:\Games\No Man's Sky\Binaries\sde.exe" - NMS.exe. Trebuie să existe un spațiu după ultimul citat, altfel sistemul nu vă va permite să salvați comanda rapidă.
  • De asemenea, în proprietățile comenzii rapide din fila „Compatibilitate”, ar trebui să puneți opțiunea „Executați ca administrator”.
  • Salvați comanda rapidă și rulați-o. Apare o fereastră neagră, o puteți închide. După un timp, aplicația dorită ar trebui să înceapă.