Porównanie Broadwella z haswellem. Uwaga redaktora: Dlaczego nowe procesory Intel Broadwell i Skylake do komputerów stacjonarnych nie będą zauważalnie szybsze niż Haswell. Kiedy wychodzi Broadwell?


Od 2013 roku nie było żadnej większej aktualizacji w gamie procesorów Intel do komputerów stacjonarnych. Tak, Haswell-E został wydany w 2014 roku z obsługą DDR4, ale w rzeczywistości oprócz zwiększonej liczby rdzeni i nieco zaktualizowana platforma, nie było w niej nic nowego. Ogólnie rzecz biorąc, LGA 2011 w każdym ze swoich przejawów to wiele potężnych stacji roboczych, w których przede wszystkim zwracają uwagę na wydajność w ograniczonym zakresie zastosowań, a drugim lub trzecim myślą o rozpraszaniu ciepła, zużyciu energii i kosztach. Dla przeciętnego użytkownika wnętrze komputera PC jest równie ważne ze wszystkich stron, a platforma LGA 1150 została najlepszy wybór: bogaty asortyment procesorów i płyt głównych, umiarkowana cena, skromne zużycie energii. W rzeczywistości złoty środek. Ale musimy iść do przodu.

Przez „posuwanie się do przodu” rozumiano przejście na proces technologiczny 14 nm ze wszystkimi jego przyjemnymi konsekwencjami: mniejszą powierzchnią matrycy, mniejszym zużyciem energii (i rozpraszaniem ciepła), wyższymi częstotliwościami zegara. Jednak od samego początku sprawy nie ułożyły się. Potem pojawiły się problemy z tranzystorami, potem pojawił się duży procent małżeństwa.
Przez cały rok w kanały informacyjne Wymykały się fragmentaryczne informacje, ale brakowało dokładnych i wiarygodnych informacji. Nawet ci, którzy nie zamierzali zmieniać wypchania PC zaraz po premierze kolejnej rodziny procesorów, spodziewali się pojawienia się nowych produktów. Wyłącznie z zainteresowania wynikiem tak długiego wysiłku.
Koniecznie należy wspomnieć o modelach komputerów stacjonarnych opartych na rdzeniu Broadwell, które jakoś szybko przemknęły przez kanały informacyjne w lipcu 2015 r. i zniknęły.
Na początku sam prawie wziąłem te procesory na długo oczekiwaną nową rzecz, będąc dość zaskoczonym zachowaniem gniazda procesora (i typu pamięci RAM w tym samym czasie) za pomocą technologii procesowej 14 nm i niestandardowej rdzeń. Przecież nie karm Intela chlebem, tylko niech użytkownik zatroszczy się o nową platformę, ale śmiało, trzecia generacja - i wszystkie 1150. Ale nie, Broadwell (a dokładniej Broadwell-DT) były przelotne pośredni łącznik między tymi dwoma generacjami, bardziej skoncentrowany na segmencie mobilnym niż stacjonarnym. W rezultacie zainteresowanie nimi wzrosło u tych, którzy chcą czerpać korzyści z rozwiązań mobilnych, zachowując stacjonarny format swojego komputera.
Długo oczekiwane wejście na rynek nowych produktów opartych na rdzeniu Skylake nastąpiło pod koniec lata 2015 roku.

Należy w tym miejscu zaznaczyć, że gniazdowany Skylake bardziej poprawnie nazywa się Skylake-S, ponieważ istnieją inne wersje Skylake – U, Y i H, przeznaczone do montażu w systemach mobilnych i produkowane w opakowaniach BGA.

W sumie rodzina podstawek Skylake-S obejmuje 20 modeli procesorów z TDP od 35 do 91 watów. Bardzo łatwo je rozpoznać w cennikach - pierwsza cyfra w oznaczeniu to 6. Charakterystyki ilościowe nieznacznie się zmieniły: liczba rdzeni wynosi od dwóch do czterech, częstotliwość od 2,2 do 4 GHz, L3 pamięć podręczna wynosi od 3 do 8 MB.

Intel nadal pozostawia rozwiązania z sześcioma lub więcej rdzeniami dla wysokowydajnej platformy LGA 2011, co jest decyzją uzasadnioną. W codziennej pracy bardziej przydatne są wysokie częstotliwości taktowania niż zwiększanie liczby wątków (co bezpośrednio zależy od liczby rdzeni). Można więc teraz rozważyć cztery rdzenie, napompowane technologią Hyperthreading do ośmiu wątków optymalna wartość na „potrzeby domowe”.

Skylake-S jest dostępny dla platformy LGA 1151, opartej na logice systemu serii 100: Z170, H170, H110, B150, Q170 i Q150. Obfitość chipsetów wynika z innego zestawu funkcji używanych w różnych obszarach. Entuzjaści, overclockerzy i dążący do perfekcji zainteresują się Z170, ale Q170 i H170 są pozbawione niektórych cech Z170, ich los to „proste” komputery o wysokiej wydajności.

Chipsety B150 i H110 są przeznaczone do systemów klasy podstawowej, dlatego brakuje niektórych linii PCI-E. Innowacje wspólne dla rodziny 100.: magistrala DMI trzeciej wersji do komunikacji z procesorem PCH, PCI Express numer 3.0, dziesięć USB 3.0 zamiast poprzednich ośmiu, dziesięć linii PCI Express (w topowych wersjach chipsetu).

Ciekawie wygląda sytuacja z pamięcią RAM: rozwiązania Skylake-S obsługują zarówno DDR3, jak i DDR4, ale do tej pory jakoś zapomniano o DDR3 w stosunku do LGA 1151. Przypuszczam, że to składnik marketingowy i niska powszechność rozwiązań budżetowych dla nowego gniazda procesora.
Jednak w rzeczywistości DDR3-2400 nie jest w żaden sposób gorszy od DDR4-2400, ale kosztuje mniej za ten sam wolumin. Niektórzy analitycy przewidują masowe przejście na DDR4 w latach 2016-2017, ale wiemy, że prawdziwy obraz jest zupełnie inny.
Biorąc pod uwagę przewagę platform z pamięcią DDR3 i brak skoku wydajności w segmencie komputerów stacjonarnych, trzecia wersja będzie aktywnie wykorzystywana przez kolejne cztery lub pięć lat.
Większość innowacji znajduje się w samym procesorze. Jak widać z poprzedniego akapitu, DDR4 jest zainstalowany obok kontrolera DDR3. Wzrosła liczba operacji wykonywanych na zegar, wzrosła przepustowość pierścieniowej magistrali danych i pamięci podręcznej L3, a także zwiększyły się bufory wewnętrzne. Wszystko to, według Intela, zapewnia wzrost wydajności w porównaniu z Haswell, wszystkie inne rzeczy są równe, ale potrzebna jest dobra optymalizacja oprogramowania, aby ujawnić wszystkie korzyści.
Mówiąc najprościej, Skylake-S nie odpali od razu, trzeba poczekać na adaptację kodu oprogramowania.
Ważna innowacja dla overclockerów: kontroler mocy jest usuwany z rdzenia procesora i nie wkłada już szprych w koła podczas przetaktowywania. Minusem rozwiązania jest wzrost kosztów płyt głównych ze względu na konieczność zorganizowania systemu zasilania. Jest tu miecz obosieczny: nie trzeba odgradzać potężnego konwertera od rozwiązań budżetowych, a wtedy dopłata będzie niewidoczna. A w przypadku modeli overlockerów nie można skąpić i zakładać na nie skomplikowane konwertery o dużym marginesie mocy, za które można poprosić o poważne pieniądze.

Rdzeń wideo, obecnie nazywany Intel HD 530, składa się z 24 bloków. Całkowicie podobny w architekturze do GT2 Haswella – czyli HD Graphics 4600 – składał się z 20 bloków. Intel ma do dyspozycji znacznie wydajniejszy i zaawansowany technologicznie GT3e zastosowany w Broadwellu. Ale w celu wykluczenia wzajemnej konkurencji procesorów w systemach bez dyskretnej
karty graficzne, zdecydowano się zainstalować nieco bardziej odchyloną GT2 w Skylake-S.

Badanie wydajności procesorów Core i5-6600K i i7-6700K dostarczonych przez firmę Intel zostało przeprowadzone na systemie Płyta ASUS Z170 Pro Gaming, oparty na topowej wersji logiki systemowej. Do porównania wzięto cztery procesory: Core i5-4770K, jeden z topowych dla platformy LGA1150 na architekturze Haswell, Core i5-5775C, jeden z nielicznych gniazd Broadwell,
oraz Core i7-5930K, zainstalowany na platformie LGA 2011v3.

Taki zestaw niemal topowych rozwiązań opartych na Haswell, Haswell-E, Broadwell-DT i Skylake-S pozwoli ocenić wydajność platform w codziennych zastosowaniach. Szczególnie warto to zauważyć to porównanie Wskaźniki są ogólne i nie odpowiadają na pytania typu „o ile szybszy jest HD 530 w porównaniu z HD 4600?” i „jak duży jest potencjał podkręcania i7-6600K w porównaniu z i7-4770K?”. Niewątpliwie odpowiedzi na nie są interesujące, a dzięki powyższym czterem możesz przeprowadzić wiele innych testów, które pozwalają zrozumieć niuanse działania konkretnego procesora w różnych warunkach. Zrzuć wszystko w jeden materiał - nie najlepszym rozwiązaniem; znacznie rozsądniej jest przejść od ogółu do szczegółu i nie starać się zawrzeć wszystkiego w kilkunastu stronach drukowanego tekstu.

Maksymalnie zaangażowana była rola aplikacji testowych prawdziwe programy, a minimalnie - syntetyczne benchmarki, czyli PCMark 8 i LuxMark 2.0. Pozostałe sześć to często używane aplikacje i testy porównawcze ich silnika.

W Adobe po efektach CC 2015 zmierzył czas nakładania efektów specjalnych na segment wideo, w Adobe Photoshop CS6 – czas nakładania filtrów na obraz o wysokiej rozdzielczości.

W Autodesk 3ds Max 2016 liczba renderowanych klatek została obliczona przy użyciu renderera V-Ray, w MediaCoder x64 0.8.36 - czas kompresji wideo przez kodek x264 MPEG2. 7-Zip i Cinebench R15 wykorzystały wbudowane testy wydajności.


Już od pierwszego spojrzenia na wyniki w teście PC Mark 8 staje się jasne, że nie podaje on żadnych konkretów na temat procesorów, wszystkie cztery są na tym samym poziomie, różnica jest
tylko w granicach błędu. Na innych wykresach sytuacja jest jaśniejsza.

Tak więc After Effects jest bardzo pozytywnie nastawiony procesory wielordzeniowe z dużą szybkością zegara. Tę samą zależność można prześledzić w LuxMarku. Cała przysługa
z platformy LGA 2011v3 ilustrują Cinebench, 3ds Max, 7-Zip, Photoshop, MediaCoder x64. Dodanie dwóch rdzeni o stosunkowo niskiej częstotliwości dla procesorów tej klasy — 3,5 GHz — powoduje, że modele czterordzeniowe osiągają wynik lepszy o jedną trzecią lub więcej. Jednoznaczna odpowiedź na pytanie o przeznaczenie platformy 2011 jako całości. Cztery kanały pamięci dają pewną przewagę, ale w porównaniu z tryb dwukanałowy jest prawie niezauważalny, 1-3% w zależności od zastosowania.


Wyniki zaprezentowane przez Core i5-6600K są mieszane: w Photoshopie, MediaCoder x64, 3ds Max jest prawie na równi z i7-4770K, a w After Effects, 7-Zip i Cinebench pozostaje daleko w tyle. Powodem tego zachowania jest niezrozumiała decyzja Intela o pozostawieniu 6600K bez technologii Hyper-threading, chociaż jest to jeden z dwóch topowych procesorów w linii Skylake-S.
Tylko i7-6700K jest bardziej produktywny, który ma zarówno 400 MHz wyższą częstotliwość, jak i Hyper-threading. Zalety wysokiego taktowania i zaktualizowanego rdzenia są wyraźnie widoczne na wykresach: wśród czterordzeniowych 6700K jest wszędzie na pierwszym miejscu, ustępując jedynie gęstszemu 5930K wyposażonemu w rdzenie.
Wyniki i5-5775C wydają się dziwne: czasami prawie ostatni (After Effects, MediaCoder), czasami dorównuje 4770K, pomimo taktowania 3,3 GHz (7-Zip, Photoshop), a w niektórych miejscach nawet go wyprzedza to (Cinebench R15, 3ds Max)! Faktem jest, że przy architekturze podobnej do Haswell zwiększono bufory wewnętrzne, poprawiono algorytm przewidywania rozgałęzień, dodano przyspieszone operacje mnożenia i dzielenia, pojawiła się dodatkowa pamięć podręczna L4 128 MB (tzw. eDRAM), wykorzystywana przez zintegrowaną rdzeń wideo jako pamięć wideo w przypadku braku oddzielnej karty wideo. Powszechne rozwiązanie w segmencie mobilnym, nic radykalnie nowego. I tak, hiperwątkowość nie jest wyłączona. W rzeczywistości są to wyniki, które Skylake-S powinien pokazywać przy 3,3 GHz. Dlatego nie zainstalowali nowego rdzenia Iris Pro 6200 na 6xxx: w obecnej sytuacji odbiorcy zainteresowani 5775C i 6600K nie pokrywają się tak bardzo.

Ostatni wykres przedstawia pobór mocy procesora w trzech trybach: bezczynności, kodowania wideo x264 i testu obciążeniowego LinX. wymierzony
zużycie samego procesora, bez wpływu karty graficznej, napędów i strat w zasilaniu. Wykres wyraźnie pokazuje zalety przejścia na technologię 14nm: pobór mocy przy dużym obciążeniu spadł o 24 W, a przy słabym o 2 W. Sześciordzeniowy procesor jest żarłoczny w zależności od swoich możliwości obliczeniowych, nawet w trybie bezczynności.

Najważniejsze jest to, że oba nowe produkty 14 nm wydane przez Intel w 2015 roku są interesujące na swój sposób. Broadwell-DT w ogóle, a Core i7-5775C w szczególności może się do nich spodobać
kto potrzebuje zwinnej i ekonomicznej platformy bez dużej mocy graficznej. Skylake-S w ten moment wygląda na dobrego następcę Haswella: zmniejszono pobór mocy, wiele przydatnych (choć nie fundamentalnych) usprawnień w rdzeniu, zachowane są częstotliwości taktowania.

Wszystkie powyższe wykresy wymownie świadczą na korzyść nowości. Nie zapominajmy, że platforma LGA 1151 wciąż jest na starcie, przez co obok LGA 1150 wygląda nieatrakcyjnie: jest niewiele i drogich podzespołów (przede wszystkim płyty główne z pamięcią DDR4) i nie wprowadzono żadnych optymalizacji do kod aplikacji do wykorzystania wszystkich innowacji Skylake.
Dlatego praktycznie nie ma sensu przesiadać się z porównywalnych procesorów Haswell na Skylake, chyba że naprawdę chcesz to szybko zdobyć
nowość, a pieniądze nie szkoda. W przyszłości wymiana LGA 1150 na LGA 1151 nabierze sensu.


Architektura Broadwell | Wstęp

Intel skrupulatnie dokumentuje wszystkie innowacje, które wprowadza w swoich procesorach z każdą nową generacją - jest to dobrze znane każdemu, kto interesuje się branżą procesorów. Firma nazywa tę strategię „tick-tak” („tick” to zmniejszenie rozmiaru węzła, aby pomieścić więcej tranzystorów na jednym chipie, a „tick” to znacząca aktualizacja architektury). Cykl ten powtarza się co roku. "Tak" - to jest wydanie procesora Haswell Opartego na technologii procesu 22 nm, a teraz mamy "tick" - zmniejszenie obszaru chipa w procesorze Haswell do 14 nm, co w rzeczywistości jest nowy Broadwell.

Jeśli znasz już tę strategię, powinieneś zrozumieć, czego oczekujemy od architektury Broadwell– Mniejsze procesory, mniejsze zużycie energii, wyższa wydajność na wat i ogólna wydajność porównywalna z rozwiązaniami poprzedniej generacji. Tak więc nowy produkt w tym sensie nie jest osiągnięciem, ale demonstracją stałości firmy w wytwarzaniu rozwiązań w kontekście kilku pokoleń. Ale oczywiście wielu może zaskoczyć, że w pewnym momencie tej sekwencji pojawiły się procesory Haswell-Y, których TDP jest na tyle niskie, że można je stosować w pasywnie chłodzonych obudowach 9 mm. To zupełnie nowy obszar zastosowań dla marki. Intel Core. Ale o tym później, najpierw musisz porozmawiać o ważniejszym wydarzeniu - pojawieniu się węzła procesora 14 nm.

Architektura Broadwell | Węzeł 14 nm: FinFET drugiej generacji

Może wydawać się logiczne, że numeracja modeli węzłów procesora wskazuje rozmiar (22 nm lub 14 nm). Choć tak było w poprzedniej generacji (wielkość była związana z najmniejszym elementem tranzystora – zwykle bramką), to obecnie nie znajduje to odzwierciedlenia w nomenklaturze rozwiązań Intela.

Nowoczesne węzły są nazywane na podstawie stosunku fizycznego rozmiaru węzła do rozmiaru węzła poprzedniej generacji. Oznacza to, że jeśli porównamy węzeł 22 nm z węzłem 14 nm, staje się jasne, że odległość między żebrami tranzystora zmniejszyła się z 60 nm do 42 nm, odległość między granicami sąsiednich bramek zmniejszyła się z 90 nm do 70 nm, a minimalna odległość między warstwami połączeń wewnątrzobwodowych – od 80 nm do 52 nm. Komórka pamięci SRAM, która zajmowała w węźle od 22 nm do 108 nm2, zajmuje 59 nm2 w węźle 14 nm.

Rozmiary komponentów w porównaniu do poprzedniej generacji węzłów mają różne współczynniki miniaturyzacji - od 0,70 (odległość między żebrami) do 0,54 (obszar komórki SRAM). Jeśli weźmiesz liczbę 22 i pomnożysz ją przez 0,64, otrzymasz około 14, więc możesz powiedzieć, że Intel używa logicznej nomenklatury dla swojego węzła 14 nm. Nawiasem mówiąc, matryca Broadwell-Y ma o około 63% mniejszą powierzchnię niż matryca Haswell-Y.

22-nanometrowe węzły Intela są pierwszymi produktami firmy wykorzystującymi tranzystory FinFET (znane również jako Tri-Gates). Węzły 14 nm to druga generacja węzłów wykorzystujących tranzystory FinFET, które charakteryzują się większą gęstością dzięki bliższym żebrom. To, w połączeniu z wyższymi, cieńszymi żebrami, zwiększa prąd napędowy i optymalizuje wydajność tranzystora. Liczba żeber w tranzystorze zmniejszyła się z trzech do dwóch, co również przyczynia się do wzrostu gęstości wraz ze spadkiem pojemności.

Konkurenci Intela przechodzą obecnie z tranzystorów MOSFET na FinFET, ale Intel twierdzi, że jest bezkonkurencyjny w skalowaniu przestrzeni logicznej. Na podstawie informacji z TSMC i IBM Alliance oraz przy użyciu formuły skalowania (odstępy między bramkami, czasy galwanizacji), Intel stwierdza, że ​​nadchodzący węzeł 16 nm TSMC nie wprowadza żadnych ulepszeń w skalowaniu logiki powyżej węzła 20 nm, co według firmy będzie stanowić konkurencję wstecz kilka pokoleń. Oczywiście ta formuła pomaga określić tylko jeden parametr porównania, ale jednocześnie budzi nasze zainteresowanie tym, co nowy węzeł 16nm od TSMC pokaże w przyszłym roku. Przyznajemy też, że mamy obawy, że prawa fizyki będą ingerować w ewolucję węzłów, jeśli litografia skurczy się do mniej niż 10 nm, co z kolei pomoże konkurentom dogonić Intela. Ale w tej chwili prawa Moore'a nadal działają.

Omówmy pokrótce kwestię uzysku odpowiednich kryształów. Żaden producent nie świeci szczerością, gdy mówi na ten temat, ale Intel nieco uniósł zasłonę. Ogólnie rzecz biorąc, firma powiedziała nam, że proces 22 nm dał najwyższą wydajność wśród ostatnich generacji węzłów, podczas gdy wydajność 14 nm SoC Broadwell wykazuje pozytywną dynamikę i mieści się w dopuszczalnych granicach. Pierwsze produkty do sprzedaży zostały już zakwalifikowane i powinny trafić na rynek pod koniec 2014 roku.

Oznacza to, że wszystkie te czynniki powodują zmniejszenie upływu, zużycia energii i kosztu na tranzystor, podczas gdy ogólna wydajność i wydajność na wat wzrosła w porównaniu z węzłami poprzedniej generacji. Nie byliśmy zaskoczeni, ale zmiany są niezwykle pozytywne, zwłaszcza jeśli oznacza to, że takie technologie można zastosować w nowych typach urządzeń. Jest to szczególnie ważne, gdy rozważamy, które produkty Intel będą wykorzystywać węzły 14 nm. Jednym z nich jest Broadwell-Y, układ mobilny nowej generacji, o którym Intel szczegółowo omówił.

Architektura Broadwell | Broadwell konwergentny rdzeń


Intel twierdzi, że IPC w Broadwell nie będzie przynajmniej o 5% wyższy niż Haswell. Nie jest to aż tak znacząca poprawa, ale nie dziwi nas to, biorąc pod uwagę pojęcie „tykania” i do jakiej grupy należy nowa architektura.

Oznacza to, że wszystkie główne ulepszenia osiąga się poprzez zwiększenie możliwości istniejących elementów procesora, a nie przez opracowywanie nowych. Zwiększenie gęstości węzła 14 nm jest dość udanym posunięciem, które zapewnia również dodatkowe miejsce na dodanie dodatkowych tranzystorów, co zrobił Intel: liczba wpisów w harmonogramie poza kolejnością wzrosła w nowej architekturze (Intel nie powiedział, o ile to wzrosło ), co przyspiesza proces przekierowywania pobierania. Asocjacyjny bufor translacji (TLB) drugiego poziomu wzrósł z 1 tys. do 1,5 tys. wpisów, dodano nowy bufor dla stron 1 GB na 16 wpisów. Druga strona TLB ma procedurę obsługi błędów strony, dzięki czemu przejścia między stronami mogą być wykonywane równolegle.

Mnożnik zmiennoprzecinkowy jest teraz znacznie wydajniejszy, jest w stanie wykonać zadania w trzech cyklach zegara, które Haswell poradziłby sobie w pięciu. W Broadwell wzrosła również szybkość obliczeń wektorowych. Intel twierdzi, że algorytmy przewidywania gałęzi również zostały ulepszone.

Oprócz parametrów ogólnych, nowa architektura skupia się na poprawie niektórych specyficznych cech, w tym instrukcji przyspieszających szyfrowanie, a także czasu wykonywania operacji wirtualizacji. Oczywiście podstawowym celem Intela jest zmniejszenie zużycia energii, więc firma wykorzystała dodatkowe tranzystory tylko do funkcji, które nie wymagają znacznego zwiększenia zużycia energii. Więcej na ten temat dowiemy się w kolejnych rozdziałach artykułu.

Architektura Broadwell | Broadwell-Y: Przedstawiamy procesor Intel Core M

Nowy węzeł 14nm nadaje się do użytku w różnych segmentach rynku - od centrów danych po tablety, w zależności od liczby chipów Broadwell. W chwili pisania tego tekstu mamy tylko informacje o Broadwell-Y, chociaż ulepszenia architektury Broadwell znajdzie odzwierciedlenie w innych decyzjach. Sprawdziliśmy Broadwell-Y pod nazwą Intel Core M.

Nowa marka Core M będzie wykorzystywana we wszystkich nowych rozwiązaniach mobilnych, natomiast marki Celeron i Pentium M nie będą powiązane z SoC Broadwell-Y. Specyfikacje wskazują, że taki chip o mocy 3W lub 5W wystarczy do pracy w urządzeniach o grubości od 7 do 10 mm z pasywnym chłodzeniem i 10,1-calowym wyświetlaczem. Bawiliśmy się nawet z prototypem dość atrakcyjnego tabletu o grubości 7 mm, ale nie byliśmy w stanie uruchomić żadnej aplikacji ani sprawdzić specyfikacji za pomocą panelu sterowania. Musiałem przyjąć na wiarę stwierdzenie Intela, że ​​Broadwell-Y "zapewnia ponad dwukrotne obniżenie TDP, mając więcej wysoka wydajność niż Haswell-Y".

Chip Broadwell-Y ma powierzchnię 82mm2, prawie 63% mniejszą niż Haswell-Y (130mm2). Pod względem wymiarów płyty Broadwell-Y ma o 50% mniejszą powierzchnię i 30% mniejszą grubość niż Haswell-Y. Zmniejszenie rozmiaru było możliwe dzięki przeniesieniu modułów 3DL na małą oddzielną płytkę drukowaną przymocowaną do dolnej części płyty chipowej Broadwell-Y. Oczywiście w tym przypadku płyta główna musi mieć odpowiednie złącze.

Ponieważ skalowanie obszaru na chipie 14 nm było bardziej wydajne niż oczekiwano, Intel był w stanie wlutować o 20% więcej tranzystorów na płycie, co pozwoliło na szerszy zestaw funkcji i lepszą wydajność. Np. zintegrowany moduł graficzny na Haswell-Y ma maksymalnie 20 rejestrów AU, podczas gdy Broadwell-Y może korzystać nawet z 24. Oznacza to 20% wzrost zasobów obliczeniowych, dodatkowo Intel twierdzi, że jest też 50 % wzrost częstotliwości urządzeń strobujących. Oprócz tych ulepszeń Intel wspomina o ulepszeniu geometrii, grubości i szybkości wypełniania pikseli, które chip zawdzięcza zmianom w architekturze, chociaż szczegóły tego nie są znane. Również podczas zapowiedzi produktu mówiło się o wsparciu wyświetlaczy 4K, ponadto w tej chwili wiadomo o wsparciu teoretycznie dwóch istniejących wyświetlaczy. Nie jest jasne, czy ma to sens, biorąc pod uwagę ograniczenia mocy urządzeń mobilnych.

Architektura Broadwell | Intel Core M: najważniejsze jest niskie zużycie energii

Intel twierdzi, że optymalizacje zaimplementowane w Broadwell-Y zmniejszyły zużycie energii o połowę w porównaniu z Haswell-Y i eliminują potrzebę aktywnego chłodzenia. Potencjał redukcji mocy w skali SoC przedstawia się następująco: 25% niższe zużycie energii ze względu na niższą pojemność elektryczną, 20% niższe zużycie energii ze względu na niższe napięcie w połączeniu z optymalizacją chipów, do 15% niższe zużycie energii ze względu na zwiększoną wydajność tranzystorów przy niskich napięciach o 10% - ze względu na mniejszy upływ mocy oraz mniejszy rozmiar i większą gęstość tranzystora. Oczywiście Intel nie ujawnił szczegółów dotyczących dokładnych TDP produktów, których dotyczą te statystyki, więc będziemy musieli trochę poczekać. Wiemy, że chipy, o których mówi Intel, wykazują skok zużycia z 10 W do 15 W po uruchomieniu, a następnie, po kilku milisekundach, pobór mocy spada do 3-4 W, gdy jest stabilny pod obciążeniem.

Broadwell-Y wykorzystuje również zaawansowany zintegrowany regulator napięcia drugiej generacji (FIVR), który pomaga przyspieszyć przejście układu ze stanu niskiej częstotliwości do stanu bezczynności do stanu obciążenia. FIVR ma funkcję nieliniowej redukcji częstotliwości i obsługuje nowy tryb FIVR-LVR. Okazuje się, że FIVR nie jest szczególnie wydajny przy bardzo niskich napięciach, więc można go wyłączyć, jeśli trzeba oszczędzać energię.

SoC wprowadza również szereg optymalizacji w celu oszczędzania energii czynnej: optymalizacje procesów, które obniżyły minimalne napięcie robocze i dynamiczną pojemność elektryczną (Cdyn), zmiany w architekturze graficznej DDR/IO/PLL/Graphics, Cdyn w IA/Graphics/PH optymalizacje i niższe zakresy częstotliwości pracy dla IA/GT i pamięci podręcznej. Grafika może być kontrolowana za pomocą funkcji Duty Cycling Control (DCC), aby zmniejszyć zużycie energii i może być po prostu włączana i wyłączana w razie potrzeby. Czas opóźnienia przy wyłączaniu GPU jest bardzo krótki, a jego częstotliwość można zmniejszyć do 12,5% normalnej częstotliwości pracy.

Częstotliwość jest oczywiście powiązana ze zużytą energią i mocą cieplną. Istnieją trzy progi zużycia energii zaprojektowane w celu zapewnienia maksymalnej częstotliwości przy zachowaniu stabilności systemu. PL3 to maksymalny dopuszczalny poziom, ograniczony przez zabezpieczenie przed przeciążeniem akumulatora, który może być używany przez krótki czas. PL2 to standardowy poziom szczytowy, podczas gdy PL1 jest przeznaczony do długotrwałego użytkowania przy stałym zużyciu energii i stabilności systemu. W razie potrzeby funkcja dławienia może włączać i wyłączać jednostki procesora, aby zminimalizować zużycie energii i wytwarzanie ciepła.

W Broadwell zaimplementowano system zarządzania zasilaniem i temperaturą, który ocenia wydajność wielu składników, a sterownik Intel kontroluje zużycie energii przez różne składniki.

PCH otrzymał również kilka zmian mających na celu poprawę efektywności. Pobór mocy w stanie bezczynności jest zmniejszony o 25% w porównaniu z produktami z 2013 roku, a pobór mocy czynnej jest teraz o 20% niższy niż w przypadku PCH-LP firmy Haswell. Narzędzia do monitorowania i raportowania w celu zmniejszenia zużycia energii są wdrażane na poziomie urządzenia, oprogramowania układowego i powiązanego oprogramowania.

Ponadto PCH jest wzbogacony o funkcję Audio DSP, która ma więcej SRAM i wyższą szybkość przetwarzania instrukcji (MIPS). Ulepszono przetwarzanie końcowe, w tym obsługę budzenia na głos. Procesor zawiera również nowe funkcje zarządzania i bezpieczeństwa. Warto zauważyć, że PCH wykorzystuje węzeł 22 nm, a rozmiar pozostaje taki sam w porównaniu do poprzedniej generacji.

Architektura Broadwell | Pierwsze testy

Udało nam się ocenić wydajność Core M-5Y70 (Broadwell-Y, TDP 4,5 W) w obudowie tabletu bez wentylatora i porównać go z Atom Z3740D (Bay Trail, TDP poniżej 4 W). Bez zbędnych ceregieli przejdźmy od razu do wyników.

3DMark wykazał prawie trzykrotny wzrost prędkości dla Core M-5Y70. Ciekawe, że wzrost wpłynął nie tylko na wydajność grafiki, ale także na obliczenia wykonywane na procesorze.


Testy SunSpider i Cinebench również pokazują mocne strony Core M. W tych testach nowy procesor Broadwell przy zmniejszonym zużyciu energii, dwa i pół raza szybciej niż Bay Trail.

Porównywanie Core M (Broadwell-Y) do Atom (Bay Trail) może wydawać się niesprawiedliwe. Z punktu widzenia to prawda: sam procesor Core M kosztuje około 300 dolarów, a za takie pieniądze można kupić cały tablet oparty na Atomie – na przykład Dell Venue 8 Pro. Oczekuje się, że koszt tabletów lub transformatorów opartych na Core M zbliży się do 1000 USD. W dodatku maksymalna ilość pamięci RAM platformy Bay Trail jest ograniczona do 2 GB, podczas gdy testowany Core M wyposażony jest w 4 GB pamięci RAM i całkiem możliwe, że ten czynnik mógł znacząco wpłynąć na wyniki.

Jednak z punktu widzenia funkcjonalności porównanie tych dwóch procesorów ma swoją logikę, ponieważ w tabletach x86 pod Windows o grubości poniżej 8 mm Haswell-Y nie może być pełnoprawnym konkurentem ze względu na ograniczoną przestrzeń wewnątrz walizka. Chipy Atom oparte na Bay Trail są najlepsze, jakie widzieliśmy w tym segmencie przed Core M, a wzrost wydajności, który Broadwell-Y widzi w cienkich i lekkich tabletach, jest zdumiewający. W tej klasie tabletów wiodącą pozycję pod względem wydajności zajmował Apple iPad, ale wydaje się, że wraz z pojawieniem się Core M sytuacja może się zmienić.

Mówiąc o iPadzie, chciałbym zaznaczyć, że prototyp tabletu Llama Mountain od Intela o przekątnej ekranu 12,5 cala i wadze 685 g przypominał nam słynny tablet z Cupertino, tylko próbka Intela ma większy ekran.

Intel zaprezentował trzy modele demonstracyjne: jeden z aluminiową obudową, jeden z pozłacanym aluminium i jeden z miedzianą powłoką. Te prototypy zostały użyte do przetestowania pakietu termicznego Core M, a według firmy nowe procesory Broadwell-Y są w stanie utrzymać dopuszczalne temperatury we wszystkich trzech wersjach obudowy. W testach wydajności nie zauważyliśmy między nimi różnicy.

Omawiając rozpraszanie ciepła, Intel wspomniał, że producenci OEM będą mogli dostosować TDP wszystkich procesorów Core M na trzech poziomach: 3 W, 4,5 W lub 6 W. Dzięki temu producenci będą mogli dostosować produkty do konkretnych przypadków użycia. Na przykład najwyższej klasy Core M 5Y70 TDP można ustawić na 3 W, aby zmaksymalizować żywotność baterii platformy. Z kolei TDP 6W można zastosować w obudowie z aktywnym chłodzeniem, aby zwiększyć responsywność urządzenia (należy doprecyzować, że rozwiązanie w trybie 6W niekoniecznie wymaga wentylatora, grubsza obudowa poradzi sobie z tym skuteczniej rozpraszając się). ciepło).

Chociaż cieszymy się z różnorodności, musimy ostrzec, że teraz numer modelu procesora nie gwarantuje określonego poziomu wydajności. Core M-5Y70 w trybie 3W TDP będzie zdecydowanie wolniejszy od podobnego procesora z TDP zwiększonym do 6W. Do tego tańszy Core M-5Y10 z TDP na poziomie 6 W prawie na pewno wyprzedzi topowego Core M-5Y70 w trybie 3 W.

Intel daje dobry powód, by sądzić, że producenci OEM zastosują wartości TDP do nowych procesorów, co jest korzystne z marketingowego punktu widzenia. Może to prawda, ale faktem jest, że wraz z pojawieniem się nowych procesorów Core M, określone modele tabletów lub urządzeń konwertowalnych mogą działać szybciej lub wolniej w zależności od decyzji producenta, a nie tylko charakterystyki wybranego przez niego procesora . W przyszłości między dwoma urządzeniami z procesorami tego samego modelu różnica w wydajności i funkcjonalności może być bardzo znacząca.

Na powyższym obrazku widać, jak mała jest platforma Llama Mountain. Nawet z podłączoną płytą-córką zaskakująco kompaktowa kombinacja dwóch płytek waży nieco ponad 90 gramów.

Oprócz wyników testów, w praktyce my wykazali różnicę w wydajności między dwoma urządzeniami bez aktywnego chłodzenia. Niedawno ogłoszone tablet lenovo Helix z chipem Core M-5Y70 (podłączony do monitora z prawa strona) i tablet z procesorem Atom Z3740 (po lewej).

Testy wydajności w świecie rzeczywistym są zgodne z syntetycznymi benchmarkami, co oznacza, że ​​istnieje zauważalna różnica wydajności między Atom i Core M. W przyszłości chcemy przetestować nowy procesor Intel i procesory Haswell-Y z 11,5 W TDP. Ciekawe, czy uda mu się dogonić, a nawet wyprzedzić swojego poprzednika, który ma dwukrotnie wyższy TDP.

Również nas zademonstrował działanie tabletów opartych na Intel Moorefield. Moorefield to platforma chipowa Intel Atom zoptymalizowana pod kątem systemu operacyjnego Android. Poniżej znajduje się demonstracja wideo rzeczywistej różnicy wydajności między systemem czterordzeniowym (po lewej) a ośmiordzeniowym ARM A9 Cortex (po prawej):

Intel twierdzi, że powodem, dla którego ich czterordzeniowy Atom przewyższa ośmiordzeniowy A9, jest przewaga rozwiązania Intela pod względem liczby instrukcji wykonywanych na zegar, a także ograniczenia systemu operacyjnego Android w zakresie wydajnej równoległości zadań .

Należy pamiętać, że tablet oparty na Moorefield to Dell Venue 8 7000, który został ogłoszony na IDF i jest wyposażony w system Intel RealSense Dual Camera System. Dzięki nowemu sprzętowi tablet Dell otrzymał ciekawe funkcje, takie jak mierzenie wielkości obiektów na obrazie. Pełne możliwości Venue 8 7000 nie są jeszcze znane, ale teoretycznie system z dwoma kamerami pozwoli uchwycić trójwymiarowe zdjęcia.

Mówiąc o „podniesieniu” mocy obliczeniowej procesora, należy pamiętać, że dla Intela nie było to zadanie nadrzędne. Rynek urządzeń mobilnych postawił zupełnie inne wymagania – zmniejszenie zużycia energii. A jeśli stosunek poprawy wydajności do wymaganej energii dla Haswella wynosił 1:1, to dla Broadwella powinien był wynosić 2:1. Oczywiście nałożyło to własne ograniczenia na wybór „innowacji”, które Intel mógłby wnieść do projektowania architektury Broadwell. Ponadto musiałem popracować nad istniejącym już stosunkiem wydajności do zużycia energii. Z grubsza mówiąc, poprawa wydajności o 5% będzie kosztować tylko 2,5% wzrost natychmiastowego zużycia energii.

Firma będzie nadal optymalizować zużycie energii nie tylko dla Intel Core M, ale dla wszystkich przyszłych produktów Broadwell. Większa uwaga zostanie zwrócona na wyłączenie tych części procesora, które nie są używane i zmniejszenie zużycia energii przez różne bloki w razie potrzeby. Te ulepszenia, w połączeniu ze wzrostem wydajności energetycznej dzięki zastosowaniu procesu technologicznego 14 nm, to główne sposoby na zmniejszenie zużycia energii w Intel Core M.

Ulepszenia GPU

Ogólnie rzecz biorąc, zasada „tick-tock” działa również dla podsystemu graficznego procesorów Intela: znaczące zmiany architektoniczne na etapie „tick” i ulepszenia w procesie technicznym istniejącej architektury na etapie „tick”. Ale z jedną różnicą: zwykle w przypadku GPU ulepszenia na etapie tiku są znacznie bardziej znaczące niż w przypadku procesora. A Broadwell nie jest wyjątkiem.

Podsystem graficzny Broadwell oparty jest na GPU Gen8, który jest kontynuacją architektury Intel Gen7 wprowadzonej po raz pierwszy w procesorach Ivy Bridge oraz poprawionej wersji Gen7.5 w Haswell. Na podstawowym poziomie jest to ten sam procesor graficzny, tylko bardziej zoptymalizowany i dopracowany.

ModelCzęstotliwość, GHzRdzenie, szt.L3, MBTDP, watCena, $
Rdzeń i7-970 3.20 6 12 130 885
Rdzeń i7-980 3.33 6 12 130 583
Rdzeń i7-980X 3.33 6 12 130 999
Rdzeń i7-990X 3.47 6 12 130 999

Reklama

Sandy Bridge-E

Reklama

W 2011 roku Intel radykalnie zmienił architekturę procesorów, zapowiadając procesor Sandy Bridge. Jednocześnie zrewidowano podział na modele przez firmę. Zamiast różnych częstotliwości, dla większej perswazji wprowadziliśmy kilka gradacji liczby aktywne jądra, rozmiar pamięci podręcznej i zużycie energii. Nadal stosowano litografię 32 nm, więc liczba rdzeni nie wzrosła. Ale ze względu na zmianę architektury, specyficzna wydajność znacznie wzrosła. A ponieważ zmieniła się architektura, potrzebne było nowe gniazdo dla procesora.

Od 2011 roku można świętować pojawienie się gniazda LGA 2011 w jego pierwszej wersji. Nawiasem mówiąc, równolegle z Sandy Bridge-E pojawiły się rozwiązania serwerowe w postaci Sandy Bridge-EP, zawierające od dwóch do ośmiu rdzeni i do 20 MB pamięci podręcznej. Procesory były połączone magistralą QPI. W zwykłym systemie Sandy Bridge-E stracił tę szansę, zostały im tylko tradycyjne I/O DMI. Wszystkie procesory wykorzystywały czterokanałową pamięć DDR3 do 1600 MHz. Powierzchnia rdzenia wahała się od 294 do 435 mm. Liczba tranzystorów w zależności od steppingu wynosi 1270-2270 milionów.

Warto w tym miejscu zapytać o tak dużą różnicę w Charakterystyka fizyczna. Faktem jest, że w ciągu dwóch lat Intel zmienił aż trzy wersje rdzenia procesora. Początkowo dezaktywowany Sandy Bridge-EP C1 trafił do wersji na komputery stacjonarne. Nieco później firma rozdzieliła projekty w produkcji, wypuszczając wersję C2. Do najmniejszej i najmniej wydajnej wersji i7-3820 użyto M1. Dlatego możemy mówić o istnieniu trzech generacji Sandy Bridge-E. W przypadku procesora wydano nowe płyty główne oparte na chipsecie Intel X79.

Recenzje w laboratorium:

  • Następna generacja Intela. Testy porównawcze i7-3930K i i7-3960X w 2D i 3D;

Reklama

ModelCzęstotliwość, GHzRdzenie, szt.L3, MBTDP, watCena, $
Rdzeń i7-3820 3.60 4 10 130 294
Rdzeń i7-3930K 3.20 6 12 130 583
Rdzeń i7-3960X 3.30 6 15 130 999
Rdzeń i7-3970X 3.50 6 15 150 999

Ivy Bridge-E

Oczekiwania na nową serię procesorów przeciągają się od końca 2012 roku. W pewnym momencie wszyscy już zdecydowali, że Intel zdecydował się pominąć architekturę Ivy Bridge i od razu przejść na rdzeń Haswell. Sama firma tylko zasugerowała, że ​​Intel X79 pozostaje w służbie i musimy uzbroić się w cierpliwość. W rezultacie modele Ivy Bridge-E zostały wydane dopiero w drugiej połowie 2013 roku.

Reklama

W procesorze nie było żadnych zasadniczych zmian. Wydaje się, że kolejny „skurcz” z 32 nm do 22 nm powinien zwiększyć wydajność właściwą i zwiększyć częstotliwości, ale niestety dodał tylko 100 MHz. Obawy o trójwymiarowe tranzystory potwierdziły się podczas pierwszych prób podkręcania – nowe elementy były bardzo gorące i wymagały zwiększonych napięć. Ale dla Intela premiera Ivy Bridge-E była niemal najbardziej udaną premierą.

Po pierwsze, powierzchnia rdzenia wersji desktopowych była stosunkowo niewielka (256 mm), liczba tranzystorów sięgnęła 1860 mln. Po drugie, każdy mógł wymienić Sandy Bridge-E w starej płycie głównej na Ivy Bridge-E, dzięki temu samemu złączu LGA 2011. Jednak problemy z kompatybilnością i przetaktowaniem pamięci związane z Sandy Bridge-E pozostały. Deklarowana oficjalna częstotliwość wzrosła do 1866 MHz, wszystko powyżej to czysta loteria.

Recenzje w laboratorium:

  • Poznaj Ivy Bridge-E: przegląd i test procesora Intel Core i7-4930K.

Reklama

Modele Ivy Bridge-E istniały również w wersjach serwerowych. W sumie Intel stworzył trzy projekty w zależności od liczby rdzeni.

Gigant procesorowy – lider wśród wszystkich producentów chipów – kontynuuje realizację strategii tik-tak, zgodnie z którą co roku (tu pojawiają się haczyki – przyp. autora) firma wypuszcza pakiet rozwiązań zbudowanych na nowej architekturze. Pod „tickiem” odnosi się do procesorów wykonanych zgodnie ze starą architekturą, ale przeniesionych do nowej technologii procesowej. Pod „takimi” - chipy wykonane zgodnie z już ustalonymi standardami technicznymi, ale z nową architekturą. Procesory Broadwell to dokładnie procesory „tykające”. Mówiąc wprost, Intel wziął architekturę Haswell i umieścił ją na szynach 14 nm. Chociaż doskonale rozumiesz, że wszystko tutaj jest warunkowe. Każda rodzina chipów Intela przechodzi pewne zmiany. Komputery stacjonarne Broadwell nie są wyjątkiem.

PokolenieRokProces technologii„Tyk” czy „Tak”?
Conroe/Merom2006 65 mil morskichWięc
Penryń2007 45 mil morskichTek
Nehalem2008 45 mil morskichWięc
Westmere2010 32 nmTek
Piaszczysty Most2011 32 nmWięc
Bluszczowy Most2012 22 milTek
Haswell2013 22 milWięc
Broadwell2015 14 mil morskichTek
niebo2015 14 mil morskichWięc

A jednak nowe 14-nanometrowe rozwiązania można śmiało nazwać ciężko wygranymi. Faktem jest, że podczas projektowania i produkcji Broadwella Intel napotkał poważne problemy. W rezultacie premiera została opóźniona o ponad rok. Pierwsze rozwiązania oparte na architekturze Broadwell zostały pokazane na targach IFA 2014 we wrześniu ubiegłego roku. Ale dotyczyło to wyłącznie systemów Core M na chipie przeznaczonych do tabletów i laptopów. W rezultacie okres między pojawieniem się stacjonarnych wersji Haswell i Broadwell wynosił około dwóch lat.

Wiosną ubiegłego roku Intel zaprezentował nawet chipset Z97/H97 Express, zaprojektowany specjalnie dla Broadwell. Jednak opóźnienia w produkcji skłoniły firmę do uruchomienia linii procesorów Devil's Canyon (Haswell Refresh). Wyszło dobrze, bo Intel wprowadził swój pierwszy na świecie procesor działający z częstotliwością zegara 4 GHz. I tak czas wypełnił oczekiwanie na 14-nanometrowy Broadwell. Paradoks polega na tym, że już niedługo (prawdopodobnie pod koniec sierpnia) zostanie zaprezentowana linia centralnych procesorów do komputerów stacjonarnych Skylake oraz platforma LGA1151.

Cechy i specyfikacje architektoniczne

Procesory do komputerów stacjonarnych Broadwell zostały zaprezentowane na targach Computex 2 czerwca. W tej chwili istnieje pięć modeli: dwa Core i7 i trzy Core i5. Zaprezentowano również trzy Xeony pod LGA1150: E3-1285 v4, E3-1285L v4 i E3-1265L v4. Litera C w tytule oznacza dwie rzeczy. Po pierwsze, rozwiązania te są pakowane w LGA. Czyli mamy do czynienia z klasycznymi procesorami centralnymi montowanymi w gnieździe LGA1150. Po drugie, są wyposażone w odblokowany mnożnik, choć Intel już nas nauczył, że rozwiązania do overclockingu mają w nazwie albo literę K albo X. Zakłada się, że w ten sposób Intel porównuje Core i7-5775C z TDP na poziomie 65 W z 88W Core i7-4790K, ale z 65W Core i7-4790S. Jest to zrozumiałe: w tym przypadku rozwiązanie Broadwell jest o 35% szybsze w obliczeniach x86, a ponadto ma dwukrotnie wyższą wydajność niż zintegrowana grafika.

Procesory R są pakowane w BGA, to znaczy są ciasno przylutowane do płyty głównej. Oczywiście chipy te będą używane w gotowych systemach. Na przykład w monoblokach.

Poniżej znajduje się szczegółowa tabela ze specyfikacjami technicznymi procesorów Broadwell do komputerów stacjonarnych.

Intel Core i7-5775CIntel Core i7-5775RIntel Core i5-5675CIntel Core i5-5675RIntel Core i5-5575R
Liczba rdzeni/wątków4/8 4/8 4/4 4/4 4/4
3,3 (3,7) GHz3,3 (3,8) GHz3,1 (3,6) GHz3,1 (3,6) GHz2,8 (3,3) GHz
Odblokowany mnożnikJestNieJestNieNie
Pamięć podręczna L36 MB6 MB4 MB4 MB4 MB
128 MB128 MB128 MB128 MB128 MB
Kontroler pamięciDDR3 dwukanałowy 1333-1600 MHzDDR3 dwukanałowy 1333-1600 MHzDDR3 dwukanałowy 1333-1600 MHzDDR3 dwukanałowy 1333-1600 MHz
Zintegrowany rdzeń graficznyIris Pro 6200 (GT3e), 1150 MHzIris Pro 6200 (GT3e), 1100 MHzIris Pro 6200 (GT3e), 1050 MHz
Poziom TDP65 W65 W65 W65 W65 W
PakietLGABGALGABGABGA
Cena £$366 $348 $276 $265 $244

Jak już wspomniałem, to, że procesor należy do generacji kleszczy, nie oznacza, że ​​w architekturze nie dokonano żadnych zmian. Intel ma pewne podejście. Mianowicie, zaimplementowane usprawnienie jest stosowane tylko wtedy, gdy ma zdecydowanie pozytywny wpływ na wydajność – co najmniej dwa razy większy niż spowodowany tym wzrostem poboru mocy.

Większość zmian mikroarchitektonicznych została skoncentrowana w przedniej części potoku wykonawczego. Dokładniej, zwiększono objętości stref buforowych. Tak więc okno harmonogramu się zwiększyło. Dokładnie półtora raza wzrosła objętość tablicy asocjacyjnej translacji adresów drugiego poziomu (L2 TLB) - do 1500 wpisów. Ponadto cały schemat tłumaczeń zyskał drugą funkcję obsługi chybień. Wszystkie te zmiany pozwoliły procesorom Broadwell lepiej radzić sobie z przewidywaniem złożonych gałęzi kodu.

Szybkość wykonywania operacji mnożenia wzrosła z pięciu do trzech cykli. Operacje dzielenia przyspieszyły tempo dzięki zastosowaniu dzielnika 10-bitowego. Na koniec zoptymalizowano instrukcje zbierania wektorów z zestawu AVX2.

W rezultacie, przy tej samej częstotliwości, architektura Broadwell jest szybsza od Haswell średnio o 5%. Porównaniu wydajności architektur poświęcę jednak cały akapit.

Zdjęcie kości procesora Intel Broadwell do komputerów stacjonarnych

Nowe chipy 14 nm mają zintegrowany moduł graficzny Iris Pro 6200. Mówiło się już, że jest dwa razy bardziej wydajny niż HD Graphics 4600. Zintegrowany GPU zajmuje lwią część użytecznej powierzchni kryształu. Jednak główną cechą, wprowadzoną specjalnie dla Iris Pro 6200, było zastosowanie dodatkowych 128 MB pamięci eDRAM. Technicznie realizuje się to poprzez wylutowanie kolejnego kryształu na włóknie szklanym. Dlatego Intel próbował rozwiązać problem braku przepustowości pamięci. Kryształ eDRAM, wykonany w technologii 22-nanometrowej, nazwano Crystalwell. Chociaż teraz mówimy o tym w odniesieniu do zintegrowanej grafiki Iris Pro 6200, tę pamięć można śmiało nazwać pamięcią podręczną czwartego poziomu. Zaznaczam, że eDRAM był używany w niektórych rozwiązaniach generacji Haswell. Więc tej technologii nie można nazwać nową. Jednocześnie w przypadku komputerów stacjonarnych Broadwell korzystanie z Crystalwell staje się de facto standardem.

Właściwie nic się nie zmieniło. Pamięć podręczna, wykonana w technologii 22 nm, działa z prędkością 1600 MHz. Ma asocjatywność 16x i komunikuje się z procesorem za pomocą 256-bitowej dwukierunkowej magistrali. W efekcie maksymalna przepustowość między eDRAMem a procesorem może osiągnąć łącznie 102,4 GB/s (51,2 GB/s w każdą stronę). Teoretyczne korzystanie z Crystalwell zapewni dobry wzrost wydajności w zadaniach związanych z przetwarzaniem dużych zbiorów danych.

Intel Core i5-5675C

Jak wiecie, Intel stara się integrować w nich coraz mocniejszą grafikę z każdą nową generacją procesorów do komputerów stacjonarnych. Sandy Bridge miał HD Graphics 3000 z 12 siłownikami, Ivy Bridge miał HD Graphics 4000 z 16 siłownikami. Wideo HD Graphics 4600 (wariant GT2 z 20 siłownikami) było głównie „zainstalowane” w układach desktopowych Haswell. Niektóre modele (z opakowaniem BGA) zostały wprowadzone z grafiką HD Graphics 5000, Iris Pro Graphics 5100 lub 5200 (GT3 i GT3e), z 40 jednostkami wykonawczymi. Procesory do komputerów stacjonarnych Broadwell, jak już się dowiedzieliśmy, są zintegrowane z grafiką Iris Pro 6200 - najmocniejszą do tej pory odmianą GT3e, wyposażoną w 48 siłowników. Jednocześnie nieco zmienił się ich układ. Od teraz każda pojedyncza jednostka GPU zawiera nie 10 jednostek wykonawczych, ale osiem. W jednym module graficznym są trzy takie jednostki GPU. Na przykład w procesory mobilne Core M wykorzystuje grafikę GT2, która ma w swoim arsenale jeden moduł na 24 siłowniki.

Schemat blokowy zintegrowanego rdzenia graficznego Iris Pro 6200

Do naszego laboratorium testowego dotarła próbka o nazwie Core i5-5675C - chyba najpopularniejszy model spośród wszystkich zbudowanych w oparciu o architekturę Broadwell. „Stone” ma cztery rdzenie, ale nie obsługuje technologii Hyper-Threading. Klasyczna sytuacja dla każdego nowoczesnego Core i5. Jeśli porównamy ten procesor z wypuszczonym wiosną ubiegłego roku Core i5-4690K, różnica w szybkości natychmiast przykuwa uwagę. Core i5-5675C ma bazową częstotliwość taktowania 3,1 GHz, którą można zwiększyć do 3,6 GHz dzięki Turbo Boost. Core i5-4690K jest o 400 MHz szybszy, co może być dużym porównaniem między tymi układami. Oczywiście ta sytuacja z częstotliwościami taktowania jest spowodowana problemami, z jakimi musiał się zmierzyć Intel, przechodząc na 14-nanometrową technologię procesową. Gdyby desktopowy Broadwell wyszedł rok temu, to ten sam Core i5-5675C byłby poprawnie porównany z Core i5-4670K (3,4 (3,8) GHz). Wtedy różnica w częstotliwości nie byłaby tak bardzo odczuwalna.

Intel Core i5-5675CIntel Core i5-4690K
kryptonimBroadwell-COdświeżenie Haswella (Diabelski Kanion)
Proces technologii14 mil morskich22 mil
gniazdo elektryczneLGA1150LGA1150
Obsługiwane zestawy logiczneZ97/H97 ekspresoweZ97/H97/Z87/H87/B85 Ekspresowe
Liczba rdzeni/wątków4/4 4/4
Szybkość zegara (w trybie Turbo Boost)3,1 (3,6) GHz3,5 (3,9) GHz
Odblokowany mnożnikJestJest
Pamięć podręczna L34 MB6 MB
Pamięć podręczna poziomu 4 (eDRAM)128 MBNie
Kontroler pamięciDwukanałowy DDR3 1333/1600 MHz
Zintegrowany rdzeń graficznyIris Pro 6200, 1100 MHzGrafika HD 4600, 1200 MHz
Poziom TDP65 W88 W
Cena £$276 $242

Zmniejszyła się również pamięć podręczna trzeciego poziomu. Wydawałoby się, że zastosowanie technologii 14 nm może wręcz przeciwnie ją zwiększyć. Jednak integracja Crystalwell, potężnego wbudowanego procesora graficznego i najwyraźniej nie tak wysoki procent dobrych chipów, a więc nie na lepsze, wpłynęła na ostateczny koszt pulpitu Broadwell. Są zauważalnie droższe od modeli z rodziny Devil's Canyon. Tak więc zamiast 8 MB, Core i7 ma teraz 6 MB pamięci podręcznej trzeciego poziomu. Core i5 ma 4 MB zamiast 6 MB. Dużo czy mało? Na przykład Core i3 ma również 4 MB L3. Czy 128 MB pamięci eDRAM rekompensuje tę redukcję? Prawie wcale. Pamięć podręczna L3 ma opóźnienie około 20 cykli, a magistrala jest około dwa razy szybsza. Crystalwell jest po prostu wolniejszy, znacznie wolniejszy.

Zrzut ekranu CPU-Z procesora Intel Core i5-5675C

Procesory Broadwell w obudowie LGA są kompatybilne z płytami głównymi dla platformy LGA1150. Ale tylko z chipsetami z dziewiątej rodziny, czyli z Z97/H97 Express. Rozwiązania oparte na Z87 Express i podobnych nie będą obsługiwać nowych „kamieni”. Stało się to znane rok temu, ale nadal jest to smutne. Stąd wyciągamy jeszcze jeden wniosek: Desktop Core i7-5775C oraz Core i5-5675C najprawdopodobniej będą ostatnimi rozwiązaniami dla tej platformy. Następnie nadejdzie era LGA1151, Z170 Express i Skylake-S z blackjackiem i DDR4.

A propos, o pamięci. Komputery stacjonarne Broadwell są wyposażone w standardowy dwukanałowy kontroler pamięci DDR3-1333/1600. Nie ma tu nic nowego.

Wreszcie, Core i5-5675C ma TDP na poziomie zaledwie 65 W. Powiedzmy, że dzięki tej samej technologii 14 nm i tranzystorom drugiej generacji FinFET, których rozmiar zmniejszył się o jedną trzecią. W rezultacie powierzchnia kryształu Broadwell wynosi tylko 167 mm 2 w porównaniu do 177 mm 2 dla Haswell.

Cóż, to prawie wszystko, co musisz wiedzieć o linii procesorów do komputerów stacjonarnych Broadwell. Plusy i minusy takich decyzji są już jasne. Pozostaje tylko dowiedzieć się, do czego zdolny jest dostarczony nam egzemplarz Core i5-5675C.

Testowanie

Jak już się dowiedzieliśmy, do pracy z Core i5-5675C potrzebna jest płyta główna oparta na chipsetach z serii dziewiątej. Wystarczy najpierw zaktualizować BIOS płyty głównej. Na początek proponuję porównać wydajność architektur Broadwell i Haswell. I dopiero wtedy określ poziom wydajności wszystkich komponentów Core i5-5675C: części obliczeniowej, zintegrowanego rdzenia graficznego i kontrolera pamięci.

Stanowisko badawcze

  • Procesor: Intel Core i5-5675C
  • Chłodnica procesora: ENERMAX LIQTECH 240
  • Płyta główna: MSI Z97 XPOWER AC
  • Karta graficzna: GAINWARD GeForce GTX 780 Phantom GLH
  • RAM: DDR3-2133, 2x 8 GB
  • Przechowywanie: OCZ Vertex 3, 360 GB
  • Zasilanie: LEPA G1600, 1600 W
  • Peryferia: Samsung U28D590D , ROCCAT ARVO, ROCCAT SAVU
  • System operacyjny: Windows 8.1 x64

Porównanie wydajności architektur Broadwell i Haswell

Aby porównać architektury, wziąłem dwa procesory – Core i5-5675C oraz Core i5-4690K – i dla każdego z nich ustawiłem tę samą częstotliwość na 3 GHz. Zastosowano identyczne stanowisko testowe, które zawierało dwukanałowy zestaw pamięci DDR3-2133.

Zacznijmy od mózgów. Jak widać, między Core i5-5675C a Core i5-4690K nie ma dużej różnicy. Nic dziwnego: procesory korzystają z tych samych kontrolerów pamięci.

Wyniki testu w AIDA64

Jak już się dowiedzieliśmy, architektura Broadwell powinna teoretycznie być szybsza od Haswella o około 5%. W teście CINEBENCH R15 tak się stało – różnica wyniosła 6,2%.

Wyniki testu w CINEBENCH R15

Oczywiście ta zasada nie zawsze będzie obowiązywać. Na przykład w benchmarku x264 FHD procesory wykazały te same wyniki. A w znanej aplikacji wPrime, używanej przez overclockerów, Broadwell znów był na czele.

Wyniki testu w x264 FHD

Wyniki testu w wPrime 1.55

W LuxMark, przy tych samych częstotliwościach, Core i5-5675C jest o 11,2% szybszy niż Core i5-4690K. Moim zdaniem to już znaczny wzrost.

Wyniki testów w LuxMark 2.0

Po raz kolejny przed nami rozwiązanie oparte na architekturze Broadwell. Tym razem we Fryrenderze. Różnica wyniosła nie mniej niż 5,5%.

Wyniki testu we Fryrenderze

W WinRAR podczas archiwizacji pakietu testowego Core i5-5675C poradził sobie ze swoim zadaniem szybciej niż Core i5-4690K o 6,8%.

Wyniki testów w WinRAR

W LinX 0.6.5 procesory wykazały prawie takie same wyniki.

Wyniki testów w LinX 0.6.5

Jak widać, architektura Broadwell nie będzie w stanie podbić użytkowników wydajnością x86. Tak, w większości przypadków (pięć z siedmiu) naprawdę okazał się szybszy niż Haswell. Należy jednak wziąć pod uwagę, że test ten miał charakter eksperymentalny. W rzeczywistości Core i5-4690K działa z wyższą częstotliwością niż Core i5-5675C. Ponadto w niektórych aplikacjach nie ma wcale wzrostu wydajności.

Z drugiej strony nie jest to zaskakujące. Mimo to Broadwell to procesory kleszczy. Dlatego, jak powiedziałem, mają minimum zmian w porównaniu do Haswella.

Podsystem pamięci i pamięć podręczna

Kontroler pamięci w Broadwell może być taki sam, ale o wiele ciekawiej jest zobaczyć, jak zachowuje się pamięć podręczna L4. Test pamięci podręcznej i pamięci AIDA64 jest kolejnym potwierdzeniem, że Crystalwell prawdopodobnie nie stanie się „kontynuacją” pamięci podręcznej trzeciego poziomu. Tak, jest zauważalnie wolniejszy. Jeśli L3 czyta z prędkością 174 GB/s, to L4 może pochwalić się zaledwie 47396 MB/s. Różnica jest ogromna. Jednocześnie dla pamięci podręcznej trzeciego poziomu opóźnienie wynosiło około 7 ns, a dla pamięci podręcznej czwartego poziomu - 35,6 ns. Oznacza to, że różnica w wydajności między L3 i L4 jest oczywista.

Ponownie, test pamięci podręcznej i pamięci pokazuje, o ile szybszy jest Crystalwell niż pamięć RAM DDR3-2133. Czytanie jest zauważalnie szybsze: 47396 MB/s wobec 33101 MB/s. Opóźnienie jest krótsze: 35,6ns vs 47,1ns. Korzystanie z szybszej pamięci RAM nie zmniejszy tego opóźnienia. Wielokrotnie udowodniliśmy, że efektywne częstotliwości przekraczające parametr 2133 MHz można śmiało uznać za „kukurydziane” – tak pasjonaci nazywają piękne liczby, które jednak nie wpływają na końcowy wynik.

W przeciwnym razie test pamięci podręcznej i pamięci AIDA64 wykazał przewidywalną wydajność.

Test pamięci podręcznej i pamięci Intel Core i5-5675C

Przetwarzanie danych

Przy tej samej częstotliwości Broadwell, jak się dowiedzieliśmy, jest o 5-10% szybszy niż Haswell. Ale nowe rozwiązania 14 nm firmy Intel nie mogą pochwalić się wysokimi częstotliwościami. Jeśli nadal będziemy porównywać Core i5-5675C z Core i5-4690K, to drugi układ jest szybszy przy 400 MHz. I ta różnica może zneutralizować wyższość architektury Broadwell nad Haswell. W rzeczywistości dokładnie to dzieje się w wszechstronnym benchmarku SiSoftware Sandra 2014. W teście arytmetycznym Core i5-4690K przewyższa nawet Core i5-5675C.

Na uwagę zasługują również inne punkty. Po pierwsze, chip Broadwell okazał się szybszy niż flagowy ośmiordzeniowy AMD FX-8370. Po drugie, Core i5-5675C nie może konkurować z wydajniejszym i szybszym Core i7, który jest również wyposażony w technologię Hyper-Threading.

Wyniki testów Intel Core i5-5675C w SiSoftware Sandra 2014

Wyniki testów Intel Core i5-5675C w SiSoftware Sandra 2014

Ale w skrypcie 3Ds Max Core i5-4690K okazał się szybszy. Core i5-5675C był o 12% w tyle. Całkiem przyzwoite opóźnienie.

Wyniki testu Intel Core i5-5675C w 3Ds Max

Jak już się dowiedzieliśmy, w CINEBENCH R15 przy tych samych częstotliwościach Core i5-5675C jest o 6,2% szybszy niż Core i5-4690K. „Z własnymi” cechami, chip Broadwell już odgrywa rolę nadrabiania zaległości. To prawda, że ​​​​różnica między „kamieniami” jest minimalna - tylko 12 punktów. W ten sposób wyższe częstotliwości zmieniają obraz wydajności.

Wyniki testów dla Intel Core i5-5675C w CINEBENCH R15

We Fryrender architektura Broadwell przejęła również Haswell. Podczas ustawiania rzeczywistych częstotliwości procesorów centralnych różnica 5,5% zmniejszyła się do 3,7%: Core i5-5675C był szybszy niż Core i5-4690K.

Wyniki testu frytownicy dla procesora Intel Core i5-5675C

W LuxMark procesor Core i5-5675C o tej samej częstotliwości okazał się zauważalnie szybszy niż Core i5-4690K. Aż o 11,2%. Co zaskakujące, domyślnie różnica ta nie zmniejszyła się, a wręcz przeciwnie wzrosła do 13,6%.

Co ciekawe, wraz z grafiką, Core i5-5675C uzyskał wyższe wyniki niż 16-wątkowy Core i7-5960X, najszybszy jak dotąd procesor do komputerów stacjonarnych.

Wyniki testu Intel Core i5-5675C w LuxMark

Photoshop jest dobrym przykładem tego, kiedy nie ma sensu używać pamięci eDRAM. Core i5-4690K okazał się zauważalnie szybszy od układu Broadwell.

Wyniki testu Photoshopa dla Intel Core i5-5675C

Jak powiedziałem, Crystalwell może dać dobry wzrost wydajności w zadaniach związanych z pracą z danymi wolumetrycznymi. Przykładem takiego wzorca może być archiwizator. Wbudowany benchmark WinRAR pokazał bardzo dobry wynik. A w prawdziwym archiwizowaniu Core i5-5675C okazał się szybszy niż Core i5-4690K.

Wyniki testów dla Intel Core i5-5675C w WinRAR i 7Zip

Wyniki testu Intel Core i5-5675C w x264

Wydajność Core i5-5675C w aplikacjach jest na różnym poziomie w zależności od użytego oprogramowania. W niektórych programach chip 14 nm jest szybszy niż Core i5-4690K. W niektórych zastosowaniach, jak mówią, decyduje częstotliwość i dlatego wybucha 22-milimetrowy członek rodziny Devil's Canyon. Ale w rzeczywistości oba te procesory wykazują w przybliżeniu ten sam poziom wydajności. Z pewnymi wyjątkami.

Zależność od procesora

Wykorzystanie pamięci podręcznej czwartego poziomu w grach to kolejny scenariusz dla Core i5-5675C. Na przykład w 3DMarku 11 stół testowy z Broadwellem okazał się zauważalnie szybciej niż komputer z Core i5-4690K na pokładzie. Nowość zbliżyła się nawet do Core i7-4770K.

Ta sekcja dotyczy jednak innego tematu. W rozdzielczości WQHD, która przyzwoicie ładuje kartę graficzną GeForce GTX 780, różnica częstotliwości między Core i5-5675C a Core i5-4690K nie ma wpływu. Poziomy FPS są mniej więcej takie same. Wręcz przeciwnie, w niektórych grach stoi przed nami stoisko z kryształem Broadwell. Chociaż różnica jest minimalna – tym razem. Po drugie, nowa wersja sterownika mogła wpłynąć na efekt końcowy.

Wyniki testów Intel Core i5-5675C w grach

W rezultacie możemy śmiało stwierdzić, że Core i5-5675C, jeśli jest używany w komputer do gier, sdyuzhit. Jednak rozwiązania Haswell Refresh, moim zdaniem, wyglądają korzystniej ze względu na wyższą częstotliwość. Na tle procesorów Intela tylko „kamienie” AMD działają jako ewidentni maruderzy.

Zintegrowana grafika Iris Pro 6200

Wiele słów powiedziano o zintegrowanej grafice Iris Pro 6200. Czas ocenić wydajność tego rozwiązania. Zwłaszcza, że ​​AMD niedawno wypuściło A10-7870K APU, który ma podkręcony procesor graficzny Radeon R7.

W GTA V, przy minimalnych ustawieniach jakości grafiki, udało nam się uzyskać całkowicie grywalny poziom FPS nawet w rozdzielczości Full HD. Ale w Far Cry 4 i Wiedźmin 3 w 1080p nie możesz już grać.

Iris Pro 6200 i Far Cry 4

W Far Cry 4 i Wiedźminie 3 rozwiązanie AMD okazało się szybsze. Jednak w Full HD w obu przypadkach było to nie do odtworzenia. Moim zdaniem obsługa sterowników wpłynęła na te gry. Teoretycznie producent dyskretnych kart graficznych (mówię o AMD) powinien aktualizować swoje oprogramowanie o nowe aplikacje. Jednak w GTA V zarówno w 720p, jak i 1080p to Iris Pro 6200 miał więcej FPS.

Iris Pro 6200 i nowe gry

Iris Pro 6200 zdołał zdobyć ponad 3000 „papug” w teście 3DMark 11 (tryb wydajności). AMD A10-7870K jest w tym tak szybki aplikacja syntetyczna nie może się pochwalić.

W niektórych grach Iris Pro 6200 wyraźnie wyprzedza Radeona R7. Na przykład w nieskończonym Bioshock różnica FPS sięga 23,9% w 720p i 27,6% w 1080p.

Iris Pro 6200 i gry

Iris Pro 6200 i gry

Cóż, wydajność Iris Pro 6200 jest niesamowita. Zwłaszcza na tle HD Graphics 4600, zaimplementowanego w desktopach Haswell. W niektórych przypadkach współczesne gry osiągnęły całkowicie grywalny poziom FPS nawet w rozdzielczości Full HD. Nawet przy wysokich ustawieniach jakości grafiki. Ale najciekawsze jest to, że rdzeń Iris Pro 6200 okazał się szybszy niż zintegrowana grafika A10-7870K. Wygląda na to, że teraz AMD przegrało kolejny argument w konfrontacji z Intelem. Z kolei najtańszy Broadwell (czyli Core i5-5675C) kosztuje 276 USD. AMD A10-7870K kosztuje 137 USD, czyli o połowę mniej.