Broadwell haswell сравнение. Колонка редактора: почему новые процессоры Intel Broadwell и Skylake для настольных ПК не будут заметно быстрее Haswell. Когда выйдет Broadwell


Серьезного обновления в ряду настольных процессоров Intel не было уже давно, с 2013 г. Да, в 2014 г. вышел Haswell-E с поддержкой DDR4, но, по сути, кроме увеличенного числа ядер и слегка обновленной платформы, ничего нового в нем не было. Вообще, LGA 2011 в любых своих проявлениях - удел мощных рабочих станций, где, в первую очередь, обращают внимание на производительность в ограниченном кругу приложений, а о тепловыделении, энергопотреблении и стоимости думают во вторую-третью. Для рядового пользователя начинка ПК одинаково важна со всех сторон, и платформа LGA 1150 в течение последних трех лет была оптимальным выбором: богатый ассортимент процессоров и системных плат, умеренная цена, скромное энергопотребление. Фактически, золотая середина. Но нужно двигаться вперед.

Под «движением вперед» подразумевался переход на 14-нм техпроцесс со всеми его приятными последствиями: меньше площадь кристалла, ниже энергопотребление (и тепловыделение), выше тактовые частоты. Однако с самого начала дело не заладилось. То возникали проблемы с транзисторами, то появлялся большой процент брака.
На протяжении года в новостных лентах проскакивали обрывочные сведения, но не было никакой точной и достоверной информации. Даже те, кто не собирались менять начинку ПК сразу после выхода очередного семейства процессоров, ожидали появления новинок. Исключительно из интереса к результату столь продолжительных стараний.
В обязательном порядке стоит упомянуть десктопные модели на базе ядра Broadwell, которые как-то быстро промелькнули в новостных лентах в июле 2015 г. и пропали.
Сам я на первых порах чуть было не принял эти процессоры за долгожданную обновку, изрядно удивившись сохранению процессорного разъема (и типа оперативной памяти заодно) при 14-нм техпроцессе и нестандартном ядре. Ведь Intel хлебом не корми, дай только новой платформой пользователя озаботить, а поди же ты, третье поколение - и все 1150. Но нет, Broadwell (или, точнее говоря, Broadwell-DT) были скоротечным промежуточным звеном между двумя поколениями, больше ориентированным на мобильный сегмент, нежели на настольный. Как следствие, повышенный интерес к ним испытывают желающие получить преимущества мобильных решений, сохранив десктопный формат компьютера.
Долгожданный выход на рынок новинки на ядре Skylake состоялся в конце лета 2015г.

Здесь необходимо заметить, что тот Skylake, что сокетирован, правильнее называть Skylake-S, потому что есть и другие версии Skylake - U, Y и H, рассчитанные на установку в мобильных системах и выпускаемые в BGA упаковке.

Всего в сокетированное семейство Skylake-S входит 20 моделей процессоров с TDP от 35 до 91 Вт. Узнать их в прайс-листах очень просто - в маркировке первая цифра будет 6. Количественные характеристики изменились незначительно: количество ядер - от двух до четырех, частота - от 2,2 до 4 ГГц, кеш L3 - от 3 до 8 Мбайт.

Компания Intel по-прежнему оставляет решения с шестью и более ядрами для высокопроизводительной платформы LGA 2011, что является оправданным решением. В повседневной работе толку от высоких тактовых частот больше, чем от увеличения числа потоков (которое напрямую зависит от количества ядер). Так что четыре ядра, раскачанные технологией Hyperthreading до восьми потоков, в настоящее время можно считать оптимальным значением для «бытовых нужд».

Skylake-S выпускается под платформу LGA 1151, выполненную на базе системной логики 100-й серии: Z170, H170, H110, B150, Q170 и Q150. Обилие чипсетов обусловлено разным набором функций, используемых в различных областях. Энтузиастов, оверклокеров и стремящихся к самому-самому совершенному, заинтересует Z170, а вот Q170 и H170 лишены некоторых возможностей Z170, их удел - «простые» высокопроизводительные компьютеры.

Чипсеты B150 и H110 рассчитаны на системы начального уровня, из-за чего часть линий PCI-E отсутствует. Общие для 100-го семейства нововведения: шина DMI третьей версии для общения процессора с PCH, PCI Express за номером 3.0, десять USB 3.0 вместо прежних восьми, десять линий PCI Express (в топовых версиях чипсета).

Ситуация с оперативной памятью интересная: решения Skylake-S поддерживают как DDR3, так и DDR4, но пока о DDR3 в отношении LGA 1151 как-то забыли. Полагаю, дело в маркетинговой составляющей и малой распространенности бюджетных решений под новый процессорный разъем.
Однако, фактически, DDR3-2400 ничем не уступает DDR4-2400, а стоит дешевле при том же объеме. Некоторые аналитики предрекают массовый переход на DDR4 в течение 2016–2017 гг., но мы-то знаем, что реальная картина совсем иная.
Учитывая распространенность платформ с DDR3 памятью и отсутствие скачкообразного роста производительности в настольном сегменте, еще в течение четырех-пяти лет третья версия будет активно использоваться.
Больше всего нововведений в самом процессоре. Как явствует из предыдущего абзаца, по соседству с контроллером DDR3 установлен DDR4. Выросло число операций, исполняемых за такт, повысилась пропускная способность кольцевой шины данных и кеша L3, увеличились внутренние буферы. Все это, по заверениям Intel, обеспечивает рост производительности по сравнению с Haswell при прочих равных условиях, но нужна хорошая оптимизация програмного обеспечения, чтобы раскрытить все преимущества.
Проще говоря, сразу Skylake-S не выстрелит, надобно подождать адаптации кода ПО.
Важное нововведение для оверклокеров: контроллер питания выведен из ядра процессора и больше не ставит палки в колеса при разгоне. Минус решения - удорожание системных плат вследствие необходимости организовывать систему питания. Здесь палка о двух концах: на бюджетных решениях не к чему городить мощный конвертер, и тогда наценка будет незаметна. А для оверлокерских моделей можно не скупиться и поставить на них ставить сложные преобразователи с большим запасом по мощности, за что можно просить серьезные деньги.

Видеоядро, теперь называющееся Intel HD 530, состоит из 24 блоков. Полностью аналогичное по архитектуре GT2 в Haswell - которое HD Graphics 4600 - насчитывало 20 блоков. В распоряжении Intel есть куда более производительное и совершенное с технологической точки зрения GT3e, применяемое в Broadwell. Но чтобы исключить взаимную конкуренцию процессоров в системах без дискретной
видеокарты, решено было установить в Skylake-S чуть более раскачанное GT2.

Исследование производительности процессоров Core i5-6600K и i7-6700K, предоставленных компанией Intel, производилось на системной плате ASUS Z170 Pro Gaming, основанной на топовой версии системной логики. Для сравнения были взяты четыре процессора: Core i5-4770K, один из топовых для платформы LGA1150 на архитектуре Haswell, Core i5-5775C, один из немногих сокетированных Broadwell,
и Core i7-5930K, устанавливаемый на платформу LGA 2011v3.

Такой набор из практически топовых решений на Haswell, Haswell-E, Broadwell-DT и Skylake-S позволит оценить производительность платформ в повседневных приложениях. Особенно стоит отметить, что данное сравнение показателей носит общий характер и не отвечает на вопросы вроде «насколько быстрее HD 530 относительно HD 4600?» и «сколь велик разгонный потенциал i7-6600K относительно i7-4770K?». Без сомнения, ответы на них интересны, и с вышеназванной четверкой можно провести множество других тестов, позволяющих понять нюансы работы того или иного процессора в разных условиях. Сваливать все в один материал - не лучшее решение; гораздо разумнее идти от общего к частному, а не пытаться объять все на десятке страниц печатного текста.

На роль тестовых приложений максимально привлекались реальные программы, а минимально - синтетические бенчмарки, а именно, PCMark 8 и LuxMark 2.0. Остальные шесть - часто используемые в работе приложения и бенчмарки на их движке.

В Adobe After Effects CC 2015 измерялось время наложения спецэффектов на отрезок видео, в Adobe Photoshop CS6 - время наложения фильтров на снимок высокого разрешения.

В Autodesk 3ds Max 2016 вычислялось количество отрисованных кадров при использовании рендера V-Ray, в MediaCoder x64 0.8.36 - время сжатия кодеком x264 MPEG2 видеоролика. В 7-Zip и Cinebench R15 использовались встроенные тесты замера производительности.


Уже с первого же взгляда на баллы в тесте PC Mark 8 становится понятно, что никакой конкретики по процессорам он не дает, вся четверка на одном уровне, разница
лишь в пределах погрешности. На других графиках ситуация понятнее.

Так, After Effects очень положительно относится к многоядерным процессорам с высокой тактовой частотой. Та же зависимость прослеживается в LuxMark. Всю пользу
от платформы LGA 2011v3 иллюстрируют Cinebench, 3ds Max, 7-Zip, Photoshop, MediaCoder x64. Добавление двух ядер при сравнительно невысокой для данного класса процессоров частоте - 3,5 ГГц - приводит четырехъядерные модели к опережению по результатам на треть и более. Наглядный ответ на вопрос о предназначении 2011-й платформы в целом. Четыре канала памяти дают некоторый плюс, но по сравнению с двухканальным режимом он малозаметен, 1–3% в зависимости от приложения.


Результаты, продемонстрированные Core i5-6600K, неоднозначны: в Photoshop, MediaCoder x64, 3ds Max он идет практически вровень с i7-4770K, а в After Effects, 7-Zip и Cinebench значительно отстает от него. Причина такого поведения заключается в непонятном мне решении Intel оставить 6600K без технологии Hyper-threading, хотя это один из двух топовых процессоров в линейке Skylake-S.
Производительнее только i7-6700K, у которого и частота выше на 400 МГц, и Hyper-threading наличествует. Плюсы от высокой тактовой частоты и обновленного ядра хорошо видны на графиках: среди четырехъядерников 6700K везде первый, уступает только плотнее укомплектованному ядрами 5930K.
Результаты i5-5775C представляются странными: то чуть ли не последний (After Effects, MediaCoder), то идет на уровне с 4770K, несмотря на 3,3 ГГц тактовой частоты (7-Zip, Photoshop), а кое-где даже обгоняет его (Cinebench R15, 3ds Max)! Дело в том, что при схожей с Haswell архитектуре были увеличены внутренние буферы, улучшен алгоритм предсказания ветвлений, добавлены ускоренные операции умножения и деления, появился дополнительный кеш L4 объемом 128 Мбайт (так называемая eDRAM), используемый встроенным видеоядром как видеопамять при отсутствии дискретной видеокарты. Распространенное в мобильном сегменте решение, ничего кардинально нового. И да, Hyper-threading не отключен. Фактически, это те результаты, которые должен показывать Skylake-S на 3,3 ГГц. Поэтому на 6ххх и не поставили новое ядро Iris Pro 6200: при текущих раскладах заинтересованная в 5775C и 6600K аудитория не так сильно пересекается.

Последний график демонстрирует энергопотребление процессора в трех режимах: простой, кодирование видео кодеком x264 и стресс-тест программой LinX. Замерялось
потребление только процессора, без влияния видеокарты, накопителей и потерь в блоке питания. На графике хорошо видны плюсы от перехода на 14-нм технологию: энергопотребление при сильной загрузке уменьшилось на 24 Вт и при слабой - на 2 Вт. Шестиядерный процессор прожорлив соответственно своим вычислительным способностям даже в режиме покоя.

Итог таков: обе 14-нм новинки, выпущенные Intel в 2015 г., интересны каждая по-своему. Broadwell-DT в целом и Core i7-5775C в частности могут приглянуться тем,
кому нужна шустрая и экономичная платформа без особых графических мощностей. А Skylake-S в данный момент выглядит хорошим преемником Haswell: снижено энергопотребление, множество полезных (пусть и не фундаментальных) доработок в ядре, сохранены тактовые частоты.

Все приведенные графики красноречиво свидетельствуют в пользу новинки. Не стоит забывать, что платформа LGA 1151 еще находится на старте, а потому выглядит непривлекательно рядом с LGA 1150: комплектующих мало и они дороги (системные платы с памятью типа DDR4, в первую очередь), а также не введены оптимизации в программный код приложений для использования всех новшеств Skylake.
Следовательно, практически нет никакого смысла переходить с сопоставимых по классу процессоров Haswell на Skylake, разве что очень хочется побыстрее заполучить
новинку, да и денег не жалко. В будущем же замена LGA 1150 на LGA 1151 начнет приобретать смысл.


Архитектура Broadwell | Введение

Intel скрупулёзно документирует все новшества, которые реализует в своих процессорах с каждым новым поколением – об э том хорошо известно всем, кто интересуется индустрией CPU. Эту стратегию компания называет "тик-так" ("тик" – это сокращение размеров узла с целью вместить больше транзисторов на одном кристалле, а "так" – значительное обновление архитектуры). Это цикл повторяется каждый год. "Так" – это выпуск процессора Haswell На основе техпроцесса 22 нм, а теперь перед нами "тик" – сокращение площади кристалла в процессоре Haswell до 14 нм, что фактически и есть новый Broadwell .

Если вам эта стратегия уже знакома, вы должны понимать, чего мы ждём от архитектуры Broadwell – более компактных процессоров, пониженного энергопотребления, более высокой производительность на ватт мощности, а также общую производительность, сопоставимую с решениями предыдущего поколения. Так что новый продукт в этом смысле – не достижение, а демонстрацией постоянства компании в производстве решений в разрезе нескольких поколений. Но, конечно, многих может удивить, что на каком-то этапе такой последовательности появились процессоры Haswell-Y, TDP которых достаточно низок для того, чтобы использовать его в корпусах толщиной 9 мм с пассивным охлаждением. Это совершенно новая область применения для бренда Intel Core. Но об этом позже, сначала нужно рассказать о более значительном событии – появлении процессорного узла 14 нм.

Архитектура Broadwell | Узел 14 нм: второе поколение FinFET

Может показаться логичным, что нумерация моделей процессорных узлов обозначает размер (22 нм или 14 нм). Хотя это было так в случае предыдущего поколения (размер соотносился с самым малым компонентом транзистора – обычно затвором), сейчас в номенклатуре решений Intel это не отражено.

Современные узлы получают наименования на основе соотношения физического размера узла к размеру узла предыдущего поколения. То есть, если сравнить узел 22 нм с узлом 14 нм, то станет понятно, что расстояние между плавниками транзистора уменьшилось с 60 нм до 42 нм, расстояние между границами соседних затворов – c 90 нм до 70 нм, а минимальное расстояние между слоями внутрисхемных соединений – с 80 нм до 52 нм. Ячейка памяти SRAM, занимавшая на узле 22 нм до 108 нм2, в 14-нанометровом узле занимает 59 нм2.

Размеры компонентов по сравнению с предыдущим поколением узлов имеют различные коэффициенты миниатюризации – от 0,70 (расстояние между плавниками) до 0,54 (площадь ячейки SRAM). Если взять число 22 и умножить на 0,64, получится примерно 14, так что можно сказать, что Intel применяет логичную номенклатуру для своего 14-нанометрового узла. Кстати, кристалл Broadwell-Y примерно на 63% меньше по площади, чем кристалл Haswell-Y.

22-нанометровые узлы Intel – первые продукты компании, использующие FinFET-транзисторы (также известные как Tri-Gate). 14-намнометровые узлы – это второе поколение узлов, использующее FinFET-транзисторы, характеризующиеся более высокой плотностью за счёт более близкого расположения плавников. Это, вкупе с более высокими и тонкими плавниками, повышает значение управляющего тока и оптимизирует производительность транзистора. Количество плавников в транзисторе снизилось с трёх до двух, что также способствует повышению плотности при снижении электрической ёмкости.

Конкуренты Intel в настоящий момент переходят с транзисторов MOSFET на FinFET, но Intel заявляет, что ей нет равных в масштабировании логического пространства. Основываясь на информации, полученной от TSMC и альянса IBM, и используя формулу масштабирования (расстояние между затворами, помноженное на шаг металлизации), Intel утверждает, что будущий узел 16 нм от TSMC не реализует никаких улучшений в области масштабирования логики по сравнению с 20-нанометровым узлом, что, по словам компании, отбросит конкурентов назад на пару поколений. Конечно, данная формула помогает определить только один параметр сравнения, но при этом будит в нас интерес к тому, что нового покажет 16-нанометровый узел от TSMC в следующем году. Также признаемся, что у нас есть опасения, что законы физики вмешаются в ход эволюции узлов, если литография сожмётся до размеров менее 10 нм, что, в свою очередь, поможет конкурентам догнать Intel. Но в настоящий момент законы Мура всё ещё работают.

Кратко коснёмся темы выхода пригодных кристаллов. Ни один производитель не блещет откровенностью, разговаривая на эту тему, но Intel немного приоткрыла завесу. В общем и целом, компания рассказала нам, что техпроцесс 22 нм обеспечивал самый высокий выход среди последних поколений узлов, а показатель выхода 14-нанометровых SoC Broadwell демонстрирует положительную динамику и находится в приемлемых рамках. Первые продукты на продажу уже прошли квалификацию, и их появления на рынке стоит ожидать в конце 2014 года.

То есть, все эти факторы обуславливают снижение объёма утечек, энергопотребения и стоимости в расчёте на транзистор, а общая производительность и производительность в пересчёте на ватт увеличились по сравнению с узлами предыдущего поколения. Нас это не удивило, но изменения крайне положительные, особенно если это обозначает, что такие технологии можно использовать в новых типах устройств. Это особенно актуально, если принять во внимание, в каких продуктах Intel будет использовать 14-нанометровые узлы. Один из них - Broadwell-Y, мобильный чип следующего поколения, о котором Intel рассказала достаточно подробно.

Архитектура Broadwell | Конвергированное ядро Broadwell


Intel утверждает, что показатель IPC в Broadwell будет, по крайней мере, не 5% выше, чем в Haswell. Это не такое уж значительное усовершенствование, но это нас и не удивляет, если вспомнить концепцию "тик-так" и то, к какой группе относится новая архитектура.

То есть, все основные усовершенствования достигаются за счёт увеличения возможностей имеющихся элементов процессора, а не за счёт разработки новых. Повышение плотности 14-нанометрового узла – это довольно успешный шаг, который также обеспечивает дополнительное пространство для добавления дополнительных транзисторов, что Intel и сделала: в новой архитектуре выросло число записей планировщика внеочередного исполнения команд (о том, насколько оно выросло, Intel не сказала), что обуславливает более быстрый процесс перенаправления для загрузки. Буфер ассоциативной трансляции (TLB) второго уровня вырос с 1 тыс до 1,5 тыс записей, добавился новый буфер для страниц по 1 Гбайт на 16 записей. На второй странице буфера TLB имеется обработчик страничного нарушения, так что переход со страницы на страницу может осуществляться в параллельном режиме.

Умножитель с плавающей запятой теперь функционирует намного эффективней и способен выполнять за три такта задачи, которые Haswell мог обрабатывать за пять. В Broadwell также возросла скорость векторных вычислений. Intel уверяет, что алгоритмы предсказание ветвления также улучшены.

Кроме общих параметров, в новой архитектуре уделено внимание улучшению некоторых специфических характеристик, в том числе инструкций для ускорения шифрования, как и время исполнения операций виртуализации. Конечно, основной задачей Intel является снижение энергопотребления, так что компания использовала дополнительные транзисторы только для функций, которые не предполагают значительного повышения энергопотребления. Об этом мы подробнее узнаем в следующих разделах статьи.

Архитектура Broadwell | Broadwell-Y: представляем процессор Intel Core M

Новый 14-нанометровый узел подходит для использования в различных сегментах рынка – от ЦОДов до планшетов, в зависимости от количества кристаллов Broadwell . На момент написания статьи у нас была информация только о Broadwell-Y, хотя усовершенствования архитектуры Broadwell буду отражены и в других решениях. Мы рассмотрели Broadwell-Y под именем Intel Core M.

Новый бренд Core M будет использоваться во всех новых мобильных решения, в то время как бренды Celeron и Pentium M не будут иметь отношения к с SoC Broadwell-Y. Характеристики указывают на то, что такого чипа мощностью 3 Вт или 5 Вт будет достаточно для работы в устройствах толщиной от 7 до 10 мм с пассивным охлаждением и дисплеем диагональю 10,1 дюйма. Мы даже повертели в руках прототип довольно привлекательного планшета толщиной 7 мм, но не смогли запустить какое-либо приложение или посмотреть спецификации помощью панели управления. Пришлось принять на веру заявление Intel, что Broadwell-Y "обеспечивает более чем двукратное снижение TDP, имея более высокую производительность, чем Haswell-Y".

Чип Broadwell-Y имеет площадь 82 мм2, почти на 63% меньше, чем у Haswell-Y (130 мм2). Что касается размеров платы, площадь её у Broadwell-Y на 50% меньше, а толщина – на 30% меньше, чем у Haswell-Y. Сокращение размеров было осуществимо за счёт перемещения 3DL-модулей на небольшую отдельную PCB, прикреплённую снизу платы чипа Broadwell-Y. Конечно, в этом случае в материнских платах должен быть подходящий разъём.

Так как масштабирование площади у чипа 14 нм получилось более эффективным, чем ожидалось, Intel смогла распаять на плате на 20% больше транзисторов, что обеспечивает более широкий набор функций и более высокую производительность. Например, интегрированный графический модуль на Haswell-Y имеет максимум 20 регистров AU, в том время как Broadwell-Y может использовать до 24. Это означает 20%-ый прирост вычислительных ресурсов, к тому же Intel утверждает, что также на 50% увеличилась частота устройства стробирования. Кроме этих усоврешенствований, Intel упоминает об улучшениях геометрии, толщины и показателей скорости заполнения пикселя, которыми чип обязан изменениям архитектуры, хотя подробности об этом неизвестны. Также в ходе анонса продукта было сказано о поддержке 4K-дисплеев, притом на данный момент известно о поддержке теоретически двух существующих дисплеев. Имеет ли это смысл, учитывая ограничения мобильных устройств по питанию, неясно.

Архитектура Broadwell | Intel Core M: главное – низкое энергопотребление

Intel утверждает, что оптимизации, реализованные в Broadwell-Y, снижают потребление энергии вдвое по сравнению с Haswell-Y и позволяют обойтись без активного охлаждения. Потенциаль снижения энергопотребления в масштабе SoC, по сведениям, распределился таким образом: энергопотребление на 25% ниже благодаря снижению электрической ёмкости, на 20% - благодаря более низкому напряжению в сочетании с оптимизациями чипа, до 15% - благодаря повышенной производительности транзисторов на низких напряжениях, на 10% - благодаря меньшим утечкам питания и более маленьким размерам и повышенной плотности транзистора. Конечно, Intel не раскрыла подробностей о точных TDP продуктов, к которым относится данная статистика, так что нам придётся немного подождать. Мы знаем, что чипы, о которых говорит Intel, при загрузке показывают скачок потребления от 10 Вт до 15 Вт, а затем, через несколько милисекунд, потребление энергии снижается до 3-4 Вт при стабильной работе под нагрузкой.

Broadwell-Y также использует улучшенный интегрированный регулятор напряжения (FIVR) второго поколения, который способствует ускорению перехода чипа из состояния низкой частоты в простое в состояние под нагрузкой. FIVR имеет функцию нелинейного снижения частоты и поддержку нового режима FIVR-LVR. Оказывается, FIVR не особенно эффективен при очень низких напряжениях, так что его можно отключить, если необходимо сэкономить энергопотребление.

SoC также реализует ряд оптимизаций для активного энергосбережения: оптимизации техпроцесса, которые позволили снизить минимальное рабочее напряжение и динамическую электрическую ёмкость (Cdyn), изменения в архитектуре графики DDR/IO/PLL/Graphics, оптимизации Cdyn in IA/Graphics/PH и более низкие диапазоны рабочей частоты для IA/GT и кэша. Графикой можно управлять через Duty Cycling Control (DCC), чтобы снизить энергопотребление, а также её можно просто включать и отключать, если нужно. Время задержки при отключении GPU совсем небольшое, а его частота может быть понижена до 12,5% нормальной рабочей частоты.

Частота, конечно, привязана к потребляемой энергии и тепловой мощности. Имеются три порога энергопотребления, призванные обеспечивать максимальную частоту при сохранении стабильности системы. PL3 – максимально допустимый уровень, ограниченный защитой от перегрузки батареи, который можно использовать непродолжительное время. PL2 – стандартный пиковый уровень, а PL1 предназначается для длительного применения при устойчивом уровне потребления энергии и стабильности системы. При необходимости функция троттлинга может включать и выключать блоки процессора, чтобы минимизировать потребление энергии и тепловыделение.

В Broadwell реализована система управления питанием и тепловыделением, оценивающая показатели множества компонентов, а драйвер Intel контролирует потребление энергии различными компонентами.

PCH также получил некоторые изменения, направленные на повышение эффективности. Потребление энергии в простое снижено на 25% по сравнению с продуктами 2013 года, а энергопотребление в активном состоянии теперь ниже на 20% в сравнении с PCH-LP Haswell. Средства мониторинга и отчётности по снижению энергопотребления реализованы на уровне устройства, прошивки и соответственного программном обеспечении.

Кроме это, PCH дополнен функцией Audio DSP, которая имеет больше памяти SRAM и более высокий показатель скорости обработки инструкций (MIPS). Постпроцессинг был усовершенствован, включая поддержку функции wake-on-voice. В процессоре также реализованы новые возможности управления и безопасности. Стоит отметить, что PCH использует 22-нанометровый узел, и размер остался прежним в сравнении с предыдущим поколением.

Архитектура Broadwell | Первые тесты

Мы смогли оценить возможности Core M-5Y70 (Broadwell-Y, TDP 4,5Вт) в корпусе планшета без вентилятора и сравнили его с Atom Z3740D (Bay Trail, TDP менее 4 Вт). Без лишних слов перейдём непосредственно к результатам.

3DMark показал почти трёхкратный прирост скорости у Core M-5Y70. Любопытно, что прирост коснулся не только графической производительности, но и вычислений, исполняемых на CPU.


Тесты SunSpider и Cinebench также прекрасно демонстрируют сильные стороны Core M. В данных тестах новый процессор Broadwell при пониженном энергопотреблении в два с половиной раза быстрее Bay Trail.

Сравнение Core M (Broadwell-Y) с Atom (Bay Trail) может показаться несправедливым. С точки зрения это действительно так: процессор Core M сам по себе стоит примерно $300, а за такие деньги можно купить целый планшет на базе Atom – например, Dell Venue 8 Pro. Ожидается, что стоимость планшетов или трансформеров на базе Core M будет приближаться к $1000. Кроме того, максимальный объём оперативной памяти платформы Bay Trail ограничен 2 Гбайт, протестированный же Core M оснащается 4 Гбайт ОЗУ, и вполне возможно, что данный фактор мог в значительной степени сказаться на результатах.

Однако с точки зрения функциональности сравнение этих двух процессоров имеет свою логику, ведь в планшетах x86 под Windows толщиной менее 8 мм из-за ограниченного пространства внутри корпуса Haswell-Y не может быть полноценным конкурентом. Чипы Atom на базе Bay Trail – это лучшее, что было до Core M в этом сегменте, и прирост производительности, который демонстрирует Broadwell-Y в тонких и лёгких планшетах, просто поразителен. В этом классе планшетов лидирующую позицию по производительности занимал Apple iPad, но, похоже, с появлением Core M ситуация вполне может измениться.

Говоря про iPad, хочется отметить, что прототип планшета Llama Mountain от Intel с экраном диагональю 12,5 дюйма и весом 685 г напомнил нам знаменитый планшет из Купертино, только экран у образца Intel побольше.

Intel представила три демонстрационных модели: одну в алюминиевом корпусе, одну из позолоченного алюминия и одну с медным покрытием. Эти прототипы использовались для тестирования теплового пакета Core M, и, по словам представителей компании, новые процессоры Broadwell-Y способны сохранять приемлемую температуру во всех трёх версиях корпуса. В тестах производительности разницы между ними мы не заметили.

При обсуждении вопроса тепловыделения, Intel упомянула, что OEM-производители получат возможность настраивать TDP всех процессоров Core M на трёх уровнях: 3 Вт, 4,5 Вт или 6 Вт. Таким образом, производители смогут адаптировать продукты под конкретные сценарии использования. Например, TDP топового Core M 5Y70 можно установить на значение 3 Вт, чтобы максимально увеличить время автономной работы платформы. С другой стороны, в корпусе с активным охлаждением можно установить TDP 6 Вт для повышения отзывчивости устройства (следует пояснить, что решение в режиме 6 Вт не обязательно требует наличия вентилятора, с ним сможет справиться и более толстый корпус, более эффективно рассеивающий тепло).

Хотя мы приветствуем разнообразие, должны предупредить, что теперь модельный номер процессора не гарантирует установленный уровень производительности. Core M-5Y70 в режиме TDP 3 Вт определённо будет медленнее, чем аналогичный процессор с тепловым пакетом, повышенным до 6 Вт. Кроме того, более дешёвый Core M-5Y10 с TDP 6 Вт почти наверняка обгонит топовый Core M-5Y70 в режиме 3 Вт.

Intel даёт веские основания предполагать, что OEM-производители будут применять к новым процессорам те значения TDP, которые выгодны с маркетинговой точки зрения. Возможно, это и так, но дело в том, что с появлением новых процессоров Core M конкретные модели планшетов или устройств-трансформеров могут работать быстрее или медленнее в зависимости от решения производителя, а не только характееристик выбранного им процессора. В будущем между двумя устройствами с процессорами одной модели разница в производительности и функциональность может быть очень значительна.

На изображении выше, вы можете увидеть, насколько мала в размерах платформа Llama Mountain. Даже при подключённой дочерней платой на удивление компактная комбинация двух PCB весит чуть больше 90 грамм.

Помимо показателей тестов, нам на практике продемонстрировали разницу в производительности между двумя устройствами без активного охлаждения . В качестве образцов использовались недавно объявленный планшет Lenovo Helix с чипом Core M-5Y70 (подключён к монитору с правой стороны) и планшет на базе Atom Z3740 (слева).

Тесты производительности в реальных приложениях соответствую показателям синтетических бенчмарков, то есть заметную разницу в производительности между Atom и Core M. В будущем мы хотим протестировать новый процессор Intel и процессоры Haswell-Y с тепловым пакетом 11,5 Вт. Любопытно, сможет ли он догнать или даже обогнать предшественника, у которого TDP два раза выше.

Также нам продемонстрировали работу планшетов на базе Intel Moorefield . Moorefield – это платформа для чипов Intel Atom, оптимизированная для использования операционной системы Android. Ниже представлена видеодемонстрация реальной разницы в производительности между четырёхъядерной системой (слева) и восьмиядерной ARM A9 Cortex (справа):

Intel заявляет, что причина того, что их четырёхъядерный Atom обгоняет восьмиядерный A9 заключается в преимуществе решения Intel в плане количества инструкций, выполняемых за такт, а также в ограничениях ОС Android касательно эффективного распараллеливания задач.

Обратите внимание, что планшетом на базе Moorefield является модель Dell Venue 8 7000, которая была анонсирована на выставке IDF и оснащается двухкамерной системой Intel RealSense. Благодаря новому железу, планшет Dell получил интересные функции, например измерение размеров объектов на изображении. Все возможности Venue 8 7000 пока не известны, однако в теории двухкамерная система осуществлять трёхмерную съёмку.

Говоря об «апгрейде» вычислительных мощностей процессора, важно не забывать, что для Intel он не был первостепенной задачей. Рынок мобильных девайсов диктовал совсем другое требование - снижение энергопотребления. И если соотношение улучшений в производительности к необходимой энергии у Haswell составляло 1:1, то у Broadwell оно должно было быть 2:1. Естественно, это наложило свои ограничения на выбор «новшеств», которые Intel могла бы внести в дизайн архитектуры Broadwell. Более того, пришлось поработать и над уже имеющимся соотношением производительности к энергопотреблению. Грубо говоря, 5% улучшений в производительности обойдутся всего в 2,5% увеличения немедленного потребления энергии.

Компания продолжит оптимизацию энергопотребления не только для Intel Core M, но и для всех будущих продуктов Broadwell. Больше внимания будет уделяться отключению тех частей CPU, которые не используются и уменьшению потребления энергии различными блоками по мере необходимости. Эти доработки в совокупности с увеличением энергоэффективности от использования 14-нм техпроцесса - основные способы снижения потребления энергии в Intel Core M.

Улучшения в GPU

В целом принцип «тик-так» работает и для графической подсистемы процессоров Intel: значительные архитектурные изменения на стадии «так» и улучшения техпроцесса имеющейся архитектуры на стадии «тик». Но с одним отличием: обычно для GPU доработки на стадии «тик» гораздо существеннее, нежели для CPU. И Broadwell - не исключение.

Графическая подсистема Broadwell основана на Gen8 GPU - это продолжение архитектуры Intel Gen7, впервые появившейся в процессорах Ivy Bridge и доработанной версии Gen7,5 в Haswell. На фундаментальном уровне это тот же самый GPU, только более оптимизированный и «отшлифованный».

Модель Частота, ГГц Ядра, шт. L3, Мбайт TDP, Ватт Цена, $
Core i7-970 3.20 6 12 130 885
Core i7-980 3.33 6 12 130 583
Core i7-980X 3.33 6 12 130 999
Core i7-990X 3.47 6 12 130 999

реклама

Sandy Bridge-E

реклама

В 2011 году Intel кардинально сменила архитектуру процессоров, анонсировав ЦП Sandy Bridge. Тогда же разделение между моделями компанией было пересмотрено. Вместо разной частоты для убедительности ввели несколько градаций по числу активных ядер, объему кэш-памяти и энергопотреблению. По-прежнему использовалась 32 нм литография, поэтому число ядер не росло. Но из-за смены архитектуры удельная производительность существенно выросла. А раз сменилась архитектура, то понадобился новый разъем для CPU.

Начиная с 2011 года, можно праздновать появление сокета LGA 2011 в его первой версии. Кстати, параллельно с Sandy Bridge-E существовали серверные решения в виде Sandy Bridge-EP, содержащие от двух до восьми ядер и до 20 Мбайт кэш-памяти. Соединялись процессоры через шину QPI. В обыкновенной системе Sandy Bridge-E лишились такой возможности, им оставили только традиционный I/O DMI. Во всех CPU использовалась четырехканальная память DDR3 частотой до 1600 МГц. Площадь ядра составляла от 294 до 435 мм. Количество транзисторов в зависимости от степпинга – 1270-2270 миллионов.

Здесь уместно задать вопрос о столь большой разнице в физических характеристиках. Дело в том, что за два года Intel сменила аж три ревизии процессорного ядра. Изначально в десктопную версию попадали дезактивированные Sandy Bridge-EP С1. Чуть позже компания разделила дизайны на производстве, выпустив ревизию С2. Для самого маленького и наименее мощного i7-3820 использовалась ревизия М1. Поэтому-то мы и можем говорить о существовании целых трех поколений Sandy Bridge-E. Для ЦП были выпущены новые материнские платы на чипсете Intel Х79.

Обзоры в лаборатории:

  • Новое поколение Intel. Сравнительное тестирование i7-3930K и i7-3960X в 2D и 3D ;

реклама

Модель Частота, ГГц Ядра, шт. L3, Мбайт TDP, Ватт Цена, $
Core i7-3820 3.60 4 10 130 294
Core i7-3930K 3.20 6 12 130 583
Core i7-3960X 3.30 6 15 130 999
Core i7-3970X 3.50 6 15 150 999

Ivy Bridge-E

Ожидание новой серии процессоров тянулось с конца 2012 года. В определенный момент все уже решили, что Intel решила пропустить архитектуру Ivy Bridge и сразу перейдет на ядро Haswell. Сама компания лишь намекала на то, что Intel Х79 остается в строю и надо набраться терпения. Как следствие, модели Ivy Bridge-E вышли в свет лишь во второй половине 2013 года.

реклама

Никаких фундаментальных изменений в процессоре не произошло. Очередной «шринк» с 32 нм до 22 нм, казалось бы, должен увеличить удельную производительность и повысить частоты, но, увы, добавил только 100 МГц. Опасения насчет трехмерных транзисторов подтвердились при первых попытках разгона – новинки сильно нагревались и требовали повышенных напряжений. Зато для Intel выпуск Ivy Bridge-E стал чуть ли не самым удачным запуском.

Во-первых, площадь ядра десктопных версий была относительно маленькой (256 мм), количество транзисторов дошло до 1860 миллионов. Во-вторых, заменить Sandy Bridge-E в старой материнской плате на Ivy Bridge-E мог каждый желающий, благодаря одинаковому разъему LGA 2011. Впрочем, присущие Sandy Bridge-E проблемы совместимости и разгона памяти остались. Заявленная официальная частота поднялась до 1866 МГц, все что выше – чистая лотерея.

Обзоры в лаборатории:

  • Встречаем Ivy Bridge-E: обзор и тестирование процессора Intel Core i7-4930K .

реклама

Модели Ivy Bridge-E существовали и в серверном исполнении. Всего Intel создала три дизайна в зависимости от количества ядер.

Процессорный гигант - лидер среди всех чипмейкеров - продолжает реализовывать стратегию «тик-так», согласно которой каждый год (вот тут-то и появляются загвоздки - прим. автора) компания выпускает пакет решений, построенных на новой архитектуре. Под «тиком» подразумеваются процессоры, выполненные по старой архитектуре, но переведенные на новый техпроцесс. Под «таком» - чипы, выполненные по уже отработанным технормам, но с новой архитектурой. Центральные процессоры Broadwell - это именно «тик»-процессоры. Грубо говоря, Intel взяла архитектуру Haswell и поставила ее на 14-нм «рельсы». Хотя вы прекрасно понимаете, что все здесь условно. Каждое семейство чипов Intel претерпевает определенные изменения. И настольные Broadwell не являются исключением.

Поколение Год Техпроцесс «Тик» или «Так»?
Conroe/Merom 2006 65 нм Так
Penryn 2007 45 нм Тик
Nehalem 2008 45 нм Так
Westmere 2010 32 нм Тик
Sandy Bridge 2011 32 нм Так
Ivy Bridge 2012 22 нм Тик
Haswell 2013 22 нм Так
Broadwell 2015 14 нм Тик
Skylake 2015 14 нм Так

И все же новые 14-нанометровые решения можно смело назвать выстраданными. Дело в том, что при проектировании и производстве Broadwell в Intel столкнулись с серьезными проблемами. В итоге релиз был отложен больше, чем на год. Первые решения на архитектуре Broadwell были показаны еще на выставке IFA 2014 в сентябре прошлого года. Но это касалось исключительно систем-на-кристалле Core M, предназначенных для планшетов и ноутбуков. В итоге временной отрезок между появлением настольных версий Haswell и Broadwell составил приблизительно два года.

Прошлой весной Intel даже презентовала набор логики Z97/H97 Express, предназначенный как раз для Broadwell. Однако задержки с производством побудили компанию выпустить линейку процессоров Devil’s Canyon (Haswell Refresh). Получилось неплохо, ведь Intel представила свой первый в мире центральный процессор, функционирующий на тактовой частоте 4 ГГц. Так и было заполнено время в ожидании 14-нанометровых Broadwell. Парадокс заключается в том, что уже совсем скоро (предположительно, в конце августа) будет представлена линейка настольных центральных процессоров Skylake и платформы LGA1151.

Особенности архитектуры и технические характеристики

Настольные процессоры Broadwell были представлены на выставке Computex 2 июня. На данный момент есть пять моделей: две Core i7 и три Core i5. Также были представлены три Xeon под LGA1150: E3-1285 v4, E3-1285L v4 и E3-1265L v4. Литера C в названии означает два факта. Во-первых, эти решения имеют упаковку LGA. То есть мы имеем дело с классическими центральными процессорами, устанавливаемыми в гнездо LGA1150. Во-вторых, они оснащены разблокированным множителем, хотя Intel уже приучила нас к тому, что оверклокерские решения имеют в названии либо букву K, либо X. Есть предположение, что таким образом Intel сопоставляет Core i7-5775C с TDP, равным 65 Вт, не с 88-ваттным Core i7-4790K, но с 65-ваттным Core i7-4790S. Оно и понятно: в таком случае Broadwell-решение оказывается на 35% быстрее в x86-вычислениях, плюс обладает вдвое более производительной встроенной графикой.

R-процессоры имеют упаковку BGA, то есть намертво припаиваются к материнской плате. Очевидно, что эти чипы будут использоваться в уже готовых системах. Например, в моноблоках.

Ниже приведена подробная таблица с техническими характеристиками настольных процессоров Broadwell.

Intel Core i7-5775C Intel Core i7-5775R Intel Core i5-5675C Intel Core i5-5675R Intel Core i5-5575R
Число ядер/потоков 4/8 4/8 4/4 4/4 4/4
3,3 (3,7) ГГц 3,3 (3,8) ГГц 3,1 (3,6) ГГц 3,1 (3,6) ГГц 2,8 (3,3) ГГц
Разблокированный множитель Есть Нет Есть Нет Нет
Кэш третьего уровня 6 Мбайт 6 Мбайт 4 Мбайт 4 Мбайт 4 Мбайт
128 Мбайт 128 Мбайт 128 Мбайт 128 Мбайт 128 Мбайт
Контроллер памяти DDR3, двухканальный, 1333-1600 МГц DDR3, двухканальный, 1333-1600 МГц DDR3, двухканальный, 1333-1600 МГц DDR3, двухканальный, 1333-1600 МГц
Встроенное графическое ядро Iris Pro 6200 (GT3e), 1150 МГц Iris Pro 6200 (GT3e), 1100 МГц Iris Pro 6200 (GT3e), 1050 МГц
Уровень TDP 65 Вт 65 Вт 65 Вт 65 Вт 65 Вт
Упаковка LGA BGA LGA BGA BGA
Цена $366 $348 $276 $265 $244

Как я уже говорил, то, что процессор относится к поколению «тик», отнюдь не означает, что никаких изменений в архитектуре произведено не было. У Intel существует определенный подход. А именно внедряемое улучшение применяется только в том случае, если оно резко положительно сказывается на производительности - как минимум вдвое сильнее, чем вызванный этим рост энергопотребления.

Большинство микроархитектурных изменений сосредоточилось во входной части исполнительного конвейера. Точнее, были увеличены объемы буферных зон. Так, увеличилось окно планировщика. Ровно в полтора раза вырос объем таблицы ассоциативной трансляции адресов второго уровня (L2 TLB) - до 1500 записей. Плюс вся схема трансляции обзавелась вторым обработчиком промахов. Все эти изменения позволили процессорам Broadwell лучше справляться с предсказанием сложных ветвлений кода.

Скорость исполнения операций умножения увеличилась с пяти тактов до трех тактов. Операции деления ускорили темп за счет использования 10-битного делителя. Наконец, были оптимизированы векторные gather-инструкции из набора AVX2.

В итоге при одинаковой частоте архитектура Broadwell оказывается быстрее Haswell в среднем на 5%. Впрочем, сравнению производительности архитектур я посвящу целый параграф далее.

Фотография кристалла настольного процессора Intel Broadwell

Новые 14-нанометровые чипы обзавелись встроенным графическим модулем Iris Pro 6200. Уже было сказано, что он вдвое производительнее HD Graphics 4600. Встроенный GPU занимает львиную долю полезной площади кристалла. Однако основной фишкой, внедренной специально в том числе и для Iris Pro 6200, стало использование дополнительных 128 Мбайт памяти eDRAM. Технически она реализована при помощи распайки на стеклотекстолите еще одного кристалла. Таким образом, в Intel постарались решить проблему недостатка пропускной способности памяти. Кристалл eDRAM, выполненный по 22-нанометровой технологии, получил название Crystalwell. Хотя мы сейчас и говорим о нем применительно к встроенной графике Iris Pro 6200, но эту память смело можно назвать кэшем четвертого уровня. Отмечу, что eDRAM использовался в некоторых решениях поколения Haswell. Так что эту технологию нельзя назвать новой. При этом именно в настольных Broadwell использование Crystalwell становится стандартом де-факто.

Собственно говоря, ничего и не изменилось. Кэш, выполненный по 22-нм техпроцессу, функционирует со скоростью 1600 МГц. Он имеет 16-кратную ассоциативность и сообщается с CPU при помощи 256-битной двунаправленной шины. В итоге максимальная пропускная способность между eDRAM и процессором может достигать 102,4 Гбайт/с суммарно (по 51,2 Гбайт/с в каждую сторону). Использование Crystalwell в теории даст хороший прирост производительности в задачах, связанных с обработкой больших данных.

Intel Core i5-5675C

Как известно, Intel старается в каждом новом поколении настольных процессоров интегрировать в них все более и более производительную графику. У Sandy Bridge это была HD Graphics 3000 с 12 исполнительными устройствами, у Ivy Bridge - HD Graphics 4000 с 16 исполнительными устройствами. В настольные чипы Haswell в основном «устанавливалось» видео HD Graphics 4600 (вариант GT2 с 20 исполнительными устройствами). В некоторые модели (с BGA-упаковкой) внедрялась графика уровня HD Graphics 5000, Iris Pro Graphics 5100 или 5200 (GT3 и GT3e), располагающая 40 исполнительными устройствами. В настольные процессоры Broadwell, как мы уже выяснили, интегрирована графика Iris Pro 6200 - самая мощная на сегодняшний день вариация GT3e, оснащенная 48 исполнительными устройствами. При этом несколько изменилась их компоновка. Отныне в каждый отдельный блок GPU входит не 10 исполнительных устройств, но восемь. В одном графическом модуле находится три таких блока GPU. Например, в мобильных процессорах Core M используется графика GT2, которая имеет в своем арсенале один модуль на 24 исполнительных устройства.

Блок-схема встроенного графического ядра Iris Pro 6200

К нам в тестовую лабораторию прибыл образец под названием Core i5-5675C - возможно, самая ходовая модель среди всех, построенных на базе архитектуры Broadwell. «Камень» имеет четыре ядра, но не имеет поддержки технологии Hyper-Threading. Классическая ситуация для любого современного Core i5. Если сравнивать этот процессор с Core i5-4690K, вышедшим весной прошлого года, то сразу же обращает на себя внимание разница в скорости работы. Номинальная тактовая частота Core i5-5675C составляет 3,1 ГГц, которая может быть увеличена до 3,6 ГГц в режиме Turbo Boost. Core i5-4690K работает на 400 МГц быстрее, что может стать основополагающим в сравнении между этими кристаллами. Очевидно, что такая ситуация с тактовыми частотами обусловлена теми проблемами, с которыми пришлось столкнуться Intel при переходе на 14-нанометровый техпроцесс. Если бы настольные Broadwell вышли год назад, то тот же Core i5-5675C правильно было бы сравнивать с Core i5-4670K (3,4 (3,8) ГГц). Тогда разница в частоте ощущалась бы не так сильно.

Intel Core i5-5675C Intel Core i5-4690K
Кодовое имя Broadwell-C Haswell Refresh (Devil’s Canyon)
Техпроцесс 14 нм 22 нм
Сокет LGA1150 LGA1150
Поддерживаемы наборы логики Z97/H97 Express Z97/H97/Z87/H87/B85 Express
Число ядер/потоков 4/4 4/4
Тактовая частота (в режиме Turbo Boost) 3,1 (3,6) ГГц 3,5 (3,9) ГГц
Разблокированный множитель Есть Есть
Кэш третьего уровня 4 Мбайт 6 Мбайт
Кэш четвертого уровня (eDRAM) 128 Мбайт Нет
Контроллер памяти DDR3, двухканальный, 1333/1600 МГц
Встроенное графическое ядро Iris Pro 6200, 1100 МГц HD Graphics 4600, 1200 МГц
Уровень TDP 65 Вт 88 Вт
Цена $276 $242

Уменьшился и кэш третьего уровня. Казалось бы, с использованием 14-нм техпроцесса можно было, наоборот, его увеличить. Однако интеграция Crystalwell, мощного встроенного GPU, да и, видимо, не такой высокий процент выхода годных чипов и так не в лучшую сторону сказались на итоговой стоимости настольных Broadwell. Они заметно дороже моделей семейства Devil’s Canyon. Так вот, у Core i7 вместо 8 Мбайт теперь 6 Мбайт кэша третьего уровня. У Core i5 - 4 Мбайт вместо 6 Мбайт. Много это или мало? Например, у Core i3 тоже 4 Мбайт L3. Компенсируется ли такое уменьшение наличием 128 Мбайт eDRAM? Вряд ли. Кэш третьего уровня имеет латентность в размере приблизительно 20 тактов, плюс он оснащен шиной примерно вдвое более высокой частотой. Crystalwell попросту медленнее, существенно медленнее.

Скриншот CPU-Z центрального процессора Intel Core i5-5675C

Broadwell-процессоры с LGA-упаковкой совместимы с материнскими платами для платформы LGA1150. Но только с чипсетами девятого семейства, то есть с Z97/H97 Express. Решения на основе Z87 Express и иже с ним новых «камней» поддерживать не будут. Об этом стало известно еще год назад, однако все равно грустно. Отсюда получаем еще одно заключение: Настольные Core i7-5775C и Core i5-5675C, по всей видимости, станут последними решениями для этой платформы. Дальше наступит эпоха LGA1151, Z170 Express и Skylake-S с блэк-джеком и DDR4.

Кстати, о памяти. Настольные Broadwell оснащены стандартным двухканальным контроллером памяти DDR3-1333/1600. Здесь ничего нового нет.

Наконец, Core i5-5675C имеет TDP в размере всего 65 Вт. Скажем спасибо все тому же 14-нм техпроцессу и FinFET-транзисторам второго поколения, которые уменьшились в своих размерах на треть. В итоге площадь кристалла Broadwell составляет всего 167 мм 2 против 177 мм 2 у Haswell.

Что ж, вот, пожалуй, все, что необходимо знать о линейке настольных процессоров Broadwell. Плюсы и минусы подобных решений уже сейчас ясны. Остается только узнать, на что способен предоставленный нам образец Core i5-5675C.

Тестирование

Как мы уже выяснили, для работы с Core i5-5675C нужна материнская плата на базе чипсетов девятой серии. Только предварительно необходимо обновить BIOS материнской платы. Для начала предлагаю сравнить производительность архитектур Broadwell и Haswell. А уже затем определить уровень быстродействия всех компонентов Core i5-5675C: вычислительной части, встроенного графического ядра и контроллера памяти.

Тестовый стенд

  • Процессор: Intel Core i5-5675C
  • Процессорный кулер: ENERMAX LIQTECH 240
  • Материнская плата: MSI Z97 XPOWER AC
  • Видеокарта: GAINWARD GeForce GTX 780 Phantom GLH
  • Оперативная память: DDR3-2133, 2x 8 Гбайт
  • Накопитель: OCZ Vertex 3, 360 Гбайт
  • Блок питания: LEPA G1600, 1600 Вт
  • Периферия: Samsung U28D590D , ROCCAT ARVO, ROCCAT SAVU
  • Операционная система: Windows 8.1 х64

Сравнение производительности архитектур Broadwell и Haswell

Для сравнения архитектур я взял два процессора - Core i5-5675C и Core i5-4690K - и выставил для каждого их них одинаковую частоту 3 ГГц. Использовался идентичный тестовый стенд, в которую входил двухканальный набор памяти DDR3-2133.

Вот с «мозгов» и начнем. Как видите, особой разницы между Core i5-5675C и Core i5-4690K не наблюдается. Ничего удивительного: в процессорах используются одинаковые контроллеры памяти.

Результаты тестирования в AIDA64

Как мы уже выяснили, архитектура Broadwell теоретически должна быть быстрее Haswell приблизительно на 5%. В тесте CINEBENCH R15 так и вышло - разница составила 6,2%.

Результаты тестирования в CINEBENCH R15

Очевидно, что это правило будет действовать не всегда. Вот, например, в бенчмарке x264 FHD центральные процессоры продемонстрировали одинаковые результаты. А в известном приложении wPrime, используемым среди оверклокеров, впереди вновь оказался Broadwell.

Результаты тестирования в x264 FHD

Результаты тестирования в wPrime 1.55

В LuxMark при одинаковых частотах Core i5-5675C быстрее Core i5-4690K на 11,2%. Вот это уже серьезный прирост, на мой взгляд.

Результаты тестирования в LuxMark 2.0

И вновь решение на базе архитектуры Broadwell оказывается впереди. На этот раз в Fryrender. Разница составила ни много ни мало 5,5%.

Результаты тестирования в Fryrender

В WinRAR при архивировании тестового пакета Core i5-5675C справился со своей задачей быстрее Core i5-4690K на 6,8%.

Результаты тестирования в WinRAR

В LinX 0.6.5 процессоры продемонстрировали практически одинаковые результаты.

Результаты тестирования в LinX 0.6.5

Как видите, архитектура Broadwell не сможет покорить пользователей производительностью в х86-вычислениях. Да, в большинстве случаев (в пяти из семи) она действительно оказалась быстрее Haswell. Однако необходимо учитывать, что данное испытание носило экспериментальный характер. По факту Core i5-4690K работает на более высокой частоте, нежели Core i5-5675C. Плюс в некоторых приложениях прироста производительности не наблюдается вовсе.

С другой стороны, в этом нет ничего удивительного. Все же Broadwell - это «тик»-процессоры. Следовательно, как я уже говорил, изменений по сравнению с Haswell у них минимум.

Подсистема памяти и кэш

Контроллер памяти в Broadwell, может, используется и тот же, но гораздо интереснее узнать, как поведет себя кэш четвертого уровня. Тест кэша и памяти AIDA64 - очередное подтверждение тому, что Crystalwell вряд ли сможет стать «продолжением» кэша третьего уровня. Так, она заметно медленнее. Если у L3 чтение производится со скоростью 174 Гбайт/с, то L4 может похвастать лишь 47396 Мбайт/с. Разница громадная. При этом для кэша третьего уровня задержка составила приблизительно 7 нс, а для кэша четвертого уровня - 35,6 нс. То есть разница в быстродействии L3 и L4 очевидна.

Опять же тест кэша и памяти демонстрирует, насколько Crystalwell быстрее оперативной памяти DDR3-2133. Чтение производится заметно быстрее: 47396 Мбайт/с против 33101 Мбайт/с. Задержка меньше: 35,6 нс против 47,1 нс. Использование более быстрой оперативной памяти подобное отставание не сократит. Мы не раз доказывали, что эффективные частоты, превышающие параметр 2133 МГц, можно смело считать «кукурузными» - так энтузиасты называют красивые числа, не влияющие, тем не менее, на итоговый результат.

В остальном тест кэша и памяти AIDA64 продемонстрировал прогнозируемые показатели.

Тест кэша и памяти Intel Core i5-5675C

Вычисления

При равной частоте Broadwell, как мы успели выяснить, на 5-10% быстрее Haswell. Но новые 14-нанометровые решения Intel не могут похвастать высокими частотами. Если продолжить сравнивать Core i5-5675C с Core i5-4690K, то второй чип работает быстрее на 400 МГц. И эта разница может нивелировать все превосходство архитектуры Broadwell над Haswell. Собственно говоря, так и происходит в комплексном бенчмарке SiSoftware Sandra 2014. В арифметическом тесте Core i5-4690K даже опережает Core i5-5675C.

Примечательны и другие моменты. Во-первых, Broadwell-чип оказался быстрее флагманского восьмиядерника AMD FX-8370 . Во-вторых, Core i5-5675C не под силу тягаться с более производительными и быстрыми Core i7, оснащенными к тому же технологией многопоточности Hyper-Threading.

Результаты тестирования Intel Core i5-5675C в SiSoftware Sandra 2014

Результаты тестирования Intel Core i5-5675C в SiSoftware Sandra 2014

А вот в скрипте 3Ds Max быстрее оказался Core i5-4690K. Core i5-5675C уступил ему на 12%. Достаточно приличное отставание.

Результаты тестирования Intel Core i5-5675C в 3Ds Max

Как мы уже выяснили, в CINEBENCH R15 при одинаковых частотах Core i5-5675C быстрее Core i5-4690K на 6,2%. «При своих» характеристиках в роли догоняющего уже выступает чип Broadwell. Правда, разница у «камней» минимальная - всего 12 баллов. Вот так более высокие частоты меняют картину быстродействия.

Результаты тестирования Intel Core i5-5675C в CINEBENCH R15

В Fryrender архитектура Broadwell тоже взяла вверх над Haswell. При установке реальных частот центральных процессоров разница в 5,5% уменьшилась до 3,7%: Core i5-5675C оказался быстрее Core i5-4690K.

Результаты тестирования Intel Core i5-5675C в Fryrender

В LuxMark процессор Core i5-5675C при одинаковой частоте оказался заметно быстрее Core i5-4690K. На целых 11,2%. Что удивительно, в дефолте эта разница не уменьшилась, а, наоборот, увеличилась до 13,6%.

Интересен и тот факт, что вместе с графикой Core i5-5675C набрал больше баллов, чем 16-поточный Core i7-5960X - самый быстрый настольный центральный процессор на сегодняшний день.

Результаты тестирования Intel Core i5-5675C в LuxMark

Photoshop - наглядный пример, когда толку от использования eDRAM нет никакого. Core i5-4690K оказался заметно быстрее Broadwell-чипа.

Результаты тестирования Intel Core i5-5675C в Photoshop

Как я уже говорил, Crystalwell может дать хороший прирост производительности в задачах, связанных с работой с объемными данными. Примером такого паттерна может стать архиватор. Встроенный бенчмарк WinRAR продемонстрировала очень высокий результат. Да и при реальном архивировании Core i5-5675C оказался быстрее Core i5-4690K.

Результаты тестирования Intel Core i5-5675C в WinRAR и 7Zip

Результаты тестирования Intel Core i5-5675C в x264

Производительность Core i5-5675C в приложениях находится на разном уровне в зависимости от используемого ПО. В некоторых программах 14-нм чип оказывается быстрее Core i5-4690K. В некоторых приложениях, как говорится, частота решает, а потому вперед вырывается 22-нм член семейства Devil’s Canyon. Но по факту оба этих процессора демонстрируют приблизительно схожий уровень быстродействия. За некоторым исключениями.

Процессорозависимость

Использование кэша четвертого уровня в играх - вот еще один сценарий работы Core i5-5675C. Например, в 3DMark 11 тестовый стенд с Broadwell оказался заметно быстрее компьютера с Core i5-4690K на борту. Новинка даже вплотную приблизилась к Core i7-4770K.

Однако этот параграф посвящен другой теме. В разрешении WQHD, прилично нагружающим видеокарту GeForce GTX 780, разница в частоте между Core i5-5675C и Core i5-4690K не сказывается. Уровень FPS более-менее одинаковый. Наоборот, в некоторых играх впереди оказывается стенд именно с Broadwell-кристаллом. Хотя разница минимальна - это раз. Во-вторых, на итоговый результат могла повлиять новая версия драйвера.

Результаты тестирования Intel Core i5-5675C в играх

Как итог, можно смело констатировать тот факт, что Core i5-5675C, если он будет использоваться в игровом компьютере, сдюжит. Однако решения Haswell Refresh, на мой взгляд, за счет более высокой частоты выглядят предпочтительнее. На фоне процессоров Intel в роли явных отстающих выступают разве что «камни» AMD.

Встроенная графика Iris Pro 6200

Про встроенную графику Iris Pro 6200 было сказано немало слов. Настало время оценить производительность этого решения. Тем более, что AMD недавно выпустила гибридный процессор A10-7870K , оснащенный разогнанным GPU Radeon R7.

В GTA V при минимальных настройках качества графики удалось заполучить вполне играбельный уровень FPS даже в разрешении Full HD. А вот в Far Cry 4 и в «Ведьмак 3» в 1080p уже не поиграешь.

Iris Pro 6200 и Far Cry 4

В Far Cry 4 и «Ведьмак 3» быстрее оказалось решение AMD. Однако в Full HD в обоих случаях было неиграбельно. На мой взгляд, в этих играх сказалась поддержка драйвера. В теории производитель дискретных видеокарт (это я про AMD) должен следить за обновлением своего ПО под новые приложения. Впрочем, в GTA V и в 720p, и в 1080p больше FPS оказалось именно у Iris Pro 6200.

Iris Pro 6200 и новые игры

Iris Pro 6200 удалось набрать свыше 3000 «попугаев» в бенчмарке 3DMark 11 (режим Performance). AMD A10-7870K такой прытью в этом синтетическом приложении похвастать не может.

В некоторых играх Iris Pro 6200 заметно опережает Radeon R7. Например, в Bioshock infinite разница в FPS достигает 23,9% в разрешении 720p и 27,6% в разрешении 1080p.

Iris Pro 6200 и игры

Iris Pro 6200 и игры

Что же, производительность Iris Pro 6200 поражает. Особенно на фоне HD Graphics 4600, реализованной в десктопных Haswell. В ряде случаев в современных играх достигнут вполне играбельный уровень FPS даже в разрешении Full HD. Даже с высокими настройками качества графики. Но самое интересное - ядро Iris Pro 6200 оказалось быстрее интегрированной графики A10-7870K. Кажется, теперь AMD лишилась еще одного аргумента в противостоянии с Intel. С другой стороны, стоимость самого дешевого Broadwell (то есть Core i5-5675C) составляет 276 долларов США. AMD A10-7870K стоит 137 долларов США, то есть в два раза меньше.