Мобильные процессоры sandy bridge. Особенности новой микроархитектуры. Управление питанием и разгон

Сравнение с мобильными и десктопными процессорами

В середине января мы провели первое исследование системы на новой платформе Intel Sandy Bridge. В том тесте участвовал прототип ноутбука Toshiba A665-3D с новым видеоадаптером NVIDIA и технологией NVIDIA Optimus. Однако, что называется, перемудрили: на ноутбуке не включалась внешняя графика. Поэтому приложения, задействующие графику (в первую очередь, игры), тестировать просто не было смысла. Да и вообще, некоторые вещи невозможно адекватно протестировать на раннем и плохо работающем семпле.

Поэтому решено было провести повторное тестирование уже другой системы, и случай не заставил себя ждать. На тестирование попал другой ноутбук, Hewlett-Packard DV7, на новой платформе и с новым поколением графики от AMD. Правда, когда тесты уже были закончены, появилась информация о печально знаменитой ошибке в южном мосту, из-за которой проданные устройства (в том числе и мобильные) подлежат отзыву. Так что и здесь результаты в строгом смысле слова не совсем официальные (по крайней мере, компания Hewlett-Packard просила вернуть ноутбук), но мы-то понимаем, что ошибка (да еще и настолько «теоретическая») не может повлиять на результаты тестов.

Тем не менее, не стоило выпускать отдельный материал только для того, чтобы еще раз повторить измерения и назвать их финальными. Поэтому в настоящем обзоре мы поставили перед собой несколько задач:

  • проверить результаты новой системы в «мобильной» методике;
  • проверить работу системы разгона Intel Turbo Boost на другой системе с другим охлаждением;
  • сравнить между собой мобильную и настольные версии процессора Sandy Bridge в настольной методике тестирования компьютерных систем.

Ну что же, переходим к тестированию.

Конфигурация участников тестирования по методике для мобильных систем

Как уже отмечалось, сравнивать производительность подсистем мобильных компьютеров гораздо сложнее, т. к. они предоставляются на тест в виде готовых изделий. Сложно делать выводы, ведь на разницу в производительности может влиять более одного компонента.

Посмотрим на конкурентов, точнее на изменение их состава по сравнению с предыдущим тестированием. Во-первых, мы решили убрать из сравнения модель Core i5-540M. Она относится к более слабой двухъядерной линейке, да и в линейке Sandy Bridge ей будут соответствовать другие модели. Если результаты этого процессора так важны, их можно взять из предыдущей статьи. Вместо него в сравнение включен Hewlett-Packard Elitebook 8740w, тоже на процессоре Core i7-720QM, ну и добавлена основная тестовая система на сегодня - Hewlett-Packard Pavillon DV7 на процессоре Sandy Bridge 2630QM.

Таким образом, в тесте участвуют две модели на процессоре Core i7-720QM и две модели на процессоре Core i7 2630QM. Это позволит не только сравнить между собой производительность систем на более старом и более новом процессоре, но и убедиться, что уровень производительности одинаков для двух систем на одинаковом процессоре.

Ну а мы переходим к анализу конфигураций ноутбуков, участвующих в тестировании.

Название ноутбука HP 8740w ASUS N53Jq Toshiba A665-3D HP DV7
Процессор Core i7-720QM Core i7-720QM Core i7-2630QM Core i7-2630QM
Количество ядер 4 (8 потоков) 4 (8 потоков) 4 (8 потоков) 4 (8 потоков)
Номинальная частота 1,6 ГГц 1,6 ГГц 2 ГГц 2 ГГц
Макс. частота Turbo Boost 2,6* ГГц 2,6* ГГц 2,9* ГГц 2,9* ГГц
Объем кэша LLC 6 МБ 6 МБ 6 МБ 6 МБ
Оперативная память 10 ГБ 10 ГБ 4 ГБ 4 ГБ
Видеоподсистема NVIDIA QUADRO FX 2800M NVIDIA GT 425M Intel интегр. ATI 6570

* указана частота автоматического разгона в том случае, если у процессора под нагрузкой находятся все четыре ядра. Если под нагрузкой находится два ядра, то частота может еще вырасти (с 2,6 ГГц до 2,8 ГГц), а если одно - то подняться до максимальной отметки (с 2,6 ГГц до 2,9 ГГц).

Анализируем необходимые для сравнения данные о процессорах. Во-первых, производитель утверждает, что в линейке Sandy Bridge оптимизирована внутренняя архитектура процессора, это должно приносить какой-то прирост общей производительности.

Количество ядер и потоков гипертрейдинга одинаковое у всех участников. Однако отличается тактовая частота: у 720QM она всего лишь 1,6 ГГц, тогда как новые процессоры работают на 2 ГГц. Предельная тактовая частота, правда, отличается не так сильно. Дело в том, что для 720QM указана частота, когда задействованы четыре ядра, а для 2630QM - когда задействовано одно. Если же у него загружены четыре ядра, то максимальная частота составляет те же 2,6 ГГц. Другими словами, в «разоганном» состоянии процессоры должны работать на одинаковой частоте (пока не сработает контроль температуры). Вот только в Sandy Bridge более продвинутая технология разгона Intel Turbo Boost, которая может дольше держать повышенную частоту, так что у него может быть преимущество. Но точно предсказать, как поведет себя разгон, невозможно, т. к. слишком много зависимостей от внешних факторов.

Давайте переходить непосредственно к тестам.

Сравнение производительности процессора линейки Sandy Bridge с предыдущим поколением в наборе приложений методики исследования производительности мобильных систем. Определение повторяемости результатов

Для тестов мы использовали методику тестирования ноутбуков в реальных приложениях образца 2010 года. По сравнению с настольной, в ней урезан набор приложений, однако оставшиеся запускаются с теми же настройками (кроме игр, в этой группе настройки были серьезно изменены, и параметров тестовой задачи для программы Photoshop). Поэтому результаты отдельных тестов можно сравнивать с результатами настольных процессоров.

Результаты рейтинга отдельных групп приложений из этого материала нельзя сравнивать напрямую с данными рейтинга настольных систем. При тестировании производительности ноутбуков запускаются не все приложения методики, соответственно, рейтинг считается по-другому. Результаты рейтингов настольных систем, участвующих в тестировании, пересчитаны.

Сразу оговорюсь, что для каждой системы тесты проводились дважды, причем между прогонами система переустанавливалась и настраивалась снова. Иначе говоря, если результаты тестов и кажутся странными, то они, по крайней мере, повторяемы: на двух разных свежеустановленных системах с актуальным набором драйверов.

Начнем с профессиональных приложений.

3D-визуализация

В этой группе собраны приложения, требовательные и к производительности процессора, и графики.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Lightwave - работа 20,53 22,97 24,87 16,17
Solidworks - работа 52,5 58,83 133,12 60,45
Lightwave - рейтинг 122 109 101 155
Solidworks - рейтинг 129 115 51 112
Группа - рейтинг 126 112 76 134

Что интересно, обе системы «второй волны» значительно обходят по производительности системы, протестированные полтора месяца назад. Интересно, что это - влияние драйверов? Другой, значительно более мощной графики в обоих случаях? Даже если не обращать внимание на старые результаты процессора Sandy Bridge, в сравнении двух Core i7 наблюдается та же зависимость.

Теперь можно с уверенностью сказать, что новое поколение быстрее. За исключением странных результатов SolidWorks, но к ним мы еще вернемся в обсуждении результатов настольной методики.

3D-рендеринг

Посмотрим, как обстоит дело в рендеринге финальной сцены. Такой рендеринг выполняется силами центрального процессора.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Lightwave 138,58 131,56 269,89 90,22
3Ds MAX 0:10:04 0:10:06 00:21:56 0:07:45
Lightwave - рейтинг 95 101 49 146
3Ds MAX - рейтинг 113 112 52 147
Группа - рейтинг 104 107 51 147

Напомню, семпл компании Toshiba показывал в этом тесте очень слабые результаты. Зато в полностью работоспособной системе процессор Sandy Bridge позволяет добиться существенного превосходства в обоих графических пакетах. В Lightwave, как вы видите, есть разница и между двумя Core i7-720QM, а в 3Ds MAX разницы почти нет.

Зато в обоих тестах видно, что процессор Core i7-2630QM существенно быстрее, значительно обгоняет представителей предыдущего поколения.

Вычисления

Посмотрим на производительность процессоров в приложениях, связанных с математическими вычислениями.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Solidworks 46,36 45,88 44,02 38,42
MATLAB 0,0494 0,0494 0,0352 0,0365
Solidworks - рейтинг 111 112 117 134
MATLAB - рейтинг 113 113 159 153
Группа - рейтинг 112 113 138 144

Ну что же, а вот математические тесты не чувствуют разницы между двумя Core i7-720QM. Из этого можно сделать предварительный вывод, что эти приложения в минимальной степени реагируют на другие компоненты системы и программную часть.

Процессор нового поколения быстрее, но здесь отрыв не настолько большой, особенно это очевидно по цифрам рейтинга. Почему-то производительность DV7 в тесте MATLAB немного ниже, чем A660.

Посмотрим, будет ли в других тестах сохраняться примерно такой же отрыв нового поколения от старого.

Компиляция

Тест на скорость компиляции программы с помощью компилятора Microsoft Visual Studio 2008. Этот тест хорошо реагирует на скорость процессора и кэш, да и многоядерность умеет задействовать.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Compile 0:06:29 0:06:24 0:04:56 0:04:54
Compile - рейтинг 123 125 162 163

Разница в результатах небольшая, думаю, ее можно списать на погрешность. Разница в производительности между двумя поколениями значительная.

Производительность приложений Java

Этот бенчмарк представляет собой скорость выполнения набора приложений Java. Тест критичен к быстродействию процессора и очень положительно реагирует на дополнительные ядра.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Java 79,32 83,64 111,8 105,45
Java - рейтинг 90 94 126 119

А вот здесь результаты немного, но заметно снизились для более новых протестированных ноутбуков. Не будем гадать, почему так получилось, однако подчеркну, что результаты повторялись два раза. Разница между процессорами разных поколений примерно такая же, как и в предыдущем тесте.

Перейдем к производительным домашним задачам: работе с видео, звуком и фотографиями.

2D-графика

Напомню, в этой группе остались всего два теста, достаточно разноплановых. ACDSee конвертирует набор фотографий из формата RAW в JPEG, а Photoshop проводит серию операций по обработке картинки - накладку фильтров и т. д. Приложения зависят от скорости процессора, а вот многоядерность задействуют постольку-поскольку.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
ACDSee 0:07:01 0:06:55 0:05:11 0:04:52
Photoshop 0:01:17 0:01:17 0:00:49 0:00:51
ACDSee - рейтинг 108 110 146 156
Photoshop - рейтинг 426 426 669 643
Группа - рейтинг 267 268 408 400

ACDSee демонстрирует некоторую нестабильность результатов, но в целом разница между поколениями соответствует тенденции, она даже чуть больше.

На рейтинги Photoshop не стоит обращать внимание из-за измененного тестового задания. Эти же рейтинги портят и общий рейтинг группы. Но если посмотреть на время выполнения, то видно, что преимущество примерно такое же.

Кодирование аудио в различные форматы

Кодирование аудио в различные аудиоформаты - задача для современных процессоров достаточно простая. Для кодирования используется оболочка dBPowerAmp. Она умеет использовать многоядерность (запускаются дополнительные потокие кодирования). Результат теста - ее же баллы, они обратны затраченному на кодирование время, т. е. чем больше, тем лучше результат.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
apple 148 159 241 238
flac 199 214 340 343
monkey 143 155 239 235
mp3 89 96 150 152
nero 85 91 135 142
ogg 60 65 92 90
apple - рейтинг 90 97 147 145
flac - рейтинг 99 106 169 171
monkey - рейтинг 97 105 163 160
mp3 - рейтинг 103 112 174 177
nero - рейтинг 104 111 165 173
ogg - рейтинг 103 112 159 155
Группа - рейтинг 99 107 163 164

Тест достаточно простой, но в то же время наглядный. Совершенно неожиданно здесь появилась разница между двумя процессорами Core i7-720QM, причем не в пользу недавно протестированной системы. Процессоры Sandy Bridge показали почти одинаковую производительность. Как видите, преимущество новых процессоров очень существенное, больше, чем в предыдущих группах тестов.

Видеокодирование

Три теста из четырех - это кодирование видеоролика в определенный видеоформат. Особняком стоит тест Premiere, в этом приложении сценарий предусматривает создание ролика, включая наложение эффектов, а не просто кодирование. К сожалению, Sony Vegas на некоторых системах не отработал, поэтому для этой статьи мы убрали его результаты.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
DivX 0:05:02 0:05:23 0:04:26 0:04:18
Premiere 0:05:04 0:04:47 0:03:38 0:03:35
x264 0:10:29 0:10:01 0:07:45 0:07:35
XviD 0:03:31 0:03:34 0:02:34 0:02:30
DivX - рейтинг 86 80 98 101
Premiere - рейтинг 101 107 140 142
x264 - рейтинг 100 105 135 138
XviD - рейтинг 87 86 119 123
Группа - рейтинг 94 95 123 126

Особняком стоят результаты кодирования в DivX. Почему-то в этом тесте очень большая разница у систем с 720QM и очень маленькая разница между старым и новым поколением.

В остальных тестах разница существенна, а разница между поколениями примерно соответствует общей тенденции. Интересно, что в Premiere разница примерно такая же, как и в простом кодировании. Кстати, в этом тесте тоже обращает на себя внимание большая разница между двумя системами на 720QM.

Ну и, наконец, несколько типов домашних задач.

Архивирование

Архивирование представляет собой достаточно простую математическую задачу, в которой активно работают все компоненты процессора. 7z более продвинутый, т. к. может задействовать любое количество ядер, да и вообще более эффективно работает с процессором. Winrar задействует до двух ядер.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
7-zip 0:01:57 0:01:55 0:01:30 0:01:27
WinRAR 0:01:50 0:01:48 0:01:25 0:01:25
Unpack (RAR) 0:00:50 0:00:49 0:00:42 0:00:41
7-zip - рейтинг 115 117 149 154
WinRAR - рейтинг 135 138 175 175
Unpack (RAR) - рейтинг 140 143 167 171
Группа - рейтинг 130 133 164 167

Разница между одинаковыми процессорами очень невелика. Опять видно, что в сравнении двух систем на 720QM ноутбук 8740 не намного, но стабильно быстрее. Процессоры нового поколения существенно быстрее, разница между двумя поколениями в целом такая же, как в большинстве других групп.

Производительность в тестах браузеров

Тоже достаточно простые тесты. Оба замеряют производительность в Javascript, это, пожалуй, наиболее требовательная к производительности часть движка браузера. Фокус в том, что у теста V8 результат в баллах, а у Sunspider - в миллисекундах. Соответственно, в первом случае чем выше цифра, тем лучше, во втором - наоборот.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Googlev8-chrome 6216 6262 7414 7366
Googlev8-firefox 556 555 662 654
Googlev8-ie 122 123 152 147
Googlev8-opera 3753 3729 4680 4552
Googlev8-safari 2608 2580 3129 3103
Sunspider-firefox 760 747 627 646
Sunspider-ie 4989 5237 4167 4087
Sunspider-opera 321 322 275 275
Sunspider-safari 422 421 353 354
Googlev8 - рейтинг 134 134 162 160
Sunspider - рейтинг 144 143 172 172
Группа - рейтинг 139 139 167 166

Сравнение в HD Play

Этот тест был убран из зачета для настольных систем, однако для мобильных он по-прежнему актуален. Даже если система и справляется с декодированием сложного ролика, в ноутбуке еще очень важно, насколько много ресурсов требуется для выполнения этой задачи, ведь от этого зависит и нагрев системы, и время автономной работы…

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
H.264 hardware 2,6 2,5 2,3 1,2
H.264 software 19,7 18,9 13,4 14
H.264 hardware - рейтинг 631 656 713 1367
H.264 software - рейтинг 173 180 254 243

В абсолютных цифрах разница между двумя 720QM не очень велика, хотя в рейтингах она может показаться существенной. Интересно посмотреть на разницу между двумя процессорами Core i7-2630QM в режиме с использованием аппаратного ускорения. Система с графикой AMD показывает более низкую загрузку, но и при использовании адаптера Intel результаты были очень хорошие. В программном режиме обе системы хорошо справляются с декодированием, загрузка процессора невелика. У процессоров Sandy Bridge загрузка системы прогнозируемо ниже.

Посмотрим на средний балл систем, участвовавших в тестах.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Общий рейтинг системы 128 129 158 173

Хотя в некоторых тестах разница между двумя системами с процессорами Intel Core i7-720QM была ощутимой, в целом они показали практически идентичный результат.

Производительность полностью исправной и работоспособной системы с процессором Core i7-2630QM гораздо выше, чем у протестированного нами ранее семпла. По этим результатам уже можно делать выводы о производительности платформы.

И эти выводы состоят в том, что производительность новой платформы Sandy Bridge где-то на 35% (в зависимости используемых приложений) выше, чем используемой платформы предыдущего поколения. Конечно, выводы все равно не окончательные. Как минимум, у чипов разная частота. Да и вообще, применительно к новым процессорам Intel такое понятие, как «тактовая частота», стало достаточно иллюзорным, потому что у нас появилась технология Intel Turbo Boost.

Проверка работы системы Intel Turbo Boost

В процессорах серии Sandy Bridge реализована новая версия технологии Intel Turbo Boost, обладающая гораздо более широкими возможностями по управлению тактовой частотой процессора. Система контроля и управления стала гораздо более сложной и интеллектуальной. Теперь она может брать в расчет много параметров: какие ядра и насколько загружены, температура процессора и отдельных компонентов (т. е. система может отслеживать и предупреждать локальный перегрев).

Поскольку контроль за температурным режимом и нагрузкой стал более эффективным, процессору нужен меньший запас прочности, чтобы стабильно и эффективно работать при любых внешних условиях (в первую очередь - температурных). Это позволяет более эффективно использовать его возможности. Фактически, эта система представляет собой контролируемый разгон: частота работы повышается, а контроль не дает процессору выйти за рамки условий безопасной работы и потерять стабильность или сломаться. В случае если процессор, работающий на повышенной частоте, слишком сильно нагреется, система мониторинга сама понизит частоту и напряжение питания до безопасных пределов.

Более того, новая система управления разгоном способна учитывать «эффект инерции». Когда процессор холодный, на короткое время частота может подняться очень высоко, процессор может даже выходить за определенный производителем предел рассеивания тепла. Если нагрузка краткосрочная, процессор не успеет нагреться до предельных температур, а если нагрузка продлится дольше - процессор нагреется и система снизит температуру до безопасных пределов.

Таким образом, у процессора Sandy Bridge есть три рабочих положения:

Активированы механизмы энергосбережения, процессор работает на низкой частоте и пониженном напряжении питания. Активируется система Intel Turbo Boost, процессор разгоняется до максимально разрешенной разгонной частоты (она зависит в т. ч. от того, сколько ядер и как загружены), повышается напряжение питания. Процессор работает на этой тактовой частоте, пока позволяет нагрев ядра. Процессор при превышении порогов по нагрузке или нагреву возвращается к тактовой частоте, на которой он гарантированно стабильно работает. Например, для 2630QM эта частота указана как 2 ГГц, эта частота указана в спецификациях и производитель гарантирует, что процессор сможет поддерживать эту частоту сколь угодно долго при условии соблюдения оговоренных внешних условий. Intel Turbo Boost позволяет поднять частоту работы, но параметры его работы и частота работы зависят от внешних условий, поэтому производитель не может гарантировать, что эта система всегда будет работать одинаково.

Впрочем, эту информацию можно почерпнуть из первого обзора. Напомнию, в первом тестировании процессор в простое работал со следующими параметрами:

  • Простой: 800 МГц, напряжение питания 0,771 В.
  • Нагрузка (все ядра, максимум): частота 2594 МГц (множитель 26), напряжение питания 1,231 В.
  • Нагрузка (спустя порядка 5 минут работы) - либо 2594 МГц (множитель 26), либо 2494 МГц (множитель 25).
  • Нагрузка (спустя где-то 7-8 минут работы) - 1995 МГц (множитель 20). Напряжение 1,071 В. Система вернулась к стабильным, заложенным производетелем параметрам работы.

Посмотрим, сколько продержится в разогнанном положении Hewlett-Packard DV7.

Запускаем программы мониторинга состояния процессора.

Частота работы и напряжение те же, что и в предыдущем тестировании. Посмотрим на показания температуры.

Все тихо, температуры относительно невысокие - 49 градусов. Для высокопроизводительного процессора это немного. Обратите внимание на разницу в температуре первого и четвертого ядер.

Запускаем нагрузочный тест. Напомню, он грузит все ядра сразу, так что максимальных цифр (2,9 ГГц) в Intel Turbo Boost мы не увидим.

Как видите, напряжение поднялось до 1,211 Вольт, частота стала 2594 МГц из-за изменившегося множителя, теперь он составляет 26. Процессор начинает стремительно набирать температуру, все громче начинает звучать вентилятор системы охлаждения.

Ну что же, посмотрим, насколько хватит процессора, когда он перейдет на штатную частоту.

Прошла минута, видно, что температуры начинают стабилизироваться.

Прошло пять минут, температуры стабилизировались. По каким-то причинам температура первого и четвертого ядра различается на 10 градусов. Разница в температурах присутствует во всех тестах, даже в простое она заметна. Не берусь сказать, почему это происходит.

Прошло 15 минут с начала тестирования. Температуры стабильны, система охлаждения справляется. Тактовая частота остается на уровне 2,6 ГГц.

Прошло 48 минут. Ноутбук продолжает работать под нагрузкой, температуры стабильны (ну, выросли на градус). Тактовая частота та же:

Ну что же, по крайней мере зимой и в не очень горячем помещении DV7 может работать с максимальной доступной частотой неограниченно долго. Мощности системы охлаждения вполне хватает, чтобы Intel Turbo Boost без проблем держала максимально доступную «разгонную» частоту. Теоретически можно было бы разогнать процессор еще немножко.

Этот вывод отличается от предыдущих результатов. Теперь видно, что стоит покупать качественный ноутбук: если конструкторы хорошо поработали над созданием системы охлаждения, вы получите дивиденды не только в виде качественного и крепкого корпуса, но и в производительности!

Ну что же, а мы переходим ко второй очень интересной части статьи: сравнение мобильного процессора Core i7-2630QM с настольными процессорами серии Sandy Bridge в настольной методике тестирования.

Сравнение производительности мобильного процессора Core i7-2630QM с настольными процессорами серии Sandy Bridge

Для сравнения мы используем результаты из нашего исследования настольных процессоров Core i7 и Core i5 на ядре Sandy Bridge.

Сравним конфигурации участников, включив в таблицу информацию о Core i7-2630QM.

Процессор Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Название ядра Sandy Bridge Sandy Bridge Sandy Bridge Sandy Bridge Sandy Bridge
Технология пр-ва 32 нм 32 нм 32 нм 32 нм 32 нм
Частота ядра (std/max), ГГц 2,8/3,1 3,1/3,4 3,3/3,7 3,4/3,8 2,0/2,9
Стартовый коэффициент умножения 28 31 33 34 20
Схема работы Turbo Boost 3-2-2-1 3-2-2-1 4-3-2-1 4-3-2-1 н/д
Кол-во ядер/потоков вычисления 4/4 4/4 4/4 4/8 4/8
Кэш L1, I/D, КБ 32/32 32/32 32/32 32/32 н/д
Кэш L2, КБ 4×256 4×256 4×256 4×256 н/д
Кэш L3, МиБ 6 6 6 8 6
Оперативная память 2×DDR3-1333
Графическое ядро GMA HD 2000 2000 2000/3000 2000/3000 3000
Частота графического ядра (max), МГц 1100 1100 1100 1350 1100
Сокет LGA1155 LGA1155 LGA1155 LGA1155 н/д
TDP 95 Вт 95 Вт 95 Вт 95 Вт 45 Вт

Тактовая частота у мобильного процессора ниже, что очевидно. В максимальном режиме Turbo Boost он чуть-чуть обгоняет по тактовой частоте младший настольный Core i5, работающий без Turbo Boost, но не более того. Зато значительно ниже тепловой пакет - более чем вдвое. Кроме того, у него меньше объем кэша последнего уровня, всего 6 МБ. Из плюсов стоит отметить, что у мобильного процессора четыре ядра и восемь потоков вычислений, т. к. это Core i7. Хоть какое-то преимущество над младшими настольными Core i5. Посмотрим, во что оно выльется на практике.

К сожалению, полноценного сравнения все равно не получилось. Некоторые пакеты из настольной методики не запустились (например, Pro/Engineer стабильно зависал на нашей тестовой системе), в результате пришлось выкинуть их результаты из рейтинга, а значит, и сам рейтинг поменялся по сравнению с рейтингами из основного материала.

Перейдем к тестам. Фраза «тест не запустился» означает, что тест не запустился именно на нашем ноутбуке, поэтому убраны результаты всех участников тестирования. Рейтинги в этом случае пересчитываются.

По результатам сразу видно, что мобильный процессор проигрывает настольным довольно серьезно - не может достичь уровня производительности даже младшего процессора новой настольной линейки. Результаты настольного процессора Core i7, на мой взгляд, слабоваты, все же он должен быть намного мощнее линейки Core i5, по результатам же зависимость кажется линейной. Результаты Solidworks вообще практически одинаковые для всех настольных систем. Этому тесту все равно, какая тактовая частота у процессора?

Посмотрим на скорость рендеринга трехмерных сцен.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
3ds max 181 195 207 233 157
Lightwave 153 168 180 234 161
Maya 142 170 181 240 165
Rendering 159 178 189 236 161

Здесь ситуация немного повеселее - мобильная система все-таки достигла уровня младшей настольной. Однако настольный Core i7 далеко впереди во всех тестах. Для сравнения, вот абсолютные результаты одного из тестов, Maya. Результатом этого теста является затраченное на выполнение проекта время, что более наглядно, чем очки в других тестах.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Maya 00:08:47 00:07:20 00:06:52 00:05:11 00:07:34

Как видите, даже при не очень большом времени просчета проекта разница существенна. В случае более сложных проектов она должна быть еще больше.

Переходим к следующем тесту.

Практически все приложения используют сложные математические вычисления, поэтому настольная линейка с более высокой частотой очевидно будет впереди. В то же время, меня очень смущает слишком маленькая разница между настольными Core i5-2500 и Core i7-2600, в некоторых приложениях более мощный процессор даже проигрывает. Неужели в этих приложениях гипердрединг действительно настолько неэффективен, что даже разница в тактовых частотах не может компенсировать вызыванное им замедление? Это тем более интересно, ведь в мобильном процессоре конфигурация ядер такая же, как в серии 2600, а он в общем-то не так уж и сильно и отстает от младшего настольного процессора, учитывая разницу в рабочих частотах между ними.

А мы переходим к менее профессиональным и более распространенным тестам. И начнем с растровой графики. К сожалению, не запустился один из тестов, что опять повлияло на картину тестов.

И снова мобильная система стабильно оказывается на уровне чуть ниже самого младшего настольного решения. И то за счет неожиданно высокого результата в Photoimpact, иначе картина была бы еще печальнее. Для наглядности приведу результаты для двух пакетов в абсолютных цифрах.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
ACDSee 00:04:20 00:03:59 00:03:46 00:03:34 00:04:57
Photoshop 00:03:36 00:03:15 00:03:07 00:02:58 00:04:00

Так можно оценить конкретную разницу во времени выполнения задания.

Переходим к тестам на архивирование. Это простые вычисления, хорошо чувствующие и скорость, и наличие дополнительных ядер процессора (хотя с этим есть вопросы).

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
7-zip 140 151 156 213 137
RAR 191 207 216 229 173
Unpack (RAR) 179 194 206 219 167
Archivers 170 184 193 220 159

И опять, и снова… Если смотреть на результаты 7-zip, то можно видеть, что многоядерность (даже в виде гипертрединга) дает существенные дивиденды. Но, видимо, тактовая частота тоже дает существенные дивиденды, потому что мобильный Core i7 с восемью ядрами опять не дотянул даже до младшего настольного процессора. И такая же ситуация сохранилась и в тестах Winrar. Зато настольный Core i7-2600 в тесте 7-zip уходит очень далеко вперед.

Тест компиляции, опять же задействующий математические возможности процессора…

В тесте на производительность приложений Java тенденция в принципе подтверждается. Но отставание мобильного процессора еще больше.

Посмотим на производительность Javascript в современных браузерах.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Google V8 161 176 190 191 148
Sun Spider 156 162 167 170 198
Browser 159 169 179 181 173

Если результаты теста от Google примерно соответствуют тому, что мы видели раньше, то в Sunspider явно что-то не так. Хотя в принципе во всех браузерах этот тест отработал на мобильном процессоре быстрее, чем на всех настольных, включая и настольный Core i7 (который, правда, по результатам очень несильно отличается от старшего Core i5).

В общем, весьма неожиданный результат второго теста, который я объяснить не могу. Возможно, что-то по-разному сработало именно в ПО?

Оставим интернет-приложения и перейдем к работе с видео и аудио. Тоже достаточно востребованный вид деятельности, в том числе и для мобильных компьютеров.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Apple Lossless 135 149 154 206 126
FLAC 145 159 171 233 144
Monkey"s Audio 150 165 174 230 139
MP3 (LAME) 162 179 191 258 152
Nero AAC 154 171 179 250 148
Ogg Vorbis 164 179 191 252 147
Audio 152 167 177 238 143

Аудиокодирование не преподносит нам никаких сюрпризов. Мобильный Core i7-2630QM немного слабее всех протестированных настольных процессоров, настольный Core i7 уходит в серьезный отрыв. А что будет в видеокодировании?

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
DivX 146 160 170 157 96
Mainconcept (VC-1) 153 167 175 187 133
Premiere 155 169 178 222 132
Vegas 164 177 185 204 131
x264 152 165 174 225 136
XviD 166 180 190 196 133
Video 156 170 179 199 127

Отставание мобильного процессора увеличилось, настольный Core i7 по-прежнему сильно опережает все остальные процессоры, хотя разрыв и уменьшился.

Ну и одно из самых «реальных» тестирований: игры!

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Batman 131 134 135 134 40
Borderlands 142 149 157 160 234
DiRT 2 109 110 110 110 36
Far Cry 2 200 218 232 237 84
Fritz Chess 142 156 166 215 149
GTA IV 162 164 167 167 144
Resident Evil 125 125 125 125 119
S.T.A.L.K.E.R. 104 104 104 104 28
UT3 150 152 157 156 48
Crysis: Warhead 127 128 128 128 40
World in Conflict 163 166 168 170 0
Games 141 146 150 155 84

Так и хочется сказать «ой». Все игры четко разделяются на зависящие от процессора и зависящие от графики. Установкой более мощного процессора можно здорово повысить скорость в Borderlands, Far Cry 2 и Fritz Chess. Некоторые игры реагируют на более мощные процессоры совсем чуть-чуть, некоторые не реагируют вообще. Если убрать из рассмотрения World in Confict, где мобильный Core i7 получил 0, то общий рейтинг выглядит так.

Результаты получились нерадостные для мобильной системы, причем по большей части как раз процессор в этом не виноват. Перед тем, как делать выводы, посмотрим на абсолютные цифры производительности в играх.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Batman 205 209 210 209 63
Borderlands 75 79 83 85 124
DiRT 2 76 77 77 77 25
Far Cry 2 76 83 88 90 32
Fritz Chess 8524 9368 9982 12956 8936
GTA IV 63 64 65 65 56
Resident Evil 128 128 128 128 121,6
S.T.A.L.K.E.R. 62,9 62,9 63 62,9 17,2
UT3 166 169 174 173 53
Crysis: Warhead 57,4 57,6 57,7 57,7 18,1
World in Conflict 62,6 63,5 64,3 65

Как видите, если настольные процессоры практически всегда показывают вполне неплохие результаты, то мобильная система много где находится на пороге играбельности или ниже него.

Практически для всех игр процессоры слишком быстрые, финальный результат зависит в основном от производительности видеокарты. При этом уровень производительности мобильной системы значительно ниже, что позволяет сделать некоторые выводы об очень большой разнице между настольными и мобильными видеорешениями. Разница на примере наших тестов составляет в среднем три раза. Особняком стоят GTA IV и Resident Evil, которые показывают на всех системах, включая мобильную, близкие результаты.

В шахматной программе, где нагружен процессор, мобильный Core i7 выступает хорошо, между бюджетными настольными моделями.

Ну что же, подведем итог.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Общая оценка 157 170 180 203 141

Общий результат подтверждает тенденцию: один из самых мощных мобильных процессоров Core i7-2360QM не может достичь уровня производительности младшего настольного процессора в более слабой линейке Core i5. Настольный процессор Core i7 по производительности сильно отрывается даже от настольных процессоров из младшей линейки, что уж говорить о мобильной версии.

Вывод

Итак, время переходить к выводам. Напомню некоторые итоги из предыдущего материала.

На первый взгляд, Sandy Bridge - действительно, весьма удачный процессор. Во-первых, он сильно доработан, убраны нелогичные решения (те же два отдельных кристалла, выполненных по разным техпроцессам), структура чипа стала логичной и хорошо оптимизированной. Улучшилась шина связи компонентов внутри процессора (куда теперь входит и видеоядро!). Во-вторых, оптимизирована структура ядер процессора, что тоже должно повлиять в лучшую сторону на производительность. Практика подтверждает теорию: тот процессор, который был у нас на тесте, по производительности уходит далеко вперед по сравнению с текущей платформой.

И действительно, в практическом тестировании Core i7-2630QM, который должен быть самым младшим в новой мобильной линейке Core i7, серьезно обходит по уровню производительности Core i7-720QM, самый распространенный из производительных (или самый производительный из распространенных) процессоров мобильной линейки Intel Core первого поколения. Судя по всему, 2630QM должен занять его место, т. е. стать мейнстримовым производительным процессором в линейке Core 2-го поколения.

В целом можно сделать вывод, что второе поколение мобильных процессоров Core в смысле производительности представляет собой неплохой шаг вперед. Что касается других достоинств линейки, то, думаю, стоит подождать выхода младших линеек, да и просто большого количества моделей на новых процессорах, и уже тогда оценить такие качества новой линейки как нагрев, энергоэффективность и пр.

Однако в сравнении с новыми настольными процессорами Sandy Bridge Core i5 и i7 новый мобильный Core i7-2630QM все-таки проигрывает. Причем мобильная платформа слабее стабильно и во всех группах тестов. Это нормальная ситуация, т. к. при создании мобильных линеек приоритетами являются не только производительность, но и малое энергопотребление (для обеспечения большего времени работы от батарей), и низкое энергопотребление (из-за более компактных и слабых систем охлаждения). Стоит посмотреть хотя бы на термопакет нового мобильного процессора, который больше, чем в два раза (!) ниже, чем у настольных версий. За это приходится расплачиваться, в т. ч. более низкой штатной частотой и производительностью в целом.

Кстати, если говорить о частотах. Hewlett-Packard DV7 преподнес в этом плане приятный сюрприз (хотя возможно, что жарким летом все будет не столь радужно). Процессор, при условии хорошей системы охлаждения, может неограниченно долгое время работать на максимальной частоте Turbo Boost 2,6 ГГц, так что он вполне способен продемострировать более высокий уровень производительности, чем в соответствии со стандартными спецификациями. Конечно, нет никаких гарантий, что летом система охлаждения будет справляться, а если нет, то уровень реальной производительности относительно настольных систем может оказаться существенно ниже, чем в наших тестах. Поэтому наличие грамотной системы охлаждения в ноутбуке с новым мобильным процессором Core i7 выходит на первый план.

Отличие между «полностью» и «частично» разблокированными процессорами

Что в результате? Опробовав Turbo Boost на прошлых поколениях процессоров, Intel решила сделать из него инструмент для реального ценового позиционирования своих продуктов друг относительно друга. Если раньше энтузиасты чаще всего покупали младшие процессоры в серии, зачастую легко разгоняя их до уровня старших моделей, то теперь разница в 400 МГц между i3-2100 и i3-2120 стоит 21 доллар США, и ничего вы с этим не сделаете.

Оба разблокированных процессора будут стоить немного дороже, чем обычные модели. Разница эта будет меньше, чем в случае предыдущих поколений - $11 для 2500 модели и $23 для 2600. Intel всё же не хочет слишком сильно отпугивать оверклокеров. Однако теперь $216 - это порог для вступления в клуб. Разгон - развлечение, за которое нужно платить. Понятно, что такая позиция может перетянуть некоторых пользователей в стан AMD, у которой бюджетные процессоры разгоняются очень неплохо.

Сам разгон в целом стал проще - снизились требования к материнской плате и оперативной памяти, меньше мороки с таймингами и различными коэффициентами. Но экстремальщикам есть, где развернуться - про подстройку BCLK наверняка будут написаны целые трактаты.

Графическое ядро и Quick Sync

Intel начала подтягивать производительность своего встроенного графического ядра еще с анонсом Clarkdale и Arrandale, но в тот раз обогнать конкурентов не получилось. Дальнейшую планку установила компания AMD, которая собирается уничтожить рынок дискретной графики начального уровня. Решение Intel появилось раньше, но сможет ли оно справиться с поставленной задачей?

Начнем с того, что решений два. Называются они HD 2000 и HD 3000, а отличие между ними заключается в различном количестве исполнительных блоков (EU). В первом случае их 6, а во втором - 12. 12 их было и у GMA HD, но рост производительности за счет интеграции и переработанной архитектуры получился очень значительный. В модельном ряду настольных процессоров Intel продвинутой графики удостоилась только пара процессоров с разблокированным множителем. Это именно те модели, в которых встроенная графика будет использоваться с наименьшей вероятностью. Такое решение кажется нам очень странным. Остается надеяться, что в будущем Intel выпустит также модификации младших процессоров с полностью разблокированным графическим ядром.

К счастью, все новые мобильные процессоры компании оснащаются HD 3000. Intel твердо решила изо всех сил давить на конкурентов в этом сегменте, ведь достигнуть уровня производительности решений начального уровня здесь должно быть проще.

Производительность встроенной графики зависит не только от количества EU. Все десктопные Sandy обладают одинаковой базовой частотой (850 МГц), но у старших (2600 и 2600K) выше максимальная частота Turbo Boost - 1350 МГц против 1100 у остальных. На результате также будет в некоторой степени сказываться мощность вычислительных ядер CPU, но куда сильнее - объем его кэш-памяти. Ведь одной из основных особенностей новой графики является совместное с вычислительными ядрами использование кэш-памяти третьего уровня, реализованное благодаря кольцевой шине LLC.

Как и в процессорах Clarkdale, в новинках используется аппаратное ускорение для декодирования MPEG, VC-1 и AVC. Однако процесс этот теперь осуществляется существенно быстрее. Как и во «взрослой» дискретной графике, в процессорах Sandy Bridge есть отдельный блок, занимающийся кодированием/декодированием видео. В отличие от процессоров прошлого поколения, он полностью берет на себя эту задачу. Использование аппаратного ускорения гораздо выгоднее с точки зрения энергоэффективности, да и производительность в случае SNB оказывается очень высокой. Intel обещает возможность одновременного декодирования более двух 1080p потоков. Такая производительность может быть нужна для быстрого перекодирования имеющегося видео в подходящий для мобильного устройства формат. К тому же богатые мультимедийные возможности делают SNB лучшим выбором при построении HTPC-системы.

Разработкой графических решений для процессоров Intel занимается отдельное подразделение компании. Новые разработки этого подразделения также очень актуальны для мобильных процессоров компании. Пока проект Larrabee в том или ином виде не получит должного развития, Intel придется мириться с «не-x86» компонентами в своих CPU.

Intel Core i5-2400 и Core i5-2500K

К нам попало 2 процессора, основанных на архитектуре Sandy Bridge. Интерес в первую очередь представляет модель 2500K, так как она обладает разблокированным множителем. В будущем, возможно, отдельно будут опубликованы бенчмарки двухъядерных моделей и процессоров серии i7.

Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.
Модельный ряд

Процессоры на базе новой микроархитектуры в скором времени должны будут занять все ниши, включая решения начального уровня, где сейчас господствуют продукты с разъемом LGA775. Исключением станет высокопроизводительный сегмент рынка, который отдан на откуп моделям Bloomfield и Lynnfield, хотя в конце этого года все должно будет измениться в пользу Sandy Bridge и ее производных.


На данный момент компания Intel анонсировала 29 моделей новых процессоров, из которых 14 предназначены для настольного рынка. Среди них как обычные (95 Вт), так и с пониженным энергопотреблением (модели с суффиксом S — 65 Вт, и T — 45-35 Вт). Естественно, больший интерес для значительной части пользователей представляют процессоры со стандартным уровнем TDP. Тем более, что на отечественном рынке какие-либо другие вариации встречаются крайне редко.

В представленной ниже таблице приводится список всех стандартных моделей ЦП на базе Sandy Bridge, старшие из которых уже доступны на рынке.

Intel Core i7-2600/2600K* Intel Core i5-2500/2500K* Intel Core i5-2400 Intel Core i5-2300 Intel Core i3-2120 Intel Core i3-2100
Семейство
Разъем LGA1155 LGA1155 LGA1155 LGA1155 LGA1155 LGA1155
Техпроцесс CPU, нм 32 32 32 32 32 32
Число ядер 4
(8 потоков)
4
(4 потока)
4
(4 потока)
4
(4 потока)
2
(4 потока)
2
(4 потока)
Номинальная частота, ГГц 3,4 3,3 3,1 2,8 3,3 3,1
Turbo Boost (шаг поднятия частоты в зависимости от загрузки 1/2/3/4 ядер) 4/3/2/1 4/3/2/1 4/3/2/1 4/3/2/1 - -
Объем L3 кэша, Мбайт 8 6 6 6 3 3
Графическое ядро GMA HD 2000/3000 GMA HD 2000/3000 GMA HD 2000 GMA HD 2000 GMA HD 2000 GMA HD 2000
Частота графического ядра, МГц (номинанальная/турбо-режим) 850/1350 850/1100 850/1100 850/1100 850/1100 850/1100
Каналов памяти 2 2 2 2 2 2
Поддерживаемый тип памяти DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
Hyper-Threading + - - - + +
AES-NI + + + + - -
Intel vPro +/- +/- + - - -
TDP, Вт 95 95 95 95 65 65
Рекомендованная стоимость, $ 294/317 205/216 184 177 138 117
* — множитель разблокирован на повышение.

Как видим, название серий остались прежние — Core i7, Core i5 и Core i3, но изменились номера процессоров, которые стали четырехзначными. Первая цифра обозначает второе поколение Intel Core, следующие три цифры относятся к рейтингу производительности, а суффикс, в данном случае K, означает разблокированный множитель.

В серии Core i7 пока представлены две модели с частотой 3,4 ГГц и кэш-памятью объемом восемь мегабайт. Технология Turbo Boost позволяет поднимать рабочую частоту на 1-4 шага в зависимости от количества загруженных ядер. В процессоре с разблокированным множителем используется более продвинутое видеоядро GMA HD 3000, частота которого может увеличиваться с номинальных 850 МГц до 1350 МГц. Такой ЦП оценен в 317 долларов в партиях по одной тыс. штук. Более доступное решения для энтузиастов относится к серии Core i5 и имеет номер 2500K со стоимостью порядка $216. Процессоры этого модельного ряда оснащены лишь шестью мегабайтами кэша и лишены поддержки технологии Hyper-Threading. Но как покажет наше тестирование, Sandy Bridge неплохо справляется и без нее. Как и в случае со старшими продуктами, режим Turbo Boost и графическое ядро используются аналогичные, только частота GPU может подниматься до 1100 МГц. Для менее производительных Core i5 авторазгон процессора не такой прыткий и имеет шаг 1-2-2-3 (для четырех, трех, двух и одного ядра соответственно). Самые недорогие представители нового поколения относятся к серии Core i3, обладают лишь двумя ядрами и кэш-памятью в три мегабайта, но зато поддерживают Hyper-Threading и могут обрабатывать четыре потока одновременно. Технология Turbo Boost недоступна и для компенсации низкой производительности их частота изначально высокая и стартует с отметки 3,1 ГГц. Поддержка новых инструкций AES-NI ими не предусмотрена. За такие лишения производитель назначил цену около 120-140 долларов за процессор. Осталось лишь дождаться замены нынешнему Celeron, который базируется на уже древней архитектуре пятилетней давности.

Оба они относятся к решениям для энтузиастов и рассчитаны на без проблемный разгон, благодаря разблокированному на повышение множителю. Внешне процессоры Sandy Bridge отличаются от Lynnfield и Clarkdale смещенными к краю ключами и меньшим количеством контактов на лицевой стороне подложки:

Core i7-2600K, Core i5-2500K (слева), Core i5-870 и Core i5-660 (справа)


Частота модели Core i7-2600K составляет 3,4 ГГц, но за счет технологии Turbo Boost она выше на 100 МГц. И чем меньше исполняется потоков, тем она больше растет.


При загрузке трех ядер их частота будет равна 3,6 ГГц, двух — уже 3,7 ГГц, а одного — достигнет своего максимума в 3,8 ГГц. На данный момент, это один из самых высокочастотных процессоров в активе Intel. И в будущих моделях этот предел безболезненно может быть доведен до 4,2-4,5 ГГц.


Следующий участник лишен поддержки Hyper-Threading, обладает объемом кэш-памяти шесть мегабайт и по спецификациям функционирует на 3,3 ГГц. За счет авторазгона фактическая частота, естественно, равна 3,4 ГГц.


В плане работы Turbo Boost ничего не изменилось и частота Core i5-2500K меняется с шагом 100 МГц, пока не достигнет максимальных 3,7 ГГц.


В простое процессоры функционируют на 1600 МГц, при этом напряжение питания снижается с 1,2 до 0,9 В. Во время работы авторазгона оно наоборот, немного повышается (до 1,24 В). В целом, ничего особенного и все характеристики рассматриваемых моделей полностью соответствуют спецификациям на них.

Система охлаждения

Прежде чем перейдем к разгону, стоит пару слов сказать о системах охлаждения для новых процессоров.

К нам на тестирование попали два кулера. Один из них простой, с алюминиевым радиатором и медным пяточком. Частота вращения вентилятора с ШИМ-управлением составляла около 1100-2000 об/мин. Им, вероятнее всего, будут оснащаться все представители архитектуры Sandy Bridge.



Второй охладитель — башенного типа, знакомый нам еще по шестиядерному Core i7-980X Extreme Edition, где он впервые был использован. С небольшими изменениями в его конструкции компания стала им оснащать продукты для энтузиастов прошлого поколения, и даже поставляла кулер на розничный рынок отдельной единицей по названием XTS100H.



В его конструкции применены три тепловые трубки (а не четыре, как у СО Core i7-980X), пронизывающие ряд тонких часто расположенных алюминиевых пластин. Вентилятор с ШИМ-управлением защищен проволочной решеткой и обладает скоростью 800-2600 об/мин (17-45 дБА). Для снижения уровня шума предусмотрен переключатель на крышке кулера, переводящий вентилятор в менее интенсивный режим работы — 800-1400 об/мин.


Основание кулера медное, небольших размеров, но отполировано до зеркального блеска. Крепление XTS100H к плате осуществляется за счет пластиковой усилительной пластины и четырех винтов, и оно вполне надежно.


По эффективности в номинальном режиме работы процессора Core i7-2600K данные системы охлаждения проявляют себя вполне неплохо на фоне недорогого Arctic Cooling Freezer 11 LP и даже Noctua NH-D14.


Но это касается функционирования процессора на стандартной частоте — с разгоном до 4,5-5 ГГц использовать такие кулеры, к сожалению, нельзя.

Разгон

Теперь самое интересное. Наверняка многие сталкивались с проблемой разгона процессоров архитектуры Nehalem на базе 45-нм техпроцесса, которым частоты свыше 4,2 ГГц при воздушном охлаждении давались с трудом. Но никого не удивляли 4,5 ГГц на 32-нм Clarkdale и Gulftown. Помимо самого потенциала ядра свою лепту в проблему разгона вносила высокая частота BCLK, которая получалась с младшими моделями ЦП. С Sandy Bridge повышать частоту можно лишь путем увеличения множителя, предел которого будет определяться уже возможностями процессора K-серии (максимум x57). Для достижения 4,5 ГГц достаточно будет поднять немного напряжение на ядрах, не затрагивая остальные параметры (Turbo Boost обязательно должен быть включен). Тестовые экземпляры Core i7-2600K и Core i5-2500K на такой частоте заработали при повышении напряжения до 1,28 и 1,35 В соответственно, чего вполне достаточно для режима работы системы 24/7. Прибавка еще 200 МГц потребовала увеличение напряжения до 1,3 В для старшей модели и 1,375 В для младшей. Пять гигагерц покорились лишь Core i7-2600K при 1,45 В:


Температура процессора в таком режиме с Noctua NH-D14 не превышала 78°C.

Core i5-2500K смог стабильно функционировать на 4,8 ГГц при напряжении 1,425 В (температура не выходила за рамки 71 градуса по Цельсию) — если младшие все такие, то для серьезных экспериментов с разгоном он явно не подходит.


Для достижения еще большего уровня разгона Sandy Bridge в обязательном порядке необходимо активировать в BIOS/UEFI материнских плат опцию Internal PLL Overvoltage. Можно также попытаться поднять различные напряжения питания. Максимально безопасное для процессора составляет 1,52 В (но есть мнение, что выше 1,38-1,4 В для режима 24/7 использовать не рекомендуется), для «системного агента» — 0,971 В, модулей памяти — 1,57 В. Параметр VCCIO (или Vtt — напряжение на контроллере памяти) позволяет добиться стабильности при работе с высокочастотной памятью, но выше 1,1 В поднимать не рекомендуется. CPU PLL ограничен 1,89 В, а графическое ядро, как и процессорное, может довольствоваться 1,52 В.

Помимо разгона процессора можно увеличить частоту памяти, причем, без каких-либо танцев с бубном, как того требовалось ранее. Достаточно выбрать необходимый режим и, возможно, немного поднять напряжение на контроллере.


Но у этой медали есть и обратная сторона. Так как предел разгона по базовой составляет около 105 МГц, определить максимальную конкретно возможную частоту теперь будет сложно. Придется либо ограничиваться фиксированными режимами, либо подбирать BCLK в пределах 100-105 МГц, что даст прибавку по 20 МГц на каждый мегагерц сверх номинала, что не так уж и много.
Тестовые конфигурации

Для сравнения производительности новых процессоров с решениями прошлого поколения и конкурентами была собрана следующая система:

  • материнская плата: ASUS P8P67 Deluxe (Intel P67 Express, EFI 1053);
  • память: Kingston KHX2000C8D3T1K3/6GX (3x2 ГБ, DDR3-2000@1333, 8-8-8-24-1T);
  • кулер: Noctua NH-D14;
  • видеокарта: ASUS ENGTX580/2DI/1536MD5 (GeForce GTX 580);
  • жесткий диск: Seagate ST3500418AS (500 ГБ, 7200 об/мин, SATAII);
  • блок питания: Seasonic SS-600HM (600 Вт);
  • операционная система: Windows 7 Home Premium x64;
  • драйвер чипсета: Intel Chipset Software Installation Utility 9.2.0.1019;
  • драйвер видеокарты: GeForce 263.09.
В операционной системе брандмауэр, UAC и Windows Defender отключались, файл подкачки устанавливался в размере 4096 МБ. Настройки видеодрайвера не изменялись. Память работала на частоте 1333 МГц с задержками 8-8-8-24-1T. Остальные настройки в UEFI материнской платы оставлялись по умолчанию.

Конфигурации остальных участников отличались процессорами, материнскими платами и, по необходимости, памятью. Для платформы LGA1366 она была следующая:

  • процессор: Intel Core i7-975 EE (3,33 ГГц, 8 Мбайт кэш);
  • материнская плата: ASUS Sabertooth X58 (Intel X58 Express, BIOS 0603).
Платформа LGA1156 комплектовалась таким оборудованием:
  • процессор: Intel Xeon X3470 (взамен Core i7-870; 2,93 ГГц, 8 МБайт кэш);
  • процессор: Intel Core i5-660 (3,33 ГГц, 4 Мбайт кэш);
  • материнская плата: ASUS Maximus III Extreme (Intel P55 Express, BIOS 1204).
Конкурирующий лагерь отстаивал честь следующим:
  • процессор: AMD Phenom II X6 1100T (3,3 ГГц, 6 МБайт кэш);
  • процессор: AMD Phenom II X6 1075T (3,0 ГГц, 6 МБайт кэш);
  • материнская плата: ASUS Crosshair IV Extreme (AMD 890FX, BIOS 0502);
  • память: Goodram Play GY1600D364L8/4GDC (2x2 ГБ, DDR3-1600@1333, 8-8-8-24-1T).
Такой выбор процессоров обусловлен как наличием их на момент тестирования, так и ценовым позиционированием каждой из моделей. Так, стоимость Core i7-2600K (а значит и обычной версии) почти соответствует Core i7-870, а с Core i5-2500K конкурируют Core i5-660 и AMD Phenom II X6 1075T. Модель Phenom II X6 1100T является флагманом компании AMD и занимает среднее положение между линейками Core i7 и Core i5.

Все процессоры тестировались как в номинальном режиме (частота Uncore у Core i7-975 EE составляла 2940 МГц) со всеми включенными технологиями, такими как Hyper-Threading, Turbo Boost и Turbo Core, так и при разгоне до 3,8 ГГц с отключенными функциями авторазгона. Частота памяти всегда держалась на уровне 1333 МГц, представитель AMD разгонялся лишь один, так как разницы при этом между ними фактически не было бы:

  • Core i7-2600K — частота процессора 3800 МГц (38x100), память 1333 МГц (10x133);
  • Core i5-2500K — частота процессора 3800 МГц (38x100), память 1333 МГц (10x133);
  • Core i7-975 EE — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3114 МГц (18x173), память 1384 МГц (8x173);
  • Core i7-870 — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3114 МГц (18x173), память 1384 МГц (8x173);
  • Core i5-660 — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3806 МГц (22x173), память 1384 МГц (8x173);
  • Phenom II X6 1100T — частота процессора 3813 МГц (15,5x246), NB и HT 2214 МГц (9x246), память 1311 МГц (5,33x246).
Результаты тестирования в прикладном ПО

Подсистема памяти




Судя по результатам в программе Aida64 контроллер памяти Sandy Bridge действительно был переработан и демонстрирует высокую производительность, особенно в тесте на запись. Копирование данных происходит быстрее у старшей модели, а Core i5-2500K в этом случае близок по показателям к процессорам предыдущего поколения.


Обойти по латентности контроллер Lynnfield пока не удалось, но разница при стандартном режиме работы минимальна и больше проявляется уже с разгоном. И скорее всего, она будет расти с дальнейшим повышением частоты. Но учитывая потенциал новинок, на это обращать особо не стоит.

Синтетика


В PCMark Vantage рассматриваемые процессоры превосходят своих предшественников. Даже урезанный Sandy Bridge оказался производительнее бывшего флагмана компании Intel. Также достойно себя ведет Core i5-660, хотя в большинстве тестов этого пакета результатами он не блистал. Например, в игровом он хуже остальных решений компании на 20-40%.


Но за счет поддержки инструкций AES-NI в тесте Communications он почти на равных соперничает с двухтысячными моделями.


Отсюда такой высокий итоговый балл. Отметим небольшой проигрыш Core i5-2500K в игровом тесте.

Архивирование



Тестирование в архиваторах осуществлялось путем сжатия папки с различными файлами общим объемом 600 Мбайт. Оба новых процессора демонстрируют чудеса производительности. Двухъядерник Clarkdale не очень приспособлен к такой работе и результат приходится ждать в 1,5 раза дольше, чем с остальными участниками.

Рендеринг



В однопроцессороном тесте Cinebench 11 видна вся мощь архитектуры Sandy Bridge, но с переходом к многопоточному вычислению младший представитель начинает сдавать позиции, хотя и не значительно — он совсем немного отстает от более дорогого Core i7-870. Решения AMD, до этого находившиеся в тени, неожиданно вырвались вперед за счет своих шести ядер.



С POV-Ray такая же ситуация, и чем больше ядер у процессора, тем он производительнее в программе рендеринга.

Математические расчеты


Расчет количества ходов в Fritz Chess Benchmark также зависит от количества ядер или исполняемых потоков и Core i5-2500K опять отстает от Lynnfield. Его даже умудряется обойти Phenom II X6 1075T, и с разгоном разница между ними только увеличивается, вплоть до 16%.



Еще один хорошо оптимизированный под многопоточность бенчмарк. Лидеров в wPrime как таковых нет — все высокоуровневые процессоры обоих производителей показывают одинаковые результаты, которые зависят от частоты той или иной модели. Лишенный Hyper-Threading Sandy Bridge опять отстает, но не так сильно, как Core i5-660.

Работа с видео


Интересная картина наблюдается в x264 HD Benchmark, который производит двухпроходное сжатие видеофайла кодеком H.264. Первый проход на дух не переваривает Hyper-Threading и без этой технологии результат обычно выше, что мы и наблюдаем с Core i5-2500K.


Второй проход наоборот, требует как можно больше вычислительных ядер и полноценный новичок забирает заслуженную пальму первенства назад. Продукты AMD в этом тесте ни чуть не хуже конкурентов. Перспективы Clarkdale на фоне решений новой архитектуры кажутся туманными — им явно осталось на рынке совсем недолго.
Результаты тестирования в игровых приложениях

Синтетика



Теперь перейдем к игровым тестам, начав с синтетики. В 3DMark Vantage расстановка сил была предсказуема, учитывая его оптимизацию под многоядерность. Core i7-2600K безоговорочный лидер, вслед за ним расположились продукты на базе архитектуры Nehalem. Нынешний флагман AMD соперничает лишь с новым четырехъядерником Core i5, немного отставая от него. Но с разгоном они выступают почти вровень.


Новый тест на наших страницах показывает неоднозначные результаты — новинки проигрывают своим предшественникам до 3%. В чем же дело? Почему же 3DMark 11 так не благосклонен к ним? Смотрим на результаты процессорного теста Physics. В нем все закономерно и ничего нового мы не видим.


А вот в графическом подтесте наблюдается падение производительности системы на базе Sandy Bridge, и она пасует даже перед Core i5-660, во что очень трудно поверить.


Возможно, проблема заключается в реализации интерфейса PCI Express или еще чего-нибудь и в будущих версиях тестового пакета или драйверов она будет решена. Пока же можем отметить первое поражение представителей платформы LGA1155.

Игры



В реальных игровых приложениях, например, Crysis, двухтысячные модели смотрятся более привлекательно, особенно, когда 200-долларовый Core i5-2500K не хуже дорогих Lynnfield и Bloomfield.



Стратегия реального времени World in Conflict оказалась не менее чувствительной к новинкам. На фоне таких результатов покупка устаревших решений себя не оправдает. Если, конечно, они прилично не подешевеют.



S.T.A.L.K.E.R.: Call of Pripyat сильно зависит от частоты процессора и емкости его кэша. Если в номинале Core i5-2500K обходит на десяток кадров Core i7-870, то с разгоном последний берет реванш. Но ведь Lynnfield не сможет без проблем работать на частотах 4,5 ГГц, а то и выше, не так ли?

Выводы

Проведя колоссальную работу над ошибками, компания Intel представила микроархитектуру Sandy Bridge с огромным потенциалом, решения на базе которой отличаются высокой производительностью и экономичностью. И хотя ничего революционного в ней нет, именно с нее начнется новый виток развития процессорного рынка. Высокая интеграция и низкий уровень энергопотребления станут неотъемлемой частью будущих продуктов, обрастающих все большим функционалом, что невольно мы уже замечаем сейчас.

Процессоры Sandy Bridge, несмотря на свою среднюю стоимость, предлагают нам новый уровень производительности, ранее доступный лишь с топовыми решениями. Благодаря переработанному контроллеру памяти и некоторым архитектурным изменениям удалось избавиться от многих ограничивающих факторов, сдерживающих дальнейшее развитие архитектуры Nehalem. Но платой за это стала необходимость в новой платформе с разъемом LGA1155, несовместимой с ранее выпущенными решениями. Несмотря на всю привлекательность Sandy Bridge переход на нее с LGA1156 или даже LGA1366 вряд ли оправдает затраты, но она даст возможность наконец-то избавиться от древней LGA775 или же перейти из конкурирующего лагеря. Тем более, что новинка действительно того стоит.

Помимо процессорного ядра было усовершенствовано графическое, расположенное теперь на одном кристалле с остальными блоками. Его функциональность и производительность позволяет конкурировать с дискретными картами начального уровня серии GeForce и Radeon. Пользователям теперь не придется задумываться о покупке недорого адаптера, когда возможности встроенного сильно ограничены.

Энтузиасты оценят разгонный потенциал процессоров на базе очередной микроархитектуры, который благодаря использованию 32-нм техпроцесса вырос до 4,5-5,0 ГГц и выше. Такие частоты доступны при воздушном охлаждении и небольшом повышении питающего напряжения. Для подобных подвигов ранее необходимо было прибегнуть к усиленному охлаждению и серьезному увеличению напряжения питания.

Но какой бы ни была идеальной новая платформа, определенный недостаток в ней обязательно найдется. И в данном случае он касается энтузиастов. Разгонять процессоры теперь можно определенной серии с разблокированным множителем, а не любой, как это было ранее. И все бы ничего, если бы не их стоимость, которая пока находится в пределах 250-350 долларов, что не каждому оверклокеру будет по карману. Здесь явно не хватает более доступной модели, позволяющей экономным энтузиастам, коих большинство, безболезненно перейти на новую платформу.
— процессоры Intel Core i7-2600K, Core i5-2500K, Core i7-975 EE, Xeon X3470 и Core i5-660;

  • Kingston — память Kingston KHX2000C8D3T1K3/6GX;
  • Noctua — кулер Noctua NH-D14 и термопаста Noctua NT-H1;
  • Syntex — блок питания Seasonic SS-600HM;
  • Wilk Elektronik — память Goodram Play GY1600D364L8/4GDC.
  • Практически всегда под любой публикацией, в которой так или иначе затрагивается тема производительности современных интеловских процессоров, рано или поздно появляется несколько сердитых читательских комментариев о том, что прогресс в развитии чипов у Intel давно забуксовал и нет смысла переходить со «старого доброго Core i7-2600K» на что-то новое. В таких репликах, скорее всего, будет раздражённо упоминаться про прирост производительности на неосязаемом уровне «не более пяти процентов в год»; про низкокачественный внутренний термоинтерфейс, который непоправимо испортил современные процессоры Intel; либо про то, что покупать в современных условиях процессоры с таким же, как и несколько лет назад, количеством вычислительных ядер вообще - удел недальновидных дилетантов, так как в них нет необходимого задела на будущее.

    В том, что все такие реплики не лишены оснований, сомнений нет. Однако очень похоже, что они многократно преувеличивают имеющиеся проблемы. Лаборатория 3DNews подробно тестирует интеловские процессоры с 2000 года, и мы не можем согласиться с тезисом, что какому бы то ни было их развитию пришёл конец, а происходящее с микропроцессорным гигантом в течение последних лет иначе как стагнацией уже и не назовёшь. Да, какие-то кардинальные перемены с процессорами Intel происходят редко, но тем не менее они продолжают планомерно совершенствоваться. Поэтому те чипы серии Core i7, которые можно купить сегодня, заведомо лучше моделей, предлагавшихся несколько лет тому назад.

    Поколение Core Кодовое имя Техпроцесс Этап разработки Время выхода
    2 Sandy Bridge 32 нм Так (Архитектура) I кв. 2011
    3 Ivy Bridge 22 нм Тик (Процесс) II кв. 2012
    4 Haswell 22 нм Так (Архитектура) II кв. 2013
    5 Broadwell 14 нм Тик (Процесс) II кв. 2015
    6 Skylake 14 нм Так
    (Архитектура)
    III кв. 2015
    7 Kaby Lake 14+ нм Оптимизация I кв. 2017
    8 Coffee Lake 14++ нм Оптимизация IV кв. 2017

    Собственно, этот материал как раз и является контраргументом для рассуждений о никчёмности выбранной Intel стратегии постепенного развития потребительских CPU. Мы решили собрать в одном тесте старшие интеловские процессоры для массовых платформ за последние семь лет и посмотреть на практике, насколько представители серий Kaby Lake и Coffee Lake ушли вперёд относительно «эталонных» Sandy Bridge, которые за годы гипотетических сравнений и мысленных противопоставлений в представлении обывателей стали настоящей иконой процессоростроения.

    ⇡ Что поменялось в процессорах Intel c 2011 года по настоящее время

    Отправной точкой в новейшей истории развития процессоров Intel принято считать микроархитектуру Sandy Bridge . И это неспроста. Несмотря на то, что первое поколение процессоров под маркой Core было выпущено в 2008 году на базе микроархитектуры Nehalem, почти все основные черты, которые присущи современным массовым CPU микропроцессорного гиганта, вошли в обиход не тогда, а парой лет позднее, когда распространение получило следующее поколение процессорного дизайна, Sandy Bridge.

    Сейчас компания Intel приучила нас к откровенно неторопливому прогрессу в разработке микроархитектуры, когда нововведений стало очень мало и они почти не приводят к росту удельной производительности процессорных ядер. Но всего лишь семь лет назад ситуация была кардинально иной. В частности, переход от Nehalem к Sandy Bridge был ознаменован 15-20-процентным ростом показателя IPC (числа исполняемых за такт инструкций), что обуславливалось глубокой переделкой логической конструкции ядер с прицелом на повышение их эффективности.

    В Sandy Bridge были заложены многие принципы, которые с тех пор не менялись и стали стандартными для большинства процессоров сегодняшнего дня. Например, именно там появился отдельный кеш нулевого уровня для декодированных микроопераций, а также стал применяться физический регистровый файл, снижающий энергозатраты при работе алгоритмов внеочередного выполнения инструкций.

    Но, пожалуй, самым главным нововведением стало то, что Sandy Bridge был спроектирован как унифицированная система-на-чипе, рассчитанная одновременно на все классы применений: на серверные, десктопные и мобильные. Скорее всего, в прадедушки современных Coffee Lake общественное мнение поставило именно его, а не какой-нибудь Nehalem и уж тем более не Penryn, именно из-за этой особенности. Впрочем, и итоговая сумма всех переделок в глубинах микроархитектуры Sandy Bridge тоже оказалась весьма значительной. В конечном итоге этот дизайн утратил все старые родственные связи с P6 (Pentium Pro), которые то здесь, то там проявлялись во всех предшествующих процессорах Intel.

    Говоря об общей структуре, нельзя также не вспомнить и о том, что в процессорный кристалл Sandy Bridge впервые в истории интеловских CPU было встроено полноценное графическое ядро. Этот блок отправился внутрь процессора вслед за контроллером DDR3-памяти, разделяемым L3-кешем и контроллером шины PCI Express. Для соединения вычислительных ядер и всех остальных «внеядерных» частей инженеры Intel внедрили в Sandy Bridge новую на тот момент масштабируемую кольцевую шину, применяемую для организации взаимодействия между структурными единицами в последующих массовых CPU и по сей день.

    Если же опуститься на уровень микроархитектуры Sandy Bridge, то одной из ключевых её особенностей стала поддержка семейства SIMD-инструкций, AVX, предназначенных для работы с 256-битными векторами. К настоящему моменту такие инструкции прочно вошли в обиход и не кажутся чем-то необычным, но их реализация в Sandy Bridge потребовала расширения части вычислительных исполнительных устройств. Инженеры Intel стремились сделать работу с 256-битными данными такой же быстрой, как и с векторами меньшей разрядности. Поэтому вместе с реализацией полноценных 256-битных исполнительных устройств потребовалось и увеличение скорости работы процессора с памятью. Логические исполнительные устройства, предназначенные для загрузки и сохранения данных, в Sandy Bridge получили удвоенную производительность, кроме того, симметрично была увеличена пропускная способность кеш-памяти первого уровня при чтении.

    Нельзя не упомянуть и о сделанных в Sandy Bridge кардинальных изменениях в работе блока предсказания ветвлений. Благодаря оптимизациям в применяемых алгоритмах и увеличению размеров буферов, архитектура Sandy Bridge позволила сократить процент неверных предсказаний переходов почти вдвое, что не только заметно сказалось на производительности, но и позволило дополнительно снизить энергопотребление этого дизайна.

    В конечном итоге с сегодняшних позиций процессоры Sandy Bridge можно было бы назвать образцово-показательным воплощением фазы «так» в интеловском принципе «тик-так». Как и предшественники, данные процессоры продолжили базироваться на техпроцессе с 32-нм нормами, но предложенный ими рост производительности оказался более чем убедителен. И подпитывала его не только обновлённая микроархитектура, но и увеличенные на 10-15 процентов тактовые частоты, а также внедрение более агрессивной версии технологии Turbo Boost 2.0. Если учесть всё это, хорошо понятно, почему многие энтузиасты до сих пор вспоминают Sandy Bridge самыми тёплыми словами.

    Старшим предложением в семействе Core i7 на момент выхода микроархитектуры Sandy Bridge стал Core i7-2600K. Этот процессор получил тактовую частоту на уровне 3,3 ГГц с возможностью авторазгона при неполной нагрузке до 3,8 ГГц. Впрочем, отличали 32-нм представителей Sandy Bridge не только сравнительно высокие для того времени тактовые частоты, но и хороший разгонный потенциал. Среди Core i7-2600K нередко можно было встретить экземпляры, способные работать на частотах 4,8-5,0 ГГц, что во многом обуславливалось применением в них качественного внутреннего термоинтерфейса - бесфлюсового припоя.

    Через девять месяцев после выпуска Core i7-2600K, в октябре 2011 года, компания Intel обновила старшее предложение в модельном ряду и предложила немного ускоренную модель Core i7-2700K, номинальная частота которой была доведена до 3,5 ГГц, а максимальная частота в турборежиме - до 3,9 ГГц.

    Впрочем, жизненный цикл Core i7-2700K оказался коротким - уже в апреле 2012 года на смену Sandy Bridge пришёл обновлённый дизайн Ivy Bridge . Ничего особенного: Ivy Bridge относился к фазе «тик», то есть представлял собой перевод старой микроархитектуры на новые полупроводниковые рельсы. И в этом отношении прогресс действительно был серьёзным - кристаллы Ivy Bridge производились по 22-нм технологическому процессу, основанному на трёхмерных FinFET-транзисторах, которые в то время только входили в употребление.

    При этом старая микроархитектура Sandy Bridge на низком уровне осталась практически нетронута. Были выполнены лишь отдельные косметические переделки, которые ускорили выполнение в Ivy Bridge операций деления и немного повысили эффективность технологии Hyper-Threading. Правда, попутно были несколько улучшены «внеядерные» компоненты. Контроллер PCI Express получил совместимость с третьей версией протокола, а контроллер памяти увеличил свои возможности и стал поддерживать скоростную оверклокерскую DDR3-память. Но в итоге рост удельной производительности при переходе от Sandy Bridge к Ivy Bridge составил не более 3-5 процентов.

    Не дал серьёзных причин для радости и новый технологический процесс. К сожалению, внедрение 22-нм норм не позволило как-то принципиально нарастить тактовые частоты Ivy Bridge. Старшая версия Core i7-3770K получила номинальную частоту 3,5 ГГц с возможностью разгона в турборежиме до 3,9 ГГц, то есть с точки зрения частотной формулы она оказалась ничуть не быстрее Core i7-2700K. Улучшилась лишь энергоэффективность, однако пользователей настольных компьютеров этот аспект традиционно волнует слабо.

    Всё это, конечно, вполне можно списать на то, что на этапе «тик» никаких прорывов происходить и не должно, но кое в чём Ivy Bridge оказались даже хуже предшественников. Речь - о разгоне. При выводе на рынок носителей этого дизайна Intel приняла решение отказаться от использования при финальной сборке процессоров бесфлюсовой пайки галлиевым припоем теплораспределительной крышки к полупроводниковому кристаллу. Начиная с Ivy Bridge для организации внутреннего термоинтерфейса стала использоваться банальная термопаста, и это сразу же ударило по максимально достижимым частотам. По разгонному потенциалу Ivy Bridge определённо стали хуже, и в результате переход от Sandy Bridge к Ivy Bridge стал одним из самых спорных моментов в новейшей истории потребительских процессоров Intel.

    Поэтому на следующий этап эволюции, Haswell , возлагались особенные надежды. В этом поколении, относящемся к фазе «так», должны были появиться серьёзные микроархитектурные улучшения, от которых ожидалась способность как минимум продвинуть вперёд забуксовавший было прогресс. И в какой-то степени это произошло. Появившиеся летом 2013 года процессоры Core четвёртого поколения действительно приобрели заметные улучшения во внутренней структуре.

    Основное: теоретическая мощность исполнительных устройств Haswell, выражающаяся в количестве исполняемых за такт микроопераций, по сравнению с прошлыми CPU выросла на треть. В новой микроархитектуре не только был проведён ребаланс имеющихся исполнительных устройств, но и появилось два дополнительных исполнительных порта для целочисленных операций, обслуживания ветвлений и генерации адресов. Кроме того, микроархитектура получила совместимость с расширенным набором векторных 256-битных инструкций AVX2, которые благодаря трёхоперандным FMA-командам увеличили пиковую пропускную способность архитектуры вдвое.

    В дополнение к этому инженеры Intel пересмотрели ёмкость внутренних буферов и, где это было необходимо, увеличили их. Выросло в размере окно планировщика. Кроме того, были увеличены целочисленный и вещественночисленный физические регистровые файлы, что улучшило возможности процессора по переупорядочиванию порядка исполнения инструкций. В дополнение ко всему этому, существенно изменилась и подсистема кеш-памяти. L1- и L2-кеши в Haswell получили вдвое более широкую шину.

    Казалось бы, перечисленных улучшений должно быть достаточно для того, чтобы заметно поднять удельную производительность новой микроархитектуры. Но как бы не так. Проблема дизайна Haswell состояла в том, что он оставил без изменений входную часть исполнительного конвейера и декодер x86-команд сохранил ту же производительность, что и раньше. То есть максимальный темп декодирования x86-кода в микроинструкции остался на уровне 4-5 команд за такт. И в результате при сопоставлении Haswell и Ivy Bridge на одинаковой частоте и при нагрузке, не использующей новые AVX2-инструкции, выигрыш в производительности оказался всего лишь на уровне 5-10 процентов.

    Имидж микроархитектуры Haswell подпортила и первая волна процессоров, выпущенная на её основе. Опираясь на всё тот же 22-нм техпроцесс, что и Ivy Bridge, новинки не смогли предложить высокие частоты. Например, старший Core i7-4770K вновь получил базовую частоту 3,5 ГГц и максимальную частоту в турборежиме на уровне 3,9 ГГц, то есть по сравнению с прошлыми поколениями Core никакого продвижения не наметилось.

    В то же время с внедрением следующего технологического процесса с 14-нм нормами у Intel стали возникать разного рода трудности, поэтому через год, летом 2014 года, на рынок было выведено не следующее поколение процессоров Core, а вторая очередь Haswell, которая получила кодовые имена Haswell Refresh, или, если говорить о флагманских модификациях, то Devil’s Canyon. В рамках этого обновления Intel смогла заметно увеличить тактовые частоты 22-нм CPU, что действительно вдохнуло в них новую жизнь. В качестве примера можно привести новый старший процессор Core i7-4790K, который по номинальной частоте взял отметку в 4,0 ГГц и получил максимальную частоту с учётом турборежима на уровне 4,4 ГГц. Удивительно, что подобное полугигагерцевое ускорение было достигнуто без каких-либо реформ техпроцесса, а лишь за счёт простых косметических изменений в схеме питания процессоров и благодаря улучшению теплопроводящих свойств термопасты, используемой под крышкой CPU.

    Впрочем, даже представители семейства Devil’s Canyon особенно жалуемыми в среде энтузиастов предложениями стать не смогли. На фоне результатов Sandy Bridge их разгон нельзя было назвать выдающимся, к тому же достижение высоких частот требовало сложного «скальпирования» - демонтажа процессорной крышки с последующей заменой штатного термоинтерфейса каким-либо материалом с лучшей теплопроводностью.

    Из-за сложностей, которые преследовали Intel при переводе массового производства на 14-нм нормы, выступление следующего, пятого по счёту поколения процессоров Core, Broadwell , получилось сильно скомканным. Компания долго не могла решить, стоит ли вообще выпускать на рынок десктопные процессоры с этим дизайном, поскольку при попытках изготовления крупных полупроводниковых кристаллов уровень брака превышал приемлемые значения. В конечном итоге предназначенные для настольных компьютеров четырёхъядерники Broadwell всё-таки появились, но, во-первых, произошло это лишь летом 2015 года - с девятимесячным опозданием относительно изначально запланированного срока, а во-вторых, уже через два месяца после их анонса Intel представила дизайн следующего поколения, Skylake.

    Тем не менее с точки зрения развития микроархитектуры Broadwell трудно назвать вторичной разработкой. И даже более того, в настольных процессорах этого поколения применялись такие решения, к которым ни до того, ни после того Intel никогда не прибегала. Уникальность десктопных Broadwell определялась тем, что в них проникло производительное интегрированное графическое ядро Iris Pro уровня GT3e. И это значит не только то, что процессоры этого семейства обладали самым мощным на тот момент встроенным видеоядром, но и также то, что они комплектовались дополнительным 22-нм кристаллом Crystall Well, представляющим собой основанную на eDRAM кеш-память четвёртого уровня.

    Смысл добавления в процессор отдельного чипа быстрой встроенной памяти вполне очевиден и обусловлен потребностями производительного встроенного графического ядра в фрейм-буфере с низкой латентностью и высокой пропускной способностью. Однако установленная в Broadwell память eDRAM архитектурно была выполнена именно как виктимный кеш, и ей могли пользоваться и вычислительные ядра CPU. В результате десктопные Broadwell стали единственными в своём роде массовыми процессорами с 128 Мбайт L4-кеша. Правда, при этом несколько пострадал объём расположенного в процессорном кристалле L3-кеша, который был сокращён с 8 до 6 Мбайт.

    Некоторые улучшения были заложены и в базовой микроархитектуре. Несмотря на то, что Broadwell относился к фазе «тик», переделки коснулись входной части исполнительного конвейера. Было увеличено окно планировщика внеочередного исполнения команд, в полтора раза вырос объём таблицы ассоциативной трансляции адресов второго уровня, а, кроме того, вся схема трансляции приобрела второй обработчик промахов, что позволило обрабатывать по две операции преобразования адресов параллельно. В сумме все нововведения повысили эффективность внеочередного исполнения команд и предсказания сложных ветвлений кода. Попутно были усовершенствованы механизмы выполнения операций умножения, которые в Broadwell стали обрабатываться в существенно более быстром темпе. По итогам всего этого Intel даже смогла утверждать, что улучшения микроархитектуры повысили удельную производительность Broadwell по сравнению с Haswell на величину порядка пяти процентов.

    Но несмотря на всё это, ни о каком существенном преимуществе первых десктопных 14-нм процессоров вести речь было невозможно. И кеш четвёртого уровня, и микроархитектурные изменения лишь пытались скомпенсировать главный изъян Broadwell - низкие тактовые частоты. Из-за проблем с технологическим процессом базовая частота старшего представителя семейства, Core i7-5775C, была установлена лишь на уровне 3,3 ГГц, а частота в турборежиме не превышала 3,7 ГГц, что оказалось хуже характеристик Devil’s Canyon на целых 700 МГц.

    Подобная же история произошла и с разгоном. Предельные частоты, до которых удавалось раскочегаривать десктопные Broadwell без использования продвинутых методов охлаждения, находились в районе 4,1-4,2 ГГц. Поэтому нет ничего удивительного, что потребители восприняли выпуск Broadwell скептически, и процессоры этого семейства так и остались странным нишевым решением для тех, кто был заинтересован в производительном встроенном графическом ядре. Первым же полноценным 14-нм чипом для настольных компьютеров, который смог привлечь к себе внимание широких слоёв пользователей, стал только следующий проект микропроцессорного гиганта - Skylake .

    Производство Skylake, как и процессоров предыдущего поколения, выполнялось по 14-нм техпроцессу. Однако здесь Intel уже смогла добиться нормальных тактовых частот и разгона: старшая десктопная версия Skylake, Core i7-6700K, получила номинальную частоту 4,0 ГГц и авторазгон в рамках турборежима до 4,2 ГГц. Это чуть более низкие значения, если сравнивать с Devil’s Canyon, однако более новые процессоры оказались определённо быстрее предшественников. Дело в том, что Skylake - это «так» в интеловской номенклатуре, что означает существенные изменения в микроархитектуре.

    И они действительно есть. Улучшений в дизайне Skylake на первый взгляд было сделано не так много, но все они носили прицельный характер и позволили устранить имевшиеся слабые места в микроархитектуре. Если коротко, то Skylake получили увеличенные внутренние буфера для более глубокого внеочередного исполнения инструкций и более высокую пропускную способность кеш-памяти. Усовершенствования затронули блок предсказания переходов и входную часть исполнительного конвейера. Также был увеличен темп исполнения инструкций деления, и перебалансированы механизмы исполнения операций сложения, умножения и FMA-инструкций. В довершение разработчики потрудились над повышением эффективности технологии Hyper-Threading. В сумме это позволило добиться примерно 10-процентного улучшения производительности на такт в сравнении с процессорами прошлых поколений.

    В целом Skylake можно охарактеризовать как достаточно глубокую оптимизацию исходной архитектуры Core, с таким расчётом, чтобы в дизайне процессора не оставалось никаких узких мест. С одной стороны, за счёт увеличения мощности декодера (с 4 до 5 микроопераций за такт) и скорости работы кеша микроопераций (с 4 до 6 микроопераций за такт) существенно увеличился темп декодирования инструкций. А с другой - выросла эффективность обработки получающихся микроопераций, чему поспособствовало углубление алгоритмов внеочередного исполнения и перераспределение возможностей исполнительных портов вместе с серьёзной ревизией темпа исполнения целого ряда обычных, SSE и AVX-команд.

    Например, Haswell и Broadwell имели по два порта для исполнения умножений и FMA-операций над вещественными числами, но только один порт предназначался для сложений, что плохо соответствовало реальному программному коду. В Skylake этот дисбаланс был устранён и сложения стали выполняться уже на двух портах. Кроме того, количество портов, способных работать с целочисленными векторными инструкциями, выросло с двух до трёх. В конечном итоге всё это привело к тому, что практически для любого типа операций в Skylake всегда есть несколько альтернативных портов. А это значит, что в микроархитектуре наконец были успешно устранены практически все возможные причины простоя конвейера.

    Заметные изменения затронули и подсистему кеширования: пропускная способность кеш-памяти второго и третьего уровня была увеличена. Кроме того, сократилась ассоциативность кеша второго уровня, что в конечном счёте позволило улучшить его КПД и уменьшить штраф при обработке промахов.

    Существенные перемены произошли и на более высоком уровне. Так, в Skylake вдвое выросла пропускная способность кольцевой шины, которая соединяет все процессорные блоки. Кроме того, в CPU этого поколения обосновался новый контроллер памяти, который получил совместимость с DDR4 SDRAM. А в дополнение к этому для соединения процессора с чипсетом стала применяться новая шина DMI 3.0 с увеличенной вдвое пропускной способностью, что дало возможность реализовать скоростные линии PCI Express 3.0 в том числе и через чипсет.

    Впрочем, как и все предшествующие версии архитектуры Core, Skylake представлял собой ещё одну вариацию на тему изначального дизайна. А это значит, что и в шестом поколении микроархитектуры Core разработчики Intel продолжили придерживаться тактики поэтапного внедрения улучшений на каждом цикле разработки. В целом это - не слишком впечатляющий подход, который не позволяет увидеть какие-то значимые изменения в производительности сразу - при сравнении CPU из соседних поколений. Но зато при модернизации старых систем ощутимый прирост производительности заметить совсем несложно. Например, сама Intel охотно сравнивала Skylake с Ivy Bridge, демонстрируя при этом, что за три года быстродействие процессоров выросло более чем на 30 процентов.

    И в действительности это был достаточно серьёзный прогресс, потому что потом всё стало значительно хуже. После Skylake какое бы то ни было улучшение удельной производительности процессорных ядер прекратилось совсем. Те процессоры, которые представлены на рынке в настоящее время, всё ещё продолжают использовать микроархитектурный дизайн Skylake, несмотря на то, что с момента его появления в десктопных процессорах прошло уже почти три года. Неожиданный простой случился из-за того, что Intel не смогла справиться со внедрением следующей версии полупроводникового процесса с 10-нм нормами. В результате весь принцип «тик-так» рассыпался, вынудив микропроцессорного гиганта как-то выкручиваться и заниматься многократным перевыпуском старых продуктов под новыми именами.

    Процессоры поколения Kaby Lake , которые появились на рынке в самом начале 2017 года, стали первым и очень ярким примером попыток Intel продать клиентам тот же Skylake во второй раз. Близкие родственные связи между двумя поколениями процессоров особо и не скрывались. Intel честно говорила, что Kaby Lake - это уже не «тик» и не «так», а простая оптимизация предыдущего дизайна. При этом под словом «оптимизация» понимались некие улучшения в структуре 14-нм транзисторов, которые открывали возможность увеличения тактовых частот без изменения рамок теплового пакета. Для видоизменённого техпроцесса был даже придуман специальный термин «14+ нм». Благодаря этой производственной технологии старший массовый десктопный процессор Kaby Lake, получивший наименование Core i7-7700K, смог предложить пользователям номинальную частоту 4,2 ГГц и частоту турборежима 4,5 ГГц.

    Таким образом, рост частот Kaby Lake по сравнению с оригинальным Skylake составил примерно 5 процентов, и этим всё и ограничивалось, что, честно говоря, ставило под сомнение правомерность отнесения Kaby Lake к следующему поколению Core. До этого момента каждое последующее поколение процессоров, не важно, относилось оно к фазе «тик» или «так», обеспечивало хоть какой-то прирост показателя IPC. Между тем в Kaby Lake никаких микроархитектурных улучшений не было вообще, поэтому эти процессоры логичнее было бы считать просто вторым степпингом Skylake.

    Однако новая версия 14-нм техпроцесса всё же смогла кое в чём положительно проявить себя: разгонный потенциал Kaby Lake по сравнению с Skylake подрос примерно на 200-300 МГц, благодаря чему процессоры данной серии оказались достаточно тепло встречены энтузиастами. Правда, Intel продолжила использовать под процессорной крышкой вместо припоя термопасту, поэтому для полноценного разгона Kaby Lake необходимо было проводить скальпирование.

    Не справилась Intel и с вводом в строй 10-нм технологии и к началу текущего года. Поэтому в конце прошлого года на рынок была выведена ещё одна разновидность процессоров, построенных на всё той же микроархитектуре Skylake, - Coffee Lake . Но говорить о Coffee Lake как о третьем обличье Skylake не совсем правильно. Прошлый год стал периодом кардинальной смены парадигмы на процессорном рынке. В «большую игру» вернулась AMD, которая смогла переломить устоявшиеся традиции и создать спрос на массовые процессоры с числом ядер более четырёх. Внезапно Intel оказалась в роли догоняющей, и выход Coffee Lake стал не столько попыткой заполнить паузу до долгожданного появления 10-нм процессоров Core, сколько реакцией на выход шести- и восьмиядерных процессоров AMD Ryzen.

    В результате процессоры Coffee Lake получили важное структурное отличие от своих предшественников: число ядер в них было увеличено до шести штук, что с массовой платформой Intel произошло впервые. Однако при этом никаких изменений на уровне микроархитектуры вновь введено не было: Coffee Lake по сути - шестиядерный Skylake, собранный на основе точно таких же по внутреннему устройству вычислительных ядер, которые снабжены увеличенным до 12 Мбайт L3-кешем (по стандартному принципу 2 Мбайт на ядро) и объединены привычной кольцевой шиной.

    Впрочем, несмотря на то, что мы так запросто позволяем себе говорить о Coffee Lake «ничего нового», утверждать о полном отсутствии каких-то перемен не совсем справедливо. Хотя в микроархитектуре вновь ничего не поменялось, специалистам Intel пришлось потратить немало усилий для того, чтобы шестиядерные процессоры смогли вписаться в стандартную десктопную платформу. И результат вышел достаточно убедительным: шестиядерные процессоры остались верны привычному тепловому пакету и, более того, совсем не замедлились по тактовым частотам.

    В частности, старший представитель поколения Coffee Lake, Core i7-8700K, получил базовую частоту 3,7 ГГц, а в турборежиме он может разгоняться до 4,7 ГГц. При этом оверклокерский потенциал Coffee Lake, несмотря на его более массивный полупроводниковый кристалл, оказался даже лучше, чем у всех предшественников. Core i7-8700K нередко выводятся их рядовыми владельцами на пятигигагерцевый рубеж, причём такой разгон бывает реален даже без скальпирования и замены внутреннего термоинтерфейса. И это значит, что Coffee Lake хоть и экстенсивный, но существенный шаг вперёд.

    Всё это стало возможным исключительно благодаря очередному усовершенствованию 14-нм технологического процесса. На четвёртый год его использования для массового производства десктопных чипов Intel удалось добиться действительно впечатляющих результатов. Внедрённая третья версия 14-нм норм («14++ нм» в обозначениях производителя) и перекомпоновка полупроводникового кристалла позволили существенно улучшить производительность в пересчёте на каждый затраченный ватт и поднять суммарную вычислительную мощность. Внедрением шестиядерности Intel, пожалуй, смогла совершить даже более значительный шаг вперёд, чем любым из предшествующих тому улучшений микроархитектуры. И сегодня Coffee Lake смотрится весьма соблазнительным вариантом для модернизации старых систем, основанных на предыдущих носителях микроархитектуры Core.

    Кодовое имя Техпроцесс Число ядер GPU L3-кеш, Мбайт Число транзисторов, млрд Площадь кристалла, мм 2
    Sandy Bridge 32 нм 4 GT2 8 1,16 216
    Ivy Bridge 22 нм 4 GT2 8 1,2 160
    Haswell 22 нм 4 GT2 8 1,4 177
    Broadwell 14 нм 4 GT3e 6 Н/д ~145 + 77 (eDRAM)
    Skylake 14 нм 4 GT2 8 Н/д 122
    Kaby Lake 14+ нм 4 GT2 8 Н/д 126
    Coffee Lake 14++ нм 6 GT2 12 Н/д 150

    ⇡ Процессоры и платформы: спецификации

    Для проведения сравнения семи последних поколений Core i7 мы взяли старших представителей в соответствующих сериях - по одному от каждого дизайна. Основные характеристики этих процессоров приведены в следующей таблице.

    Core i7-2700K Core i7-3770K Core i7-4790K Core i7-5775C Core i7-6700K Core i7-7700K Core i7-8700K
    Кодовое имя Sandy Bridge Ivy Bridge Haswell (Devil’s Canyon) Broadwell Skylake Kaby Lake Coffee Lake
    Технология производства, нм 32 22 22 14 14 14+ 14++
    Дата выхода 23.10.2011 29.04.2012 2.06.2014 2.06.2015 5.08.2015 3.01.2017 5.10.2017
    Ядра/потоки 4/8 4/8 4/8 4/8 4/8 4/8 6/12
    Базовая частота, ГГц 3,5 3,5 4,0 3,3 4,0 4,2 3,7
    Частота Turbo Boost, ГГц 3,9 3,9 4,4 3,7 4,2 4,5 4,7
    L3-кеш, Мбайт 8 8 8 6 (+128 Мбайт eDRAM) 8 8 12
    Поддержка памяти DDR3-1333 DDR3-1600 DDR3-1600 DDR3L-1600 DDR4-2133 DDR4-2400 DDR4-2666
    Расширения набора инструкций AVX AVX AVX2 AVX2 AVX2 AVX2 AVX2
    Интегрированная графика HD 3000 (12 EU) HD 4000 (16 EU) HD 4600 (20 EU) Iris Pro 6200 (48 EU) HD 530 (24 EU) HD 630 (24 EU) UHD 630 (24 EU)
    Макс. частота графического ядра, ГГц 1,35 1,15 1,25 1,15 1,15 1,15 1,2
    Версия PCI Express 2.0 3.0 3.0 3.0 3.0 3.0 3.0
    Линии PCI Express 16 16 16 16 16 16 16
    TDP, Вт 95 77 88 65 91 91 95
    Сокет LGA1155 LGA1155 LGA1150 LGA1150 LGA1151 LGA1151 LGA1151v2
    Официальная цена $332 $332 $339 $366 $339 $339 $359

    Любопытно, что за прошедшие с момента выпуска Sandy Bridge семь лет Intel так и не смогла заметно нарастить тактовые частоты. Несмотря на то, что дважды менялся технологический производственный процесс и дважды серьезно оптимизировалась микроархитектура, сегодняшние Core i7 почти не продвинулись вперёд по своей рабочей частоте. Новейший Core i7-8700K имеет номинальную частоту 3,7 ГГц, что всего лишь на 6 процентов выше частоты вышедшего в 2011 году Core i7-2700K.

    Впрочем, такое сравнение не совсем корректно, ведь Coffee Lake имеет в полтора раза больше вычислительных ядер. Если же ориентироваться на четырёхъядерный Core i7-7700K, то рост частоты выглядит всё-таки убедительнее: этот процессор ускорился относительно 32-нм Core i7-2700K на достаточно весомые 20 процентов в мегагерцевом выражении. Хотя всё равно вряд ли это можно назвать впечатляющим приростом: в абсолютных величинах это конвертируется в прибавку по 100 МГц в год.

    Нет никаких прорывов и в других формальных характеристиках. Intel продолжает снабжать все свои процессоры индивидуальной кеш-памятью второго уровня объёмом 256 Кбайт на ядро, а также общим на все ядра L3-кешем, размер которого определяется из расчёта 2 Мбайт на ядро. Иными словами, главный фактор, по которому произошёл самый большой прогресс, - это число вычислительных ядер. Развитие Core начиналось с четырёхъядерных CPU, а пришло к шестиядерным. Причём очевидно, что это ещё не конец и в ближайшей перспективе мы увидим и восьмиядерные варианты Coffee Lake (либо Whiskey Lake).

    Впрочем, как нетрудно заметить, за семь лет у Intel почти не менялась и ценовая политика. Даже шестиядерный Coffee Lake по сравнению с предшествующими четырёхъядерными флагманами подорожал всего лишь на шесть процентов. Все же остальные старшие процессоры класса Core i7 для массовой платформы всегда обходились потребителям в сумму порядка $330-340.

    Любопытно, что самые крупные перемены произошли даже не с самими процессорами, а с поддержкой ими оперативной памяти. Пропускная способность двухканальной SDRAM с момента выхода Sandy Bridge и до сегодняшнего дня выросла вдвое: с 21,3 до 41,6 Гбайт/с. И это - ещё одно немаловажное обстоятельство, определяющее преимущество современных систем, совместимых со скоростной DDR4-памятью.

    Да и вообще, все эти годы вместе с процессорами эволюционировала и вся остальная платформа. Если вести речь о главных вехах в развитии платформы, то, помимо роста скорости совместимой памяти, отметить хочется и появление поддержки графического интерфейса PCI Express 3.0. Кажется, что скоростная память и быстрая графическая шина наряду с прогрессом в частотах и архитектурах процессоров выступают весомыми причинами того, что современные системы стали лучше и быстрее прошлых. Поддержка DDR4 SDRAM появилась в Skylake, а перевод процессорной шины PCI Express на третью версию протокола произошёл ещё в Ivy Bridge.

    Кроме того, заметное развитие получили и сопутствующие процессорам наборы системной логики. Действительно, сегодняшние интеловские чипсеты трёхсотой серии могут предложить гораздо более интересные возможности в сравнении с Intel Z68 и Z77, которые использовались в LGA1155-материнских платах под процессоры поколения Sandy Bridge. В этом нетрудно убедиться по следующей таблице, в которой мы свели воедино характеристики флагманских интеловских чиспсетов для массовой платформы.

    P67/Z68 Z77 Z87 Z97 Z170 Z270 Z370
    Совместимость с CPU Sandy Bridge
    Ivy Bridge
    Haswell Haswell
    Broadwell
    Skylake
    Kaby Lake
    Coffee Lake
    Интерфейс DMI 2.0 (2 Гбайт/с) DMI 3.0 (3,93 Гбайт/с)
    Стандарт PCI Express 2.0 3.0
    Линии PCI Express 8 20 24
    Поддержка PCIe M.2 Нет
    Есть
    Есть, до 3 устройств
    Поддержка PCI Есть Нет
    SATA 6 Гбит/с 2 6
    SATA 3 Гбит/с 4 0
    USB 3.1 Gen2 0
    USB 3.0 0 4 6 10
    USB 2.0 14 10 8 4

    В современных наборах логики существенно развились возможности для подключения высокоскоростных носителей информации. Самое главное: благодаря переходу чипсетов на шину PCI Express 3.0 сегодня в производительных сборках можно использовать быстродействующие NVMe-накопители, которые даже по сравнению с SATA SSD могут предложить заметно лучшую отзывчивость и более высокую скорость чтения и записи. И одно только это может стать веским аргументом в пользу модернизации.

    Кроме того, современные наборы системной логики предоставляют гораздо более богатые возможности для подключения дополнительных устройств. И речь не только о существенном увеличении числа линий PCI Express, что обеспечивает наличие на платах нескольких дополнительных слотов PCIe, заменяющих обычные PCI. Попутно в сегодняшних чипсетах имеется также и врождённая поддержка портов USB 3.0, а многие современные материнские платы снабжаются и портами USB 3.1 Gen2.

    Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


    Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

    Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

    При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


    Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


    Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


    Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

    System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


    Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

    Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


    За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


    Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


    В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


    Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

    Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


    Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


    Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

    После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.