что такое sandy bridge

Буря в песках. Изучаем новую процессорную архитектуру Intel Sandy Bridge

Компания Intel продолжает следовать стратегии развития «Тик-так» (Tick-Tock), принятой в 2006 году. Согласно этой стратегии, цикл разработки делится на два этапа, «тик» и «так»: в один год (на счет «тик») процессоры переводят на новые нормы производства, а еще через год (на «так») выпускают новую архитектуру.

В этом году часики Intel сделали «так»: на CES 2011 компания представила процессоры Sandy Bridge. Производитель подробно рассказал о новой архитектуре, похвалился достижениями и объявил сразу три линейки кристаллов. Сейчас мы будем с ними разбираться и тестировать — но для начала вспомним, в каком ключе Intel развивала процессоры последнюю пару лет.

Вчера

В 2008 году компания представила переработанные Core 2Core i7-9х0 на архитектуре Nehalem. С них Intel начала эксперименты с интеграцией, перенеся контроллер памяти с материнской платы на кристалл.

В 2009 году вышла линейка Lynnfield, бюджетная версия Nehalem. В ней под крышку кристалла переместили северный мост чипсета: к контроллеру памяти подселили чип PCIe 2.0.

В начале 2010-го появилось семейство Clarkfield. С ним Intel перешла с 45— на 32-нм техпроцесс и добавила в процессор самую настоящую видеокарту. Графика делалась по 45-нм нормам, стояла отдельно от процессорных ядер и с грехом пополам запускала игры пятилетней давности, но впечатление производила будь здоров.

Sandy Bridge — логическое развитие идей Intel. Множество улучшений в ядрах, более быстрая графика, гибкое управление энергопотреблением и разгоном. В общем, традиционное обновление архитектуры: вроде то же самое, но работает лучше. Глобальных изменений почти нет. Просто сказать «вот тут стало больше, поэтому работает быстрее» не получится, надо разбираться с каждой мелочью и залезать в основы работы компьютера. Чтобы облегчить восприятие статьи, мы подготовили множество поясняющих врезок, к которым и рекомендуем обращаться во время чтения основного текста.

Новая память

Начнем с процессорных ядер. Первое изменение сделали в блоке Front-End (см. врезку «С немецким педантизмом») — добавили кэш-память L0. Стоит она сразу после декодеров и записывает все входящие микрооперации с блока Front-End. Приступая к работе над новой задачей, процессор обращается к кэшу L0 и проверяет, нет ли там нужных инструкций. Если есть, то забирает их напрямую из кэш-памяти. Если нет, то дает сигнал блоку Front-End — и работает по старой схеме. Прелесть подхода в том, что, когда нужная микрооперация найдена, Front-End отключается. В итоге экономится и время, и энергопотребление.

Никакого алгоритма работы у L0-кэша нет. Сюда записывается все подряд, но за счет того, что L0-кэш хранит до 1500 микроопераций, шанс попадания, по словам Intel, составляет порядка 80%.

С немецким педантизмом

Блок Front-End также называется блоком предварительной выборки. Он отвечает за общение программы с процессором, своевременно загружает нужные данные и объясняет кристаллу, что надо делать.

Положим, вы сказали процессору перемножить два числа. Блок предварительной выборки загрузит из памяти и переведет на понятный процессору язык нужные числа, расшифрует, что такое умножение, и покажет, на каких блоках нужно сделать эту операцию. Последние пару пунктов он запишет в виде микроопераций, которые в Sandy Bridge теперь хранятся в памяти L0.

Ясновидящий

Вслед за блоком Front-End переработали блок предсказания ветвлений (см. врезку «На кофейной гуще»): увеличили объем памяти и придумали новую систему записи удачных предсказаний. Если в Nehalem каждую ветку программы помечали в таблице двумя битами (правильно/неправильно), то теперь на одно «правильно» записывают несколько веток. То есть объем таблицы тот же, а полезной информации больше. Экономнее стали обращаться и с кэш-памятью. Раньше на адрес ветки место в L1-кэше выделяли с запасом — теперь, в Sandy Bridge, каждый адрес занимает ровно столько, сколько ему нужно, ни одного байта не тратится зря.

Все это — увеличенная память, новый метод записи и отказ от фиксированного размера адреса — должно повысить процент удачных предсказаний и снизить частоту сброса памяти. А это значит, что ядра станут реже считать ненужные ветки и программа будет выполняться быстрее.

Без очереди

Сильнее всего в Sandy Bridge переделали блок Out-of-Order (см. врезку «Первый пошел»), добавив физический регистр файлов — такой шкаф с ящиками. Перед входом в Out-of-Order инструкции складывают в него свои данные, а на выходе их забирают. Таким образом разгружается шина данных, а инструкции проскакивают Out-of-Order налегке.

Эта схема значительно ускорила работу блока внеочередного исполнения и позволила Intel подключить поддержку инструкций AVX (Advanced Vector Extensions). Новый набор должен заменить устаревшие инструкции SSE (Streaming SIMD Extensions) и расширить возможности SIMD-блоков. В отличие от SSE, инструкции AVX работают не с 128-, а с 256-бит регистрами. Это увеличивает точность вычислений и позволяет одновременно работать с большим количеством данных. Иными словами, программистам будет проще писать программы, а у нас будут быстрее работать графические, звуковые, видео— и тому подобные проигрыватели или редакторы. Сейчас AVX поддерживают лишь несколько программ, но Intel возлагает на технологию большие надежды и всячески поощряет ее использование.

Интересно, что для введения AVX не пришлось менять SIMD-блоки — они все так же работают с 128-битными регистрами, а для расчета AVX просто объединяют усилия. То же самое происходит и с памятью L1, в которой расположены регистры. Как и в Nehalem, в Sandy Bridge память связана с блоком Front-End двумя шинами. В старой архитектуре одна отвечала за передачу, а вторая — за прием данных. Теперь они работают в обе стороны: когда нужно передать сразу 256-бит информации, объединяются и загружают в SIMD нужное количество данных.

На этом изменения в процессорных ядрах заканчиваются. Как видите, никакой революции: тут добавили, там улучшили, и все вместе стало работать быстрее. Давайте теперь посмотрим, что Intel придумала в остальной части процессора.

Блок предсказания ветвлений — одна из важнейших частей современного процессора. Он не дает простаивать блоку Front-End. Предсказатель угадывает, какую ячейку памяти и инструкцию может запросить программа в следующий момент, и заставляет процессор просчитывать ее заранее.

Возьмем для примера автомобильный конвейер. Каждый раз, когда заканчивается сборка кузова, рабочие устанавливают в него сиденья. Блок предсказаний улавливает такие закономерности и, пока автомобиль еще собирается, отправляет заказ на кресла, выдает рабочим инструкции. Конечно, бывает, что в автомобиль требуются не простые сиденья, а с обогревом, и тогда время на заказ и сборку тратится зря. Но по сравнению с тем, что удается сэкономить на верных заказах, эта ошибка кажется мелочью.

Чтобы реже ошибаться, предсказатель переходов ведет две таблицы: в одной хранит информацию о том, откуда берутся кресла, во второй — возможные инструкции. Каждый прогноз предсказатель помечает двумя битами (правильно/неправильно), а затем сверяет таблицы и выводит закономерности — скажем, о том, что подогрев нужен только на каждую третью машину, а кресла — каждый раз. Чем дольше предсказатель наблюдает за программой, тем реже он ошибается.

Графика

Графическое ядро на процессорах Clarkdale вызывало противоречивые чувства. С одной стороны, процессор и видеокарта в одном флаконе — это круто: торжество технологий. С другой — игровому компьютеру с дискретной видеокартой встроенное ядро как собаке пятая нога, а платить за него все равно приходится.

С Sandy Bridge все то же самое: новые процессоры по умолчанию оснащены графическим ядром. Только теперь оно создается по 32-нм технологии и стоит на одном кристалле с процессорными ядрами.

Intel представила два графических процессора — HD Graphics 2000 и HD Graphics 3000. Различие между ними — в количестве потоковых ядер (Execution Units). У младшей версии их шесть, у старшей — двенадцать. К сожалению, сравнить HD Graphics не с чем, слишком они отличаются от карт NVIDIA и AMD. Тут нет видеопамяти — используется кэш L3. Ядра работают только с жестко заданными функциями — никакого GPGPU. Пожалуй, единственная понятная нам здесь характеристика — это тактовая частота. Новая графика работает на скорости 650 или 850 МГц и может разгоняться до 1100, 1250 и 1350 МГц.

Хотя Intel утверждает, что новое графическое ядро в два раза быстрее встроенного в Clarkdale, будущее HD Graphics нам видится смутно. С дискретными видеокартами ей не соревноваться — проиграет. Поддержки DirectX 11 нет, только DirectX 10.1. До офисных компьютеров Sandy Bridge доберется не скоро. Пожалуй, единственное, где HD Graphic придется к месту, — это ноутбуки. Мобильные процессоры оснащают HD Graphics 3000, топовой версией, а значит, поиграть можно будет даже на слабом ноутбуке.

Блок Out-of-Order (блок внеочередного исполнения операций) следит за тем, чтобы операции выполнялись только при наличии нужных данных и процессор не простаивал почем зря.

Представьте себе супермаркет. Вы взяли бутылочку воды и хотите ее оплатить. Подходите к кассе, а там стоит человек с доверху набитой тележкой. И вы ждете, пока он выложит все продукты, наберет жвачек, конфет. в общем, тратите время. А если бы рядом стоял специальный человек — Out-of-Order, — то он бы вам сказал: «Проходите, оплачивайте свою воду». И касса бы не простаивала, и вы свое время не теряли.

С программами то же самое. Блок Out-of-Order разбирается, что уже можно считать, а что пока следует отложить. При этом он не видит разницы между началом или серединой программы. Главное — не давать простаивать вычислительным ядрам, а уж собрать полученные данные и выстроить их в нужном порядке можно и потом.

Агент Смит

Помимо графического ядра, под крышкой кристалла стоит еще и северный мост. Теперь он называется System Agent, а не un-core, как в Lynnfield и Clarkdale. В него входит двухканальный контроллер памяти, PCIe 2.0, шина FDI для вывода изображения с графического ядра и чип управления питанием (Power Control Unit).

Изменений немного. Контроллер памяти научили работать с планками DDR3 на частоте до 1333 МГц и через множитель разгонять их до 2133 МГц. Шина FDI теперь поддерживает DisplayPort 1.2 и HDMI 1.4 — можно смотреть Blu-ray 3D. Чип PCIe 2.0 оставили прежним: доступно 16 линий, которые можно разделить на два слота PCIe x8. Контроллер PCU умеет гибко регулировать частоту и питание как процессора, так и графического ядра, поддерживать баланс температуры и экономить энергопотребление любыми возможными способами.

Третье транспортное

Чтобы собрать такое количество компонентов в одно целое, Intel пришлось отказаться от перекрестных шин и придумать кое-что новое. Решение подсмотрели в серверных процессорах Nehalem EX, в которых используется кольцевая шина (Ring Bus). Принцип ее работы можно сравнить с транспортным кольцом. Данные непрерывно двигаются по дороге и делают остановки в нужных местах: у процессорного ядра, в системном агенте, кэш-памяти L3, видеокарте и так далее. Прелесть в том, что количество остановок не ограничено, дополнительные пункты можно добавлять до бесконечности.

В Sandy Bridge шина разделена на четыре кольца: данные, запросы, мониторинг состояния и подтверждение. Каждое может переносить по 32 байта за такт и работать на частоте процессора. Пиковая пропускная способность составляет 96 Гбит/с. К сожалению, при простое и снижении частоты ядер скорость шины падает, и из-за этого может пострадать работа графического процессора. То же самое касается и L3-кэша.

Заставить процессор считать быстрее сложно. Да, можно вводить всякие предсказатели, внеочередное исполнение и тому подобное, но скорость работы все равно зависит от времени выполнения одной операции.

Долгое время производительность увеличивали, наращивая частоту работы или количество выполняемых в секунду операций. Этот метод эффективный, но тупиковый: бесконечно увеличивать скорость невозможно. Поэтому придумали новый способ — параллельные вычисления.

Очередной пример. Вам дали калькулятор и попросили сложить три пары чисел. Вы берете одну пару, складываете и записываете результат, другую — складываете и записываете результат, третью — складываете и записываете результат. Способ верный, но долгий. Чтобы ускорить процесс, можно позвать еще двух человек, вручить каждому по паре чисел и сложить все одновременно. Так за один такт вам удастся выполнить всю задачу. Главное в такой ситуации позаботиться, чтобы команда «складывать» и числа были доступны одновременно всем действующим лицам.

Такой способ увеличения производительности называется SIMD (Single Instruction — Multiple Data, «Одна инструкция — много данных»). В ядра процессора ставят несколько вычислительных блоков и с помощью специальных инструкций (SSE, AVX) заставляют их работать параллельно. Таблицу с числами для них хранят в специальной ячейке памяти — регистре.

Запомни

В Sandy Bridge L3-кэш переименовали в Last Level Cache (LLC) и разделили на части — по количеству процессорных ядер в кристалле. Каждый кусочек L3-кэша управляется независимо и для экономии энергии может быть переведен в спящий режим. Компоненты системы связаны с LLC кольцевой шиной, а процессорные ядра — прямым контактом. За заполнение L3-кэша отвечает системный агент, который следит за распределением свободного места, деля его между основными и графическим ядрами.

Как и кольцевая шина, кэш-память L3 работает на частоте процессора. При максимальной нагрузке пропускная способность взлетает до небес, при простое — падает, и в этом случае опять страдает графическое ядро.

Большая идея

Понятное дело, Sandy Bridge — это не только изменения и улучшения. Intel не была бы собой, если не придумала что-нибудь эдакое. Речь идет о Quick Sync, также известном как Intel Media Engine, встроенном движке для работы с видео.

Все мы знаем, что Full HD-видео — это злейший враг процессора, потому что загружает его на 100% и тормозит всю систему. Этим грамотно пользовались NVIDIA и AMD: потоковые процессоры их видеокарт забирали на себя задачи декодирования и разгружали кристалл. Та же ситуация была и с перекодированием видео в другой формат: процессор тратил на это дело по полтора часа, видеокарты справлялись с задачей за 20-30 минут. В итоге сложилось мнение: хочешь работать с видео — покупай видеокарту.

Технология Turbo Boost впервые появилась в процессорах Nehalem — Core i7-9×0. Принцип у нее простой: если часть ядер простаивает, то у активных автоматически поднимается частота. Делается это за счет того, что при простое ядра не потребляют энергию и создается запас по энергопотреблению (TDP). Его-то и используют для увеличения частоты работы.

Intel решила с этим бороться. В графический движок Sandy Bridge встроили специальные ядра с жестко заданными алгоритмами декодирования MPEG-2, H.264 (AVC), VC-1 и других популярных форматов. Обработку движений, деинтерлейсинг, цветокоррекцию взвалили на плечи потоковых ядер (тех самых Execution Units). И — вуаля! — процессор научился проигрывать до пяти Full HD-потоков без нагрузки на основные ядра. Правда, он округляет скорость воспроизведения до 24 кадров в секунду, что на больших телевизорах может приводить к эффекту мыльной оперы, когда актеры двигаются рывками, но это уже мелочи.

За счет огромной скорости декодирования Sandy Bridge отлично справляется и с переводом фильмов в другой формат, делая это практически на лету.

Единственная проблема состоит в том, что Quick Sync работает только при активном графическом ядре. Когда изображение подается с дискретной видеокарты, медиадвижок недоступен. Будем надеяться, Intel это исправит.

Разогнался

Отдельно поговорим о разгоне. Как обычно, есть два варианта — автоматический и через BIOS. Начнем с первого, а именно с технологии Turbo Boost, которую в Sandy Bridge обновили до версии 2.0.

В первом Turbo Boost ядра процессора разгонялись в зависимости от запаса TDP. Скорость удавалось повысить всего лишь на 200-300 МГц, что практически не ощущалось. Turbo Boost 2.0 работает по новому принципу. Она отслеживает текущую температуру процессора и, как только появляется определенный запас, повышает частоту на 400-500 МГц. В таком режиме кристалл работает, пока не нагреется, а затем выходит на стандартную скорость. Дальше все повторяется: разгон, нагрев, понижение частот. По словам Intel, череда кратковременных прибавок скорости дает больший прирост производительности, чем постоянная работа с учетом TDP.

Intel не стала менять названия процессорных линеек, оставив Sandy Bridge знакомые нам Core i3, i5 и i7. Отличить старые кристаллы от новых не составляет труда: у первого поколения процессоров маркировка трехзначная (например, Intel Core i5-661), а у второго — четырехзначная (Intel Core i5-2500).

Правда, небольшая путаница все равно остается, потому что нумерация у настольных и мобильных моделей сквозная. Скажем, настольный процессор с клеймом «2400» относится к линейке Core i5, а мобильный с индексом «2410M» — уже к Core i3.

В остальном маркировка свеженьких Sandy Bridge очевидная:

2 — Указывает на второе поколение серии Core i-Х, у всех процессоров Sandy Bridge одинаково.

3 — Косвенно свидетельствует о положении процессора в серии. Чем старше цифра, тем быстрее процессор. Не влияет на поддерживаемые технологии.

Оплакивание

С ручным разгоном все не так радужно. Как известно, частота процессора — это произведение скорости шины (BCLK) и множителя ядра. Соответственно, разгонять процессор можно, либо увеличивая значение BCLK, либо изменяя множитель. В прошлых процессорах Intel множитель был разблокирован только в дорогих моделях линейки Extreme Edition. Поэтому все работали с шиной, и результаты всегда были отличными: даже младшие Core i7 легко поднимались с 2,66 до 4 ГГц. С Sandy Bridge про это можно забыть, разгон по шине Intel заблокировала.

Компания завязала все компоненты системы на один генератор частоты (BCLK), и теперь при разгоне процессорных ядер вверх ползут частоты встроенной видеокарты, кольцевой шины, L3-кэша, контроллера памяти, шин PCIe и так далее. В общем, всего того, что для разгона никак не предназначено и при малейшей попытке поднять частоту сбрасывает настройки. Обойти это невозможно.

Теперь единственный вариант — работать с множителем. Intel уже объявила о выпуске соответствующих процессоров под разгон и продает их на 700-900 рублей дороже стандартных моделей.

Intel представляет

На CES 2011 Intel представила 29 процессоров на новой архитектуре. Пятнадцать из них анонсированы для ноутбуков, четырнадцать — для настольных компьютеров. Intel не стала придумывать новые линейки и оставила известные Core i3, i5 и i7. Изменилась только маркировка: название модели теперь записывается не тремя, а четырьмя цифрами (см. врезку «Циферки»). Самый дешевый настольный процессор Sandy Bridge, Core i3-2100, продают за 4000 рублей, самый дорогой, Core i7-2600K, за 12 000 рублей. Кристаллов по 1000 евро за штуку нет. В верхнем ценовом диапазоне Intel оставила старые Nehalem под чипсет X58 Express.

Помимо стандартных моделей, Intel представила два процессора с разблокированным множителем — Core i7-2600K и Core i5-2500K. И это почему-то единственные кристаллы с топовой HD Graphics 3000, хотя что с ней делать оверклокерам — непонятно. Как и непонятно, зачем Intel придумала для Sandy Bridge новый сокет. Чем не подошел LGA1156, толком не объясняют — просто предлагают купить новую материнскую плату с LGA1155.

Продолжим

Сейчас в продаже есть два чипсета — H67 Express и P67 Express. По сравнению с пятой серий изменений немного: портов USB 2.0 теперь не 12, а 14 штук, появились два контакта SATA Rev. 3, исчезла поддержка PCI. Все остальное по-старому: есть LAN и 8 линий PCIe.

Чипсет P67 Express позиционируется для игровых систем. Он не работает со встроенной в процессор графикой, но может разделить 16 линий PCIe 2.0 на два слота PCIe x8. H67 Express этого не умеет, зато оснащен шиной FDI и видеовыходами DisplayPort, HDMI, DVI и VGA.

Разгонять процессоры разрешают только на P67 Express, H67 разблокированного множителя не видит. Почему — неясно, ведь только кристаллы с суффиксом «K» оснащены топовой HD Graphics.

Все эти несуразности Intel должна разрешить в чипсете Z68 Express, информация о котором недавно утекла в интернет. Это будет копия H67, но уже с поддержкой разгона и двух слотов PCIe x8.

В теории Sandy Bridge выглядит многообещающе. Огромное количество доработок должно обеспечить ощутимый прирост производительности. Встроенное графическое ядро — отличное решение для офисных компьютеров и ноутбуков. Ответ AMD и NVIDIA в работе с видео — вообще выше всяких похвал. Одним словом, в Sandy Bridge нет ничего революционного, но количество и качество переработок впечатляет.

Картину портит только странная политика Intel. Зачем оверклокерским процессорам HD Graphics 3000? Была ли необходимость в смене сокета? Почему H67 Express не видит разблокированного множителя и не может работать с двумя видеокартами? Все эти мелочи немного портят общее впечатление, но не будем делать поспешных выводов, сначала — тесты.

Источник

Intel Sandy Bridge: производительность для всех и разгон для избранных?!

Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.

Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

Sandy Bridge

Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.

Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.

Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.

Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.

Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.

За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.

Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.

В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.

Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.

Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.

Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.

Модельный ряд

Процессоры на базе новой микроархитектуры в скором времени должны будут занять все ниши, включая решения начального уровня, где сейчас господствуют продукты с разъемом LGA775. Исключением станет высокопроизводительный сегмент рынка, который отдан на откуп моделям Bloomfield и Lynnfield, хотя в конце этого года все должно будет измениться в пользу Sandy Bridge и ее производных.

На данный момент компания Intel анонсировала 29 моделей новых процессоров, из которых 14 предназначены для настольного рынка. Среди них как обычные (95 Вт), так и с пониженным энергопотреблением (модели с суффиксом S — 65 Вт, и T — 45-35 Вт). Естественно, больший интерес для значительной части пользователей представляют процессоры со стандартным уровнем TDP. Тем более, что на отечественном рынке какие-либо другие вариации встречаются крайне редко.

В представленной ниже таблице приводится список всех стандартных моделей ЦП на базе Sandy Bridge, старшие из которых уже доступны на рынке.

Как видим, название серий остались прежние — Core i7, Core i5 и Core i3, но изменились номера процессоров, которые стали четырехзначными. Первая цифра обозначает второе поколение Intel Core, следующие три цифры относятся к рейтингу производительности, а суффикс, в данном случае K, означает разблокированный множитель.

Core i7-2600K и Core i5-2500K

Первыми продуктами на базе новой архитектуры в тестовую лабораторию Overclockers.ua попали процессоры Core i7-2600K и Core i5-2500K. Оба они относятся к решениям для энтузиастов и рассчитаны на без проблемный разгон, благодаря разблокированному на повышение множителю. Внешне процессоры Sandy Bridge отличаются от Lynnfield и Clarkdale смещенными к краю ключами и меньшим количеством контактов на лицевой стороне подложки:

Частота модели Core i7-2600K составляет 3,4 ГГц, но за счет технологии Turbo Boost она выше на 100 МГц. И чем меньше исполняется потоков, тем она больше растет.

При загрузке трех ядер их частота будет равна 3,6 ГГц, двух — уже 3,7 ГГц, а одного — достигнет своего максимума в 3,8 ГГц. На данный момент, это один из самых высокочастотных процессоров в активе Intel. И в будущих моделях этот предел безболезненно может быть доведен до 4,2-4,5 ГГц.

Следующий участник лишен поддержки Hyper-Threading, обладает объемом кэш-памяти шесть мегабайт и по спецификациям функционирует на 3,3 ГГц. За счет авторазгона фактическая частота, естественно, равна 3,4 ГГц.

В плане работы Turbo Boost ничего не изменилось и частота Core i5-2500K меняется с шагом 100 МГц, пока не достигнет максимальных 3,7 ГГц.

В простое процессоры функционируют на 1600 МГц, при этом напряжение питания снижается с 1,2 до 0,9 В. Во время работы авторазгона оно наоборот, немного повышается (до 1,24 В). В целом, ничего особенного и все характеристики рассматриваемых моделей полностью соответствуют спецификациям на них.

Система охлаждения

Прежде чем перейдем к разгону, стоит пару слов сказать о системах охлаждения для новых процессоров.

К нам на тестирование попали два кулера. Один из них простой, с алюминиевым радиатором и медным пяточком. Частота вращения вентилятора с ШИМ-управлением составляла около 1100-2000 об/мин. Им, вероятнее всего, будут оснащаться все представители архитектуры Sandy Bridge.

Второй охладитель — башенного типа, знакомый нам еще по шестиядерному Core i7-980X Extreme Edition, где он впервые был использован. С небольшими изменениями в его конструкции компания стала им оснащать продукты для энтузиастов прошлого поколения, и даже поставляла кулер на розничный рынок отдельной единицей по названием XTS100H.

В его конструкции применены три тепловые трубки (а не четыре, как у СО Core i7-980X), пронизывающие ряд тонких часто расположенных алюминиевых пластин. Вентилятор с ШИМ-управлением защищен проволочной решеткой и обладает скоростью 800-2600 об/мин (17-45 дБА). Для снижения уровня шума предусмотрен переключатель на крышке кулера, переводящий вентилятор в менее интенсивный режим работы — 800-1400 об/мин.

Основание кулера медное, небольших размеров, но отполировано до зеркального блеска. Крепление XTS100H к плате осуществляется за счет пластиковой усилительной пластины и четырех винтов, и оно вполне надежно.

По эффективности в номинальном режиме работы процессора Core i7-2600K данные системы охлаждения проявляют себя вполне неплохо на фоне недорогого Arctic Cooling Freezer 11 LP и даже Noctua NH-D14.

Но это касается функционирования процессора на стандартной частоте — с разгоном до 4,5-5 ГГц использовать такие кулеры, к сожалению, нельзя.

Разгон

Теперь самое интересное. Наверняка многие сталкивались с проблемой разгона процессоров архитектуры Nehalem на базе 45-нм техпроцесса, которым частоты свыше 4,2 ГГц при воздушном охлаждении давались с трудом. Но никого не удивляли 4,5 ГГц на 32-нм Clarkdale и Gulftown. Помимо самого потенциала ядра свою лепту в проблему разгона вносила высокая частота BCLK, которая получалась с младшими моделями ЦП. С Sandy Bridge повышать частоту можно лишь путем увеличения множителя, предел которого будет определяться уже возможностями процессора K-серии (максимум x57). Для достижения 4,5 ГГц достаточно будет поднять немного напряжение на ядрах, не затрагивая остальные параметры (Turbo Boost обязательно должен быть включен). Тестовые экземпляры Core i7-2600K и Core i5-2500K на такой частоте заработали при повышении напряжения до 1,28 и 1,35 В соответственно, чего вполне достаточно для режима работы системы 24/7. Прибавка еще 200 МГц потребовала увеличение напряжения до 1,3 В для старшей модели и 1,375 В для младшей. Пять гигагерц покорились лишь Core i7-2600K при 1,45 В:

Температура процессора в таком режиме с Noctua NH-D14 не превышала 78°C.

Core i5-2500K смог стабильно функционировать на 4,8 ГГц при напряжении 1,425 В (температура не выходила за рамки 71 градуса по Цельсию) — если младшие все такие, то для серьезных экспериментов с разгоном он явно не подходит.

Для достижения еще большего уровня разгона Sandy Bridge в обязательном порядке необходимо активировать в BIOS/UEFI материнских плат опцию Internal PLL Overvoltage. Можно также попытаться поднять различные напряжения питания. Максимально безопасное для процессора составляет 1,52 В (но есть мнение, что выше 1,38-1,4 В для режима 24/7 использовать не рекомендуется), для «системного агента» — 0,971 В, модулей памяти — 1,57 В. Параметр VCCIO (или Vtt — напряжение на контроллере памяти) позволяет добиться стабильности при работе с высокочастотной памятью, но выше 1,1 В поднимать не рекомендуется. CPU PLL ограничен 1,89 В, а графическое ядро, как и процессорное, может довольствоваться 1,52 В.

Помимо разгона процессора можно увеличить частоту памяти, причем, без каких-либо танцев с бубном, как того требовалось ранее. Достаточно выбрать необходимый режим и, возможно, немного поднять напряжение на контроллере.

Тестовые конфигурации

Подсистема памяти

Судя по результатам в программе Aida64 контроллер памяти Sandy Bridge действительно был переработан и демонстрирует высокую производительность, особенно в тесте на запись. Копирование данных происходит быстрее у старшей модели, а Core i5-2500K в этом случае близок по показателям к процессорам предыдущего поколения.

Обойти по латентности контроллер Lynnfield пока не удалось, но разница при стандартном режиме работы минимальна и больше проявляется уже с разгоном. И скорее всего, она будет расти с дальнейшим повышением частоты. Но учитывая потенциал новинок, на это обращать особо не стоит.

Синтетика

В PCMark Vantage рассматриваемые процессоры превосходят своих предшественников. Даже урезанный Sandy Bridge оказался производительнее бывшего флагмана компании Intel. Также достойно себя ведет Core i5-660, хотя в большинстве тестов этого пакета результатами он не блистал. Например, в игровом он хуже остальных решений компании на 20-40%.

Но за счет поддержки инструкций AES-NI в тесте Communications он почти на равных соперничает с двухтысячными моделями.

Отсюда такой высокий итоговый балл. Отметим небольшой проигрыш Core i5-2500K в игровом тесте.

Архивирование

Тестирование в архиваторах осуществлялось путем сжатия папки с различными файлами общим объемом 600 Мбайт. Оба новых процессора демонстрируют чудеса производительности. Двухъядерник Clarkdale не очень приспособлен к такой работе и результат приходится ждать в 1,5 раза дольше, чем с остальными участниками.

Рендеринг

В однопроцессороном тесте Cinebench 11 видна вся мощь архитектуры Sandy Bridge, но с переходом к многопоточному вычислению младший представитель начинает сдавать позиции, хотя и не значительно — он совсем немного отстает от более дорогого Core i7-870. Решения AMD, до этого находившиеся в тени, неожиданно вырвались вперед за счет своих шести ядер.

С POV-Ray такая же ситуация, и чем больше ядер у процессора, тем он производительнее в программе рендеринга.

Математические расчеты

Расчет количества ходов в Fritz Chess Benchmark также зависит от количества ядер или исполняемых потоков и Core i5-2500K опять отстает от Lynnfield. Его даже умудряется обойти Phenom II X6 1075T, и с разгоном разница между ними только увеличивается, вплоть до 16%.

Еще один хорошо оптимизированный под многопоточность бенчмарк. Лидеров в wPrime как таковых нет — все высокоуровневые процессоры обоих производителей показывают одинаковые результаты, которые зависят от частоты той или иной модели. Лишенный Hyper-Threading Sandy Bridge опять отстает, но не так сильно, как Core i5-660.

Работа с видео

Интересная картина наблюдается в x264 HD Benchmark, который производит двухпроходное сжатие видеофайла кодеком H.264. Первый проход на дух не переваривает Hyper-Threading и без этой технологии результат обычно выше, что мы и наблюдаем с Core i5-2500K.

Результаты тестирования в игровых приложениях

Синтетика

Теперь перейдем к игровым тестам, начав с синтетики. В 3DMark Vantage расстановка сил была предсказуема, учитывая его оптимизацию под многоядерность. Core i7-2600K безоговорочный лидер, вслед за ним расположились продукты на базе архитектуры Nehalem. Нынешний флагман AMD соперничает лишь с новым четырехъядерником Core i5, немного отставая от него. Но с разгоном они выступают почти вровень.

Новый тест на наших страницах показывает неоднозначные результаты — новинки проигрывают своим предшественникам до 3%. В чем же дело? Почему же 3DMark 11 так не благосклонен к ним? Смотрим на результаты процессорного теста Physics. В нем все закономерно и ничего нового мы не видим.

А вот в графическом подтесте наблюдается падение производительности системы на базе Sandy Bridge, и она пасует даже перед Core i5-660, во что очень трудно поверить.

Возможно, проблема заключается в реализации интерфейса PCI Express или еще чего-нибудь и в будущих версиях тестового пакета или драйверов она будет решена. Пока же можем отметить первое поражение представителей платформы LGA1155.

Игры

В реальных игровых приложениях, например, Crysis, двухтысячные модели смотрятся более привлекательно, особенно, когда 200-долларовый Core i5-2500K не хуже дорогих Lynnfield и Bloomfield.

Стратегия реального времени World in Conflict оказалась не менее чувствительной к новинкам. На фоне таких результатов покупка устаревших решений себя не оправдает. Если, конечно, они прилично не подешевеют.

S.T.A.L.K.E.R.: Call of Pripyat сильно зависит от частоты процессора и емкости его кэша. Если в номинале Core i5-2500K обходит на десяток кадров Core i7-870, то с разгоном последний берет реванш. Но ведь Lynnfield не сможет без проблем работать на частотах 4,5 ГГц, а то и выше, не так ли?

Выводы

Проведя колоссальную работу над ошибками, компания Intel представила микроархитектуру Sandy Bridge с огромным потенциалом, решения на базе которой отличаются высокой производительностью и экономичностью. И хотя ничего революционного в ней нет, именно с нее начнется новый виток развития процессорного рынка. Высокая интеграция и низкий уровень энергопотребления станут неотъемлемой частью будущих продуктов, обрастающих все большим функционалом, что невольно мы уже замечаем сейчас.

Процессоры Sandy Bridge, несмотря на свою среднюю стоимость, предлагают нам новый уровень производительности, ранее доступный лишь с топовыми решениями. Благодаря переработанному контроллеру памяти и некоторым архитектурным изменениям удалось избавиться от многих ограничивающих факторов, сдерживающих дальнейшее развитие архитектуры Nehalem. Но платой за это стала необходимость в новой платформе с разъемом LGA1155, несовместимой с ранее выпущенными решениями. Несмотря на всю привлекательность Sandy Bridge переход на нее с LGA1156 или даже LGA1366 вряд ли оправдает затраты, но она даст возможность наконец-то избавиться от древней LGA775 или же перейти из конкурирующего лагеря. Тем более, что новинка действительно того стоит.

Помимо процессорного ядра было усовершенствовано графическое, расположенное теперь на одном кристалле с остальными блоками. Его функциональность и производительность позволяет конкурировать с дискретными картами начального уровня серии GeForce и Radeon. Пользователям теперь не придется задумываться о покупке недорого адаптера, когда возможности встроенного сильно ограничены.

Энтузиасты оценят разгонный потенциал процессоров на базе очередной микроархитектуры, который благодаря использованию 32-нм техпроцесса вырос до 4,5-5,0 ГГц и выше. Такие частоты доступны при воздушном охлаждении и небольшом повышении питающего напряжения. Для подобных подвигов ранее необходимо было прибегнуть к усиленному охлаждению и серьезному увеличению напряжения питания.

Но какой бы ни была идеальной новая платформа, определенный недостаток в ней обязательно найдется. И в данном случае он касается энтузиастов. Разгонять процессоры теперь можно определенной серии с разблокированным множителем, а не любой, как это было ранее. И все бы ничего, если бы не их стоимость, которая пока находится в пределах 250-350 долларов, что не каждому оверклокеру будет по карману. Здесь явно не хватает более доступной модели, позволяющей экономным энтузиастам, коих большинство, безболезненно перейти на новую платформу.

Что касается конкурента, то лишь чудо может спасти его от дальнейшего снижения цен на свою продукцию. И если оно выйдет таким, как обещают, в выигрыше будут все. Иначе шестиядерники придется продавать еще по более низкой цене.

Источник

Читайте также:  что значит фбс легких
Строительный портал