Архитектура современных процессоров

Автор: Пользователь скрыл имя, 08 Декабря 2012 в 00:29, курсовая работа

Описание работы

Целью работы является изучение типов архитектур современных процессоров.
Задачами работы являются:
- изучение истории, основных видов архитектур процессоров;
- рассмотрение основных характеристик современных процессоров;
- выделение особенностей современных процессоров.

Содержание

Введение 3
1. История, основные виды архитектур процессоров 5
1.1. История развития современных процессоров 5
1.2. Архитектура фон Неймана 6
1.3. Конвейерная архитектура 6
1.4. Суперскалярная архитектура 7
1.5. Параллельная архитектура 9
2. Основные характеристики современных процессоров 11
3. Особенности современных процессоров 20
Заключение 25
Список литературы 27

Работа содержит 1 файл

Архитектура современных процессоров.docx

— 779.73 Кб (Скачать)

К тому же в современных  процессорах кэш давно не является единым массивом памяти, как много  лет назад, а разделен на несколько  уровней. Сверхбыстрый, но относительно небольшой по объему кэш первого  уровня (обозначаемый как L1), с которым  работает ядро процессора, чаще всего  делится на две половины – кэш  инструкций и кэш данных (говорят  разделённый кэш). С кэшем L1 общается кэш второго уровня – L2, который, как правило, гораздо больше по объему и является смешанным, без разделения на кэш команд и кэш данных. Некоторые десктопные процессоры, по примеру серверных процессоров, также порой обзаводятся кэшем третьего уровня L3. Кэш L3 обычно еще больше по размеру, хотя и несколько медленнее, чем L2 (за счет того, что шина между L2 и L3 более узкая, чем шина между L1 и L2), однако его скорость, в любом случае, несоизмеримо выше, чем скорость системной памяти.

Кэш бывает двух типов: эксклюзивный и не эксклюзивный кэш. В первом случае информация в кэшах всех уровней  четко разграничена – в каждом из них содержится исключительно  оригинальная, тогда как в случае не эксклюзивного кэша информация может  дублироваться на всех уровнях кэширования. Сегодня трудно сказать, какая из этих двух схем более правильная –  и в той, и в другой имеются  как минусы, так и плюсы. Эксклюзивная схема кэширования используется в процессорах AMD, тогда как не эксклюзивная – в процессорах Intel.

Мы постарались упомянуть  основные характеристики процессоров, дабы помочь Вам определиться с выбором, как самого процессора, так и наиболее оптимальной системы в целом.

Отдельно стоит упомянуть  развивающиеся огромными темпами  системы-на-чипе (в применении к ПК). В наше время подавляющее большинство  их основано на процессоре Intel Atom различных поколений.

Система на кристалле (System-on-a-Chip, SoC) — в микроэлектронике — электронная  схема, выполняющая функции целого устройства (например, компьютера) и  размещенная на одной интегральной схеме.

Если разместить все необходимые  цепи на одном полупроводниковом  кристалле не удается, применяется  схема из нескольких кристаллов, помещенных в единый корпус (System in a package, SiP). SoC считается  более выгодной конструкцией, так  как позволяет увеличить процент  годных изделий при изготовлении, упростить конструкцию корпуса  и снизить энергопотребление.

К процессорам этого направления  применимы те же характеристики, что  используются в «полных микропроцессорах», а основное их отличие от старших собратьев – ограниченность работы с памятью (чипсеты позволяют использовать не более 4ГБ, а зачастую и меньше), объединение с материнской платой, пониженное энергопотребление. Существуют, как двухъядерные, так и одноядерные решения.

Кто-то может сказать, что  я незаслуженно занижаю достоинства  процессоров AMD. Не скрою, что CPU этой фирмы  мне нравятся меньше, т.к., по моему  мнению, их недостаточная эффективность  не оправдана той разницей цен  с прямыми конкурентами. Но, повторюсь, это лишь мое мнение. В свете  вышесказанного хочу привести небольшую  замету о процессорах AMD.

Изменения структуры «камней» у данной компании происходили достаточно плавно, без агрессивных скачков, как у Intel. Наиболее актуальными на сегодняшний день являются сокеты AMD AM2, AM2+ и AM3. Передовым, безусловно, считается AM3.

Особенности CPU AMD:

a)     Наличие обратной совместимости. Все камни на сокете AM3 можно использовать на большинстве материнских плат с сокетом AM2+.

b)     Поддержка контролером памяти возможности работы как с новой DDR3 SDRAM, так и со старой DDR2 SDRAM.

c)     Для недавно выпущенных шестиядерных камней доступна функция Turbo CORE. В случае простоя трёх ядер частота остальных повышается, также увеличивается и вольтаж, причём всех ядер. Т.е. на выходе мы имеем тот же самый теплопакет, что и без Turbo CORE. Кроме того, доступна тонкая настройка режимов этой технологии посредством утилиты ADM OverDrive.

И напоследок хочу сказать, что выбор процессора должен быть профессиональным, ведь от него зависит  вся система, а также необходимо четко понимать, ради чего выбирается та или иная характеристика, т.к., зачастую, выигрывая в одной из них, вы потеряете  в другой.

 

 

3. Особенности современных процессоров

Пополнение модельного ряда процессоров Intel новым семейством произошло  в 2009 году вместе с выходом процессора Core i7 на ядре Bloomfield. С его появлением произошла поистине революция на рынке CPU, ведь появились новая архитектура (Nehalem), новый сокет (1366, а за ним  и 1156) и, что естественно, новые технологии. Большинство нововведений перешли  и в младшее поколение “Core ix”-процессоров на ядре Lynnfield и Clarkdale.

Первое, что хотелось бы отметить, это уход от шины FSB в пользу скоростной QPI для процессоров на сокете LGA 1366  (ядро Bloomfield), ведь в них интегрирован трехканальный контроллер памяти, требующий большой пропускной способности интерфейса. В «камнях» на ядре Lynnfield вместо шины QPI применяется давно известная шина DMI с пропускной способностью 2 Гбайт/с, которая ранее использовалась для связи северного и южного мостов чипсетов. Это решение связано с наличием в процессоре двухканального контроллера памяти, и отсутствием необходимости в сверхскоростном общении процессора и чипсета. Таким образом Intel достаточно запоздало ответила на выпуск AMD шины HyperTransport, хотя та не является в прямом смысле заменой FSB. Также стоит отметить, что в процессорах Intel установлен лишь контроллер DDR3 против смешанного контроллера DDR2/3 у AMD. Таким образом, Intel способствует полному переходу на новый формат памяти. Хорошо это или плохо? В одной из наших статей мы посмотрели на оба вида памяти.

Следующее важное изменение  заключается в том, что все  процессоры Bloomfield вновь вернулись  к технологии «виртуального многопроцессорного режима» SMT (Simultaneous Multi-Threading, ранее она  была реализована в процессорах Pentium 4 под названием Hyper-Threading; благодаря  ей операционная система видит 4х-ядерный  процессор как восемь отдельных  логических процессоров или ядер), а из процессоров Lynnfield данный режим  поддерживают не все модели. Собственно деление процессоров Lynnfield на Core i7 и i5 как раз и связано с поддержкой этого режима. Все процессоры Lynnfield семейства Core i7 (i7-860, i7-870) являются четырехъядерными и поддерживают режим Hyper-Threading, а четырехъядерные процессоры семейства Core i5 (i5-750) не поддерживают этот режим.

Еще одна особенность процессоров Lynnfield, Bloomfield и Clarkdale – поддержка  режима Turbo Boost, смысл которого в динамическом изменении тактовых частот ядер микропроцессора.

Для этого в чипе предусмотрен специальный функциональный блок PCU (Power Control Unit), который следит за уровнем  загрузки ядер и его температурой, а также отвечает за питание каждого  ядра и регулировку его тактовой частоты. PCU включает более миллиона транзисторов и имеет свой микроконтроллер  с микрокодом.

Компонентом PCU является так  называемый Power Gate, который отвечает за перевод каждого ядра Вашего процессора по отдельности в режим энергопотребления  С6 (фактически Power Gate включает или выключает  питание VCC для каждого ядра).

Если ядро процессора оказывается  незагруженным, оно попросту отключается  от линии питания с использованием блока Power Gate. Соответственно тактовую частоту и напряжение питания  «работающих» ядер можно динамически  поднимать (за это отвечает PCU), но так, чтобы потребление энергии процессором  не превысило его TDP. То есть фактически сэкономленное за счет отключения нескольких ядер энергопотребление используется для разгона оставшихся ядер. Кроме  того, режим Turbo Boost активируется и в  том случае, когда изначально загружены  все ядра процессора, но при этом его энергопотребление не превышает TDP. В этом случае параметры каждого  ядра могут динамически увеличиваться, но, естественно, без превышения заданного  в BIOS значения.

В идеале в BIOS можно выставлять и степень разгона отдельно для  каждого ядра, то есть максимальный множитель для каждого ядра. Увеличение частоты в режиме Turbo Mode производится скачкообразно, порциями по 133 МГц (частота  системной шины в процессорах  составляет 133 МГц). Пользователи, которым  режим Turbo Mode придется не по вкусу, в  настройках BIOS могут запретить его  использование.

К сожалению, возможность  тонкой настройки режима Turbo Boost через BIOS используют далеко не все производители  материнских плат. Если точнее, настраивать Turbo Boost можно только на материнских  платах самой Intel. Все остальные производители  системных плат (Gigabyte, MSI, ASUS, ECS, AsRock) останавливаются на том, что в BIOS можно включить или отключить  режим Turbo Boost. В большинстве случаев  включение этого режима означает, что все ядра процессора увеличивают  свою тактовую частоту на одну ступень, то есть на 133 МГц.

Так же был добавлен набор  расширений инструкций SSE4.2. Помните, мы говорили об архитектуре процессора как о способности им выполнять  определенные наборы инструкций? SSE является одним из расширений набора инструкций микропроцессора x86, появившимся вместе с выходом Intel Pentium III. SSE4- четвертая  редакция расширения, впервые появилась  в процессорах на микроархитектуре Penrynn (ядра Wolfdale, Yorkfield). Набор SSE4.2 поддерживает все 47 команд SSE4, а также 7 новых программно-ориентированных  ускорителей (Application Targeted Accelerator, ATA) обработки  строк и текстовой информации. Как утверждают разработчики, дополнительные ускорители могут быть полезны, например, в задачах лексического и синтаксического  анализа, при работе с регулярными  выражениями и поиске вирусов. 
Изменения коснулись и кэша. Был добавлен общий для всех ядер кэш 3-го уровня (L3) объемом 8 Мбайт. Увеличена кэш-память 1-го (L1) и 2-го (L2) уровней.

Новая система питания  пришла в процессоры Intel вместе с  многоядерными архитектурами, и  принципиальное направление с тех  пор не менялось, а лишь улучшалась аппаратная реализация за счет улучшения  интегрированных блоков управления питанием. Основной момент технологии под названием Intel Intelligent Power Capability заключается в том, что вычислительные блоки изначально находятся в выключенном состоянии и подключаются по мере загруженности процессора. Специальные интегральные схемы анализируют потоки данных и принимают решение о включении или выключении определенной подсистемы.

Набор системной логики физически  разделен на блоки, которые запитываются по отдельным каналам. Это понижает энергопотребление при обработке  различных видов данных. Особенно важен тот факт, что разделение на блоки и управление этими блоками  идет без задержки, связанной с  «пробуждением» элементов. В связи  с распределением блоков по кристаллу  возникла необходимость более точного  контроля температуры. Ведь может получиться так, что та часть, где датчик замеряет температуру, бездействует и, соответственно, холодная, в то время как другая страдает от перегрева.

Чтобы избежать подобной ситуации, в процессоры, начиная с линейки Core 2, встроено несколько термодатчиков  в местах, подверженных наибольшему  перегреву. Информация с них поступает на специальный DTS-сенсор, который анализирует данные. В качестве процессорной температуры, принимается максимальное, среди всех представленных, показание.

Перейдем к следующей  технологии, перекочевавшей из процессоров Intel Core 2. Intel Advanced Smart Cache. Общий доступ к кэшу L2 позволяет избежать простоев, возникающих при использовании раздельных кэшей L2.

Весь объем L2 динамически  распределяется между всеми ядрами в зависимости от частоты обращения  к оперативной памяти RAM. Таким  образом, предотвращена ситуация, когда одно из ядер простаивает, а другие захлебываются из-за нехватки свободного места в собственном кэше L2.

Более того, в Nehalem предусмотрена  возможность одновременной работы нескольких ядер с общими данными, которые  не дублируются в памяти, а хранятся единожды. Это позволяет использовать имеющийся объем L2 намного рациональнее. Соответственно, отпадает необходимость контроля когерентности кэшей в случае, когда ядра работают с одной и той же информацией.

Модификация системы Intel Advanced Digital Media Boost нацелена, в первую очередь, на ускорение работы приложений, работающих с большими объемами потоковых данных, такими как, например, видео или звук, архивирование и работа в криптографических системах, либо производящих сложные вычисления повышенной точности. Программы такого рода активно используют SSE-инструкции. Технология позволяет обрабатывать все 128-разрядные команды SSE, SSE2, SSE3, SSE4 за один такт.

Поэтому при проектировании Nehalem произошла существенная переработка  версии SSE(версия 4.2). Это особенно актуально  в свете популяризации HD и 3D video, для  конвертации RAW-файлов, создаваемых  современными цифровыми фотоаппаратами, а также в других требовательных к одновременному выделению ресурсов приложениях. Если учесть, что за счет этого оптимизируется работа с огромными массивами данных, то нетрудно догадаться, какой выигрыш в плане энергоэффективности дает технология Advanced Digital Media Boost.

Еще в Pentium 4 последних ревизий Intel включила технологию ЕМ64Т – 64bit режим целочисленной и адресной арифметики. Он позволяет работать с числами большой разрядности, а также адресовать свыше терабайта  общей памяти (не путайте с ОЗУ: ее предельный размер при использовании 32-разрядных процессоров и операционных систем не превышает примерно 3,5 Гбайт, а для 64-разрядных систем теоретически ограничен 16-ю экзабайтами, однако реально  можно использовать 128Гб).

На данный момент некоторые  процессоры (процессоры на ядрах Arrandale, Clarkdale, кроме Pentium’ов, Gulftown, Lynnfield, Bloomfield) поддерживают технологию Intel VT((Intel Virtualization Technology). Это одна из технологий аппаратной виртуализации ресурсов разработанная  компанией Intel. В дополнение к VT Intel разработала  технологию аппаратной виртуализации  ввода-вывода VT-d. Часто обозначается аббревиатурой VMX (Virtual Machine eXtension). Кодовое  название — Vanderpool.

Заключение

Современные модели ЦП значительно  превосходят по быстродействию своих  предшественников. Этим они обязаны  нескольким значительным усовершенствованиям.

Информация о работе Архитектура современных процессоров