Автор: Пользователь скрыл имя, 10 Марта 2013 в 15:44, курс лекций
Один из основных принципов машины фон Неймана — то, что и программы, и данные хранятся в одной и той же памяти. Сохраняемая в памяти программа представляет собой некоторые коды, которые могут рассматриваться как данные. Возможно, с точки зрения программиста программа — активный компонент, она выполняет некоторые действия. Но с точки зрения процессора команды программы — это данные, которые процессор читает и интерпретирует. С другой стороны программа — это данные с точки зрения обслуживающих программ, например, с точки зрения компилятора, который на входе получает одни данные — программу на языке высокого уровня (ЯВУ), а на выходе выдает другие данные — программу в машинных кодах.
При программировании это различие становится понятным, так как назначение каждого элемента данных определено.
Двоичное число не ограничено только восемью битами. Процессор может использовать 16-битовую архитектуру, в этом случае он автоматически оперирует с 16-битовыми числами. 2 в степени 16 минус 1 дает значение 65535, а немного творческого программирования позволит обрабатывать числа до 32 бит (2 в степени 32 минус 1 равно 4294967295) и даже больше.
Двоичная арифметика
Компьютер выполняет арифметические действия только в двоичном формате. Поэтому программист на языке Ассемблера должен быть знаком с двоичным форматом и двоичным сложением:
0 + 0 = 0
1 + 0 = 1
1 + 1 = 10
1 + 1 + 1 = 11
Отрицательные числа
Все представленные выше двоичные числа имеют положительные значения, что обозначается нулевым значением самого левого (старшего) разряда. Отрицательные двоичные числа содержат единичный бит в старшем разряде и выражаются двоичным дополнением. То есть, для представления отрицательного двоичного числа необходимо инвертировать все биты и прибавить 1.
Рассмотрим пример:
Число 65: 01000001
Инверсия: 10111110
Плюс 1: 10111111 (равно -65).
В случае, если прибавить единичные значения к числу 10111111, 65 не получится.
Фактически двоичное
число считается отрицательным,
если его старший бит равен 1. Для
определения абсолютного
Двоичное значение: 10111111
Инверсия: 01000000
Плюс 1: 01000001 (равно +65).
Сумма +65 и -65 должна составить ноль:
01000001 (+65) + 10111111 (-65) = (1) 00000000
Все восемь бит имеют нулевое значение. Перенос единичного бита влево потерян. Однако, если был перенос в знаковый pазряд и из разрядной сетки, то результат является корректным.
Двоичное вычитание
65 01000001 +(-42) 11010110 = 23 (1) 00010111
Результат 23 является корректным.
В рассмотренном примере
В случае, если справедливость двоичного дополнения не сразу понятна, рассмотрим следующие задачи: Какое значение необходимо прибавить к двоичному числу 00000001, чтобы получить число 00000000? В терминах десятичного исчисления ответом будет -1. Для двоичного рассмотрим 11111111:
00000001 11111111 Результат: (1) 00000000
Игнорируя перенос (1), можно видеть, что двоичное число 11111111 эквивалентно десятичному -1 и соответственно:
0 00000000 -(+1) -00000001 -1 11111111
Можно видеть также
каким образом двоичными
+3 00000011
+2 00000010
+1 00000001
0 00000000
-1 11111111
-2 11111110
-3 11111101
Фактически нулевые биты в отрицательном двоичном числе определяют его величину: рассмотрите позиционные значения нулевых битов как если это были единичные биты, сложите эти значения и прибавьте единицу.
4
Шестнадцатеричное представление
Представим, что необходимо просмотреть содержимое некотоpых байт в памяти. Требуется oпределить содержимое четырех последовательных байт (двух слов), которые имеют двоичные значения. Так как четыре байта включают в себя 32 бита, то специалисты разработали «стенографический» метод представления двоичных данных. По этому методу каждый байт делится пополам и каждые полбайта выражаются соответствующим значением. Рассмотрим следующие четыре байта:
Двоичное: 0101 1001 0011 0101 1011 1001 1100 1110
Десятичное: 5 9 3 5 11 9 12 14
Так как здесь для некоторых чисел требуется две цифры, расширим систему счисления так, чтобы 10=A, 11=B, 12=C, 13=D, 14=E, 15=F. Таким образом получим более сокращенную форму, которая представляет содержимое вышеуказанных байт:
59 35 B9 CE
Такая система счисления включает «цифры» от 0 до F, и так как таких цифр 16, она называется шестнадцатеричным представлениeм.
Шестнадцатеричный формат нашел большое применение в языке Ассемблера. В листингах ассемблирования программ в шестнадцатеричном формате показаны все адреса, машинные коды команд и содержимое констант. Также для отладки при использовании программы DOS DEBUG адреса и содержимое байтов выдается в шестнадцатеричном формате.
В случае, если немного поработать с шестнадцатеричным форматом, то можно быстро привыкнуть к нему. Рассмотрим несколько простых примеров шестнадцатеричной арифметики. Следует помнить, что после шестнадцатеричного числа F следует шестнадцатеричное 10, что равно десятичному числу 16.
Заметьте также, что шестнадцатеричное 20 эквивалентно десятичному 32, шестнадцатеричное 100 — десятичному 256 и шестнадцатеричное 100 — десятичному 4096.
Шестнадцатеричные числа записываются, например, как шест. 4B, двоичные числа как дв.01001011, а десятичные числа, как 75 (отсутствие какого-либо описания предполагает десятичное число). Для индикации шестнадцатеричные числа в ассемблерной программе непосредственно после числа ставится символ H, например, 25H (десятичное значение 37). Шестнадцатеричное число всегда начинается с деcятичной цифры от 0 до 9, таким образом, B8H записывается как 0B8H.
4
Сегменты
Сегментом называется область, которая начинается на границе параграфа, то есть, по любому адресу, который делится на 16 без остатка. Хотя сегмент может располагаться в любом месте памяти и иметь размер до 64 Кбайт, он требует столько памяти, cколько необходимо для выполнения программы.
Сегмент кодов
Сегмент кодов содержит машинные команды, которые будут выполняться. Обычно первая выполняемая команда находится в начале этого сегмента и операционная система передает управление по адресу данного сегмента для выполнения программы.
Регистр сегмента кодов (CS) адресует данный сегмент.
Сегмент данных
Сегмент данных содержит определенные данные, константы и рабочие области, необходимые программе. Регистр сегмента данных (DS) адресует данный сегмент.
Сегмент стека
Стек содержит адреса возврата как для программы для возврата в операционную систему, так и для вызовов подпрограмм для возврата в главную программу. Регистр сегмента стека (SS) адресует данный сегмент.
Еще один сегментный регистр, регистр дополнительного сегмента (ES), предназначен для специального использования. Последовательность регистров и сегментов на практике может быть иной.
Три сегментных регистра содержат начальные адреса соответствующих сегментов и каждый сегмент начинается на границе параграфа.
Внутри программы все адреса памяти относительны к началу cегмента. Такие адреса называются смещением от начала сегмента. Двухбайтовое смещение (16-бит) может быть в пределах от шест.0000 до шест.FFFF или от 0 до 65535. Для обращения к любому адресу в программе, компьютер складывает адрес в регистре сегмента и смещение. Например, первый байт в сегменте кодов имеет смещение 0, второй байт — 01 и так далее до смещения 65535.
В качестве примера адресации, допустим, что регистр сегмента данных содержит шест.045F и некоторая команда обращается к ячейке памяти внутри сегмента данных со смещением 0032. Несмотpя на то, что регистр сегмента данных содержит 045F, он указывает на адрес 045F0, то есть, на границе параграфа. Действительный адрес памяти поэтому будет следующий:
Адрес в DS: 045F0
Смещение: 0032
Реальный адрес: 04622
Каким образом процессоры адресуют память в один миллион байт?
В регистре содержится 16 бит. Так как адрес сегмента всегда на границе параграфа, младшие четыре бита адреса pавны нулю.
Шест.FFF0 позволяет адресовать до 65520 (плюс смещение) байт. Но специалисты решили, что нет смысла иметь место для битов, которые всегда равны нулю.
Поэтому адрес хранится в cегментном регистре как шест. nnnn, а компьютер полагает, что имеются еще четыре нулевых младших бита (одна шест. цифра), то есть, шест.nnnn0. Таким образом, шест.FFFF0 позволяет адресовать до 1048560 байт.
В случае, если вы сомневаeтесь, то декодируйте каждое шест.F как двоичное 1111, учтите нулевые биты и сложите значения для единичных бит.
4
Расширение набора команд
Команды делятся на следующие группы:
u арифметические;
u логические;
u передачи данных;
u перехода;
u пропуска;
u вызова подпрограммы;
u возврата из подпрограммы;
u смешанные.
Типы операндов для каждого типа команд обсуждаются в соответствующем порядке:
u байт;
u слово;
u десятичный операнд;
u разряд;
u число;
u составной операнд.
При обсуждении способов адресации используется следующий порядок:
u прямая;
u косвенная;
u непосредственная;
u индексная;
u регистровая;
u автоиндексирование с предварительным увеличением адреса;
u автоиндексирование с предварительным уменьшением адреса;
u автоиндексирование с последующем уменьшением адреса;
u косвенная с предварительным индексированием;
u косвенная с последующем индексированием.
Арифметические команды
В эту группу включены следующие команды:
u сложение;
u сложение с флагом переноса;
u вычитание;
u вычитание при перестановке операндов;
u вычитание с флагом переноса (заем);
u увеличение на 1;
u уменьшение на 1;
u умножение;
u деление;
u сравнение;
u получение дополнения до двух (отрицательного числа);
u расширение.
Для удобства те команды, принадлежность которых к конкретной категории неясна, повторяются во всех категориях, к которым они могли бы быть отнесены.
Логические команды
Эта группа включает следующие команды:
u логическое И
u логическое ИЛИ
u логическое исключающее ИЛИ
u логическое НЕ (дополнение)
u сдвиг
u циклический сдвиг
u проверку.
Она включает также те арифметические команды (такие, как сложение с аккумулятора с самим собой), которые выполняют логические функции.
Команды передачи данных
Эта группа включает команды:
u загрузки;
u запоминания;
u пересылки;
u обмена;
u ввода;
u вывода;
u очистки;
u установки.
Кроме того, она включает арифметические команды (такие как вычитание аккумулятора из самого себя), которые заносят определенное значение или содержимое какого-либо регистра в аккумулятора или другой регистр назначения, не изменяя при этом данных.
Команды перехода
Эта группа включает следующие виды переходов:
Команды безусловного перехода
u Перейти косвенно;
u Перейти по индексу, предполагая, что базовый адрес таблицы адресов находится в регистрах Н и L, а индекс в аккумуляторе;
u Перейти и связать, то есть, передать управление по адресу DEST, сохранив текущее состояние счетчика команд в регистрах Н и L.
Команды условного перехода
u Перейти при равенстве нулю;
u Перейти при неравенстве нулю;
u Перейти, если значения равны;
u Перейти, если значения не равны;
u Перейти, если значение положительное;
u Перейти, если значение отрицательное;
u Переходы с учетом знака;
u Перейти, если больше (без учета знака), то есть, если операнды не равны и при сравнении не требуется заема;
u Перейти, если значение не больше (без учета знака), то есть, если сравниваемые операнды равны или при их сравнении требуется заем;
u Перейти, если значение меньше (без учета знака), то есть, если сравнение без знака требует заема;
u Перейти, если значение не меньше (без учета знака), то есть, если сравнение без знака не требует заема.
Команды пропуска
Команда пропуска может быть выполнена с помощью команды перехода с соответствующем адресом назначения.
Этот адрес назначения должен указывать на команду, следующую после той, которая стоит непосредственно за командой перехода.
Действительное число пропускаемых байтов будет меняться, так как команды могут иметь длину 1-3 байта.
Команды вызова подпрограмм и возврата из подпрограмм
Команда безусловного вызова
Косвенный вызов может быть выполнен с помощью обращения к промежуточной подпрограмме, которая переходит косвенно на вызываемую подпрограмму.
Команда условного вызова
Условный вызов
подпрограммы может быть выполнен с
помощью последовательностей
Единственное отличие состоит в том, что команды перехода к действительным адресам назначения должны быть заменены на команды вызова подпрограмм.
Команды возврата из подпрограмм разделяются на:
u Команды безусловного возврата
u Команды условного возврата
u Команды возврата с пропуском
u Команды возврата после прерывания
Смешанные команды
В эту категорию входят следующие команды:
u нет операции
u запись в стек
u получение из стека
u останов
u ожидание
u захват (программное прерывание)
u другие, не попавшие в описание ранее категории команд.
4
Способы адресации
Косвенная адресация
Косвенную адресацию можно выполнить с помощью загрузки косвенных адресов в регистры Н и L, используя команду LHLD. После этого обращение к регистру М является эквивалентом косвенной операции.