Такты, время выполнения.... -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.142]

Перед отправкой сообщения внимательно прочтите правила раздела!!!

1. Запрещается обсуждать написание вирусов, троянов и других вредоносных программ!
2. Помните, что у нас есть FAQ раздела Assembler и Полезные ссылки. Посмотрите, возможно, там уже имеется решение вашего вопроса.

3. Настоятельно рекомендуем обратить особое внимание на правила форума, которые нарушаются чаще всего:
  3.1. Заголовок темы должен кратко отражать её суть. Темы с заголовками типа "Срочно помогите!" или "Ассемблер" будут отправляться в Корзину для мусора.
  3.2. Исходники программ обязательно выделяйте тегами [code]...[/code] (одиночные инструкции можно не выделять).
  3.3. Нежелательно поднимать старые темы (не обновлявшиеся более года) без веской на то причины.

Не забывайте также про главные Правила форума!

Добро пожаловать и приятного вам общения!!!

Модераторы: Jin X, Qraizer

Новое голосование

Такты, время выполнения....

7in

Сообщ. #1 , 16.04.02, 19:56

Unregistered

Люди, скажите мне, пожалуйста, может ли за 1 такт выполниться несколько инструкций?

.MODEL Tiny .586 .CODE ORG 100h rdtsc macro db 0Fh,31h endm Start: cli rdtsc xchg cx,ax ; xor bx,bx rdtsc sub ax,cx sub ax,21h int 29h mov al,ah int 29h sti int 20h END Start

Программа вычисляет число тактов со-процессора, прошедших между 2-мя rdtsc. Из этого числа вычитается 21h (время выполнения xchg+rdtsc.... по крайней мере, у меня). Соответственно, на экран выводятся 2 нуля (2 байта с кодом 0). Но! Если раскомментировать xor bx,bx выведутся два символа с кодом 0FFh (т.е. время выполнения xor bx,bx = -1 такт). Что это за глюк?
А если xor bx,bx заменить на 1 или 2 xor ax,ax, то получится 0, а если на 3 раза по xor ax,ax, то будет 1. Но! Если поставить 4 инструкции xor ax,ax, то результат опять будет нулевым..... Как это понимать?

Kernel Panic что-то говорил о пайпах.... Можно поподробнее на эту тему?

Kernel Panic

Сообщ. #2 , 16.04.02, 20:41

Senior Member

Профиль · PM

Рейтинг (т): 3

Не знаю, у меня в мануалах написано, что rdtsc занимает от 20 до 24 циклов, а xchg ax,reg16 - 3 цикла. Может, в этом проблема?

В общем, две инструкции могут выполняться за один такт, если это простые инструкции, обе не содержат одновременно и явного адреса, и непосредственного значения.. И там ещё куча условий.. Поищи доки..

server_mouse	Сообщ. #3 , 17.04.02, 09:04
Unregistered	Вообще есть ещё таблица парабельности команд. Для первого пня -- в два конвейера. Для других невидел.

7in	Сообщ. #4 , 17.04.02, 19:36
Unregistered	Может, адресок подскажете (про спаренности, пайпы и т.д)? Мышки на сервере, ты про какой конвейер говоришь? Конвейер на пне?

m	Сообщ. #5 , 20.04.02, 03:54
Unregistered	http://emanual.ru/download/1200.html

7in	Сообщ. #6 , 20.04.02, 17:58
Unregistered	Премного благодарен....... Почитаем ;D

server_mouse

Сообщ. #7 , 22.04.02, 17:18

Unregistered

Ну ссылку не скажу - не знаю. Но есть у меня тетрадка, куда я в раннем младенчестве сию инфу передрал. Вот коротенький её пример:

ADC PU
ADD UV
AND UV
CALL PV
CMP UV
DEC UV
INC UV

... и гэтак далей.
Что сие означает. Есть 2 конвейера -- U и V.
PU - команда парабельна с конвейером U
PV - команда парабельна с конвейером V
UV - команда парабельна с любым конвейером.

Например:
ADD ax,bx
AND cx,1
выполнятся за один такт, поскольку полностью парабельны.

ADC ax,bx
CALL [bx]
тоже за один проход. ADC парабельна для U, а CALL для V

И т.д. в том же духе....
Я точно не помню, там вроде были ограничения на то, что бы команды не изменяли одни и теже регистры... это надо уточнить.

server_mouse	Сообщ. #8 , 22.04.02, 17:30
Unregistered	Да, 'за один такт' -- выражение образное. Команды-то будут выполняться вместе, но вот если один из операндов одной из команд находится в памяти и почему-то незакэшировался -- получи 2-5 тактов штрафа. Нюансов там ещё много...

Kernel Panic

Сообщ. #9 , 22.04.02, 23:25

Senior Member

Профиль · PM

Рейтинг (т): 3

Ну, блин.. Так недалеко и до RISC-овых машин. Типа: а выровняла ли ты на ночь адреса переменных, Дездемона??.. А если не выровняла - то полный, прошу пардону, писец ей, в виде страшных мук в аду процессорных исключений..

Короче, вот приблизительная инструкция по спариваемости (вы уж извините за двусмысленность слова) инструкций процессора (скомунизжено не помню откуда):

Pairing Pentium Instructions 1. Both instructions must be simple. 2. Shifts or rotates can only pair in the U pipe. (SHL, SHR, SAL, SAR, ROL, ROR, RCL or RCR) 3. ADC and SBB can only pair in the U pipe. 4. JMP, CALL and Jcc can only pair in the V pipe. (Jcc = jump on condition code). 5. Neither instruction can contain BOTH a displacement and an immediate operand. For example: mov [bx+2], 3 ; 2 is a displacement, 3 is immediate mov mem1, 4 ; mem1 is a displacement, 4 is immediate 6. Prefixed instructions can only pair in the U pipe. This includes extended instructions that start with 0Fh except for the special case of the 16-bit conditional jumps of the 386 and above. Examples of prefixed instructions: mov ES:[bx], mov eax, [si] ; 32-bit operand in 16-bit code segment mov ax, [esi] ; 16-bit operand in 32-bit code segment 7. The U pipe instruction must be only 1 byte in length or it will not pair until the second time it executes from the cache. 8. There can be no read-after-write or write-after-write register dependencies between the instructions except for special cases for the flags register and the stack pointer (rules 9 and 10). mov ebx, 2 ; writes to EBX add ecx, ebx ; reads EBX and ECX, writes to ECX ; EBX is read after being written, no pairing mov ebx, 1 ; writes to EBX mov ebx, 2 ; writes to EBX ; write after write, no pairing 9. The flags register exception allows an ALU instruction to be paired with a Jcc even though the ALU instruction writes the flags and Jcc reads the flags. For example: cmp al, 0 ; CMP modifies the flags je addr ; JE reads the flags, but pairs dec cx ; DEC modifies the flags jnz loop1 ; JNZ reads the flags, but pairs 10. The stack pointer exception allows two PUSHes or two POPs to be paired even though they both read and write to the SP (or ESP) register. push eax ; ESP is read and modified push ebx ; ESP is read and modified, but still pairs Simple Instructions (for Pentium pairing) The following is a list of simple instructions, as required by rule #1 above. Instruction format 16-bit example 32-bit example ------------------------------------------------------------ MOV reg, reg mov ax, bx mov eax, edx MOV reg, mem mov ax, [bx] mov eax, [edx] MOV reg, imm mov ax, 1 mov eax, 1 MOV mem, reg mov [bx], ax mov [edx], eax MOV mem, imm mov [bx], 1 mov [edx], 1 alu reg, reg add ax, bx cmp eax, edx alu reg, mem add ax, [bx] cmp eax, [edx] alu reg, imm add ax, 1 cmp eax, 1 alu mem, reg add [bx], ax cmp [edx], eax alu mem, imm add [bx], 1 cmp [edx], 1 where alu = add, adc, and, or, xor, sub, sbb, cmp, test INC reg inc ax inc eax INC mem inc var1 inc [eax] DEC reg dec bx dec ebx DEC mem dec [bx] dec var2 PUSH reg push ax push eax POP reg pop ax pop eax LEA reg, mem lea ax, [si+2] lea eax, [eax+4*esi+8] JMP near jmp label jmp lable2 CALL near call proc call proc2 Jcc near jz lbl jnz lbl2 where Jcc = ja, jae, jb, jbe, jg, jge, jl, jle, je, jne, jc, js, jnp, jo, jp, jnbe, jnb, jnae, jna, jnle, jnl, jnge, jng, jz, jnz, jnc, jns, jpo, jno, jpe NOP nop nop shift reg, 1 shl ax, 1 rcl eax, 1 shift mem, 1 shr [bx], 1 rcr [ebx], 1 shift reg, imm sal ax, 2 rol esi, 2 shift mem, imm sar ax, 15 ror [esi], 31 where shift = shl, shr, sal, sar, rcl, rcr, rol, ror Notes: rcl and rcr are not pairable with immediate counts other than 1 all memory-immediate (mem, imm) instructions are not pairable with a displacement in the memory operand instructions with segment registers are not pairable.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0290 ] [ 15 queries used ] [ Generated: 5.04.26, 19:05 GMT ]