На главную
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
15 мая "Исходники.РУ" отмечают 20-летие присутствия в сети!
Поздравляем всех причастных и неравнодушных с юбилеем сайта!
И огромное спасибо всем, кто был с нами все эти годы!
msm.ru
! Перед отправкой сообщения внимательно прочтите правила раздела!!!
1. Запрещается обсуждать написание вирусов, троянов и других вредоносных программ!
2. Помните, что у нас есть FAQ раздела Assembler и Полезные ссылки. Посмотрите, возможно, там уже имеется решение вашего вопроса.

3. Настоятельно рекомендуем обратить особое внимание на правила форума, которые нарушаются чаще всего:
  3.1. Заголовок темы должен кратко отражать её суть. Темы с заголовками типа "Срочно помогите!" или "Ассемблер" будут отправляться в Корзину для мусора.
  3.2. Исходники программ обязательно выделяйте тегами [code]...[/code] (одиночные инструкции можно не выделять).
  3.3. Нежелательно поднимать старые темы (не обновлявшиеся более года) без веской на то причины.

Не забывайте также про главные Правила форума!

Добро пожаловать и приятного вам общения!!! ;)
 
Модераторы: Jin X, Qraizer
  
> Включение поддержки AVX, Real Mode
    ExpandedWrap disabled
      org 0x100
       
          ; Enable SSE
          mov eax,cr0
          and al,0xFB     ; clear coprocessor emulation CR0.EM (bit 2)
          or  al,0x2      ; set coprocessor monitoring CR0.MP (bit 1)
          mov cr0,eax
          mov eax,cr4
          or  eax,0x40600 ; set CR4.OSFXSR (bit 9), CR4.OSXMMEXCPT (bit 10) and CR4.OSXSAVE (bit 18)
          mov cr4,eax
       
          ; Enable AVX
          xor ecx,ecx
          xgetbv          ; load XCR0 register
          or  al,7        ; set AVX, SSE, x87 bits
          xsetbv          ; save back to XCR0
       
          ; Test SSE
          xorps   xmm0,xmm0
          xorps   xmm1,xmm1
          addss   xmm0,xmm1
       
          ; Test AVX
          vzeroupper
          vxorps  xmm0,xmm0,xmm0
          vxorps  xmm1,xmm1,xmm1
          vaddps  xmm2,xmm0,xmm1
       
          ret
    Запускаю в VMware (MS-DOS).
    Доходит до vzeroupper и виснет.
    Что ему ещё не хватает?

    Инфа: https://wiki.osdev.org/SSE

    Добавлено
    Даже добавляю код из Intel SDM для проверки поддержки AVX, выдаёт, что всё ок.

    ExpandedWrap disabled
        mov eax, 1
        cpuid
        and ecx, 018000000H
        cmp ecx, 018000000H; check both OSXSAVE and AVX feature flags
        jne not_supported
        ; processor supports AVX instructions and XGETBV is enabled by OS
        mov ecx, 0; specify 0 for XCR0 register
        xgetbv ; result in EDX:EAX
        and eax, 06H
        cmp eax, 06H; check OS has enabled both XMM and YMM state support
        jne not_supported
        mov eax, 1
        jmp done
      not_supported:
        mov eax, 0
      done:
    Устремляясь в будущее, в другие миры, не забывайте о настоящем, здешнем.
    В суете неотложных бесконечных дел помните о ценном и сокровенном.
    Почаще спрашивайте себя: кто я? Куда я иду? Зачем и почему я это делаю? Не сбился ли я с Пути?
    Берегите здоровье, берегите близких... Пока ещё не поздно!
      Попробуй перехватить исключения. Если они возникают, скорее всего вмварь глючит с виртуализацией AVX.
      Сообщение отредактировано: Qraizer -
      Одни с годами умнеют, другие становятся старше.
        Короче, выяснилось, что в RMode и в V86 AVX не пашет, надо переходить в PMode (в 16 битном тоже должно работать).
        https://software.intel.com/en-us/forums/int...ns/topic/297055

        Добавлено
        Всё верно.
        Заменил or al,0x2 на or al,0x3, добавил cli и в конец:
        ExpandedWrap disabled
              mov eax,cr0
              and al,not 1
              mov cr0,eax
        И всё заработало.
        Устремляясь в будущее, в другие миры, не забывайте о настоящем, здешнем.
        В суете неотложных бесконечных дел помните о ценном и сокровенном.
        Почаще спрашивайте себя: кто я? Куда я иду? Зачем и почему я это делаю? Не сбился ли я с Пути?
        Берегите здоровье, берегите близких... Пока ещё не поздно!
          При нежелании работать всегда в PMode, можно даже переключаться на время работы с AVX в PMode, а после обратно в RMode.
          При этом, если не писать в сегментные регистры, можно спокойно работать с памятью, как будто мы находимся в RMode. Не надо никаких таблиц грузить (GDT и пр) :)
          Я сейчас померил скорость переключения RM-PM-RM в VMware, у меня получилось порядка полумиллиона пар переключений в секунду. Довольно-таки неплохая скорость (в реале наверняка будет больше) :D
          Устремляясь в будущее, в другие миры, не забывайте о настоящем, здешнем.
          В суете неотложных бесконечных дел помните о ценном и сокровенном.
          Почаще спрашивайте себя: кто я? Куда я иду? Зачем и почему я это делаю? Не сбился ли я с Пути?
          Берегите здоровье, берегите близких... Пока ещё не поздно!
            Хм. Т.е. их тупо не пропускает декодер, останавливаясь на начальном этапе декодирования? Забавно.
            Одни с годами умнеют, другие становятся старше.
              Qraizer, не очень понятен смысл сего запрета.

              В аттачах выдержка из мана (том 2A, раздел 2.4, страницы 60 и далее).
              Ну и: "VEX-encoded GPR instructions are not supported in real and virtual 8086 modes." (стр. 69)

              Прикреплённый файлПрикреплённый файлno_vex_in_real_and_v86.zip (1,34 Мбайт, скачиваний: 88)
              Устремляясь в будущее, в другие миры, не забывайте о настоящем, здешнем.
              В суете неотложных бесконечных дел помните о ценном и сокровенном.
              Почаще спрашивайте себя: кто я? Куда я иду? Зачем и почему я это делаю? Не сбился ли я с Пути?
              Берегите здоровье, берегите близких... Пока ещё не поздно!
                Это не запрет. Так случайно вышло. Примерно как неправильное поведение механизма сегментной трансляции логических адресов в линейные при смене реального/защищённого режимов без последующей перезагрузки сегментных регистров. Ну, видит вот декодер неправильный объектный код для LDS, а микрокод для RM/VM никто не проапдейтил. Получите exception #6. Вероятно, интеловцы решили не фиксать VEX, т.к. реальный и виртуальный режимы нынче крайне маловостребованы.
                Одни с годами умнеют, другие становятся старше.
                  Цитата Qraizer @
                  Вероятно, интеловцы решили не фиксать VEX, т.к. реальный и виртуальный режимы нынче крайне маловостребованы.
                  16-битный PM тоже маловостребован, тем не менее он поддерживает VEX.
                  Про сегментные регистры можно поверить, что это просто баг, а здесь – лично мне не верится. ИМХО, это сделано намеренно... только какова причина? Должна же она быть!
                  Есть более новые, чем AVX, расширения (без VEX), которые, судя по описанию (специально сейчас посмотрел SDM), прекрасно работают в RM: MOVBE, PCLMULQDQ, ADX, RDRAND, SHA, MPX, даже TSX (в т.ч. RTM, хотя, казалось бы, зачем это в RM вообще?)
                  Устремляясь в будущее, в другие миры, не забывайте о настоящем, здешнем.
                  В суете неотложных бесконечных дел помните о ценном и сокровенном.
                  Почаще спрашивайте себя: кто я? Куда я иду? Зачем и почему я это делаю? Не сбился ли я с Пути?
                  Берегите здоровье, берегите близких... Пока ещё не поздно!
                    Кстати (вопрос не в тему), кто-нибудь знает, как расшифровывается аббревиатура BV (XGETBV, XSETBV, XSTATE_BV...)?
                    Мне прям любопытно, почему такое сокращение. Может, это Bit Values или что-нибудь такое?
                    Устремляясь в будущее, в другие миры, не забывайте о настоящем, здешнем.
                    В суете неотложных бесконечных дел помните о ценном и сокровенном.
                    Почаще спрашивайте себя: кто я? Куда я иду? Зачем и почему я это делаю? Не сбился ли я с Пути?
                    Берегите здоровье, берегите близких... Пока ещё не поздно!
                      Думаю, был бы баг в PM16, тоже не стали бы фиксать, его там просто изначально не было. Микрокод – он такой... фиксать его непросто, а потом ещё распространять через патчи...

                      Скорее BlockValidate. Хотя вариантов масса. BitmapVector... почему нет.
                      Одни с годами умнеют, другие становятся старше.
                      0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                      0 пользователей:


                      Рейтинг@Mail.ru
                      [ Script Execution time: 0,1342 ]   [ 18 queries used ]   [ Generated: 4.06.20, 02:12 GMT ]