На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
! Правила раздела Hardware:
1. Если вы не уверены в правильности ответа, напишите об этом, или не отвечайте вообще, не давайте дезинформацию!
2. Не забывайте указывать полное наименование, модель, изготовителя и краткие характеристики оборудования.
3. Аргументируйте свое мнение - приводите развернутое высказывание или источник информации.
4. Прежде чем задать вопрос посмотрите, нет ли ответа на него на перечисленных ниже ресурсах:
FAQ
Полезные ссылки
www.ixbt.com
www.overclockers.ru
www.fcenter.ru
www.3dnews.ru
www.thg.ru
www.nvworld.ru
www.radeon2.ru

Здесь вы можете выразить мнение о модераторе этого раздела, ^D^ima.
Модераторы: DimA3
  
> Очень много ядер на обычном компьютере , о Xeon Phi
    Подскажите, а если в обычный системник, в слот PCI-Ex (x16), поставить специализированную плату Xeon Phi, коя во взаимодействии с особым ЦП Xeon даёт около 60 ядер, то можно ли будет как-то раскрутить=поднять эти много ядер и стандартным ЦП?

    Допускаю очевидный ответ, что нельзя, но просто всё же если плата есть, то луноходы могли бы что-то и понаделать для таких случаев. :oops:
      Цитата Славян @
      коя во взаимодействии с особым ЦП Xeon даёт около 60 ядер, то можно ли будет как-то раскрутить=поднять эти много ядер и стандартным ЦП?

      3 раза перечитал, не понял вопрос. :wacko:
        Продаётся PCI-Ex x16 плата (Xeon Phi), которая будучи поставлена в спец.мать с особым Xeon-ЦП, будет показывать ОС, что на борту 60 ядер. А вопрос в том, что если таковую плату поставить в PCI-Ex разъём но на обычном системнике, то можно ли как-то получить и там эти 60 ядер?
          Цитата Славян @
          (Xeon Phi), которая будучи поставлена в спец.мать с особым Xeon-ЦП

          У Xeon Phi нет требований под процессор. Подойдут от pentium 4 и ОС от Server 2008 R2 и Windows 7 SP1

          Добавлено
          И тем более не забывай что это сопроцессор, он не может выполнять роль обычного процессора, он создан для работы с математикой, для расчетов. Для его использования нужен отдельный софт, который может с ним работать, разработанный на Intel Parallel studio XE
            Пойдет любая мать, с PCI Express Revision версии 2.0 и выше, и с x86-64 архитектурой.

            Потребляемая мощность под 300 Вт. Четыре потока на ядро. До 61 ядра у сопроцессора. Производительность до 1,2 терафлопс - 1,2 триллиона операций в секунду.

            Куда тебе столько? Кто тебе будет писать такой многопоточный софт? И главное, для чего тебе такая параллельность? Ты что, моделированием Вселенной занимаешься? Или анализом мировой экономики? Или квантовой механикой занимаешься?

            PS Бери ношу по себе, чтоб не падать при ходьбе.
              Цитата Идеал @
              Куда тебе столько? Кто тебе будет писать такой многопоточный софт? И главное, для чего тебе такая параллельность? Ты что, моделированием Вселенной занимаешься? Или анализом мировой экономики? Или квантовой механикой занимаешься?

              PS Бери ношу по себе, чтоб не падать при ходьбе.


              M
              Не оффтопим!
                Цитата ^D^ima @
                У Xeon Phi нет требований под процессор. Подойдут от pentium 4 и ОС от Server 2008 R2 и Windows 7 SP1

                И тем более не забывай что это сопроцессор, он не может выполнять роль обычного процессора, он создан для работы с математикой, для расчетов. Для его использования нужен отдельный софт, который может с ним работать, разработанный на Intel Parallel studio XE
                Блин, ясно стало. Спасибо!! :thanks:
                  Можно взять Cuda и делать вычисления на видюхе. Там будет 1к ядер уже.
                    Цитата foreach @
                    Можно взять Cuda и делать вычисления на видюхе. Там будет 1к ядер уже.

                    Под GPGPU всё-таки лучше брать OpenCL, ибо без привязки к GPU это раз, численные вычисления в разы лучше у AMD/ATi это два. Да и ядер давно уже за 1к, даже если не рассматривать тандемы.
                    Но всё это один большой оффтоп.
                      Славян, насколько я знаю, эти вычислительные модули не будут видны в системе (в виде полноценных процессоров) и их нельзя будет использовать в обычных приложениях. Для них нужно использовать специализированные библиотеки.
                      Сообщение отредактировано: shm -
                        Цитата shm @
                        насколько я знаю, эти вычислительные модули не будут видны в системе (в виде полноценных процессоров) и их нельзя будет использовать в обычных приложениях. Для них нужно использовать специализированные библиотеки.
                        Да, я тоже так из ^Диминого сообщения понял. Увы. Но где-то была же плата Intel'а, коя реальные кучу процов показывала в диспетчере. Тоже она была PCI-Ex или нет, не помню. :oops:
                            Цитата Славян @
                            Но где-то была же плата Intel'а, коя реальные кучу процов показывала в диспетчере.

                            Это что-ли?
                            user posted image

                            Там были реальные процессоры
                              Цитата ^D^ima @
                              Это что-ли?
                              Ага. :'(

                              Добавлено
                              Цитата ^D^ima @
                              Там были реальные процессоры
                              А поподробнее распишите/напомните, как так сделали? О 16-ядерниках от Intel'а (Xeon'ы) стало известно буквально 'вчера', а плат с 16 гнёздами ЦП я вообще никогда не видел. У AMD Opteron'ы хоть и давно, но столь многопроцессорных плат тоже не встречал. Линух ещё бы как-то смог с нескольких компов один диспетчер показывать, но вот может ли Винда?.. :-?
                                Цитата Славян @
                                А поподробнее распишите/напомните, как так сделали? О 16-ядерниках от Intel'а (Xeon'ы) стало известно буквально 'вчера', а плат с 16 гнёздами ЦП я вообще никогда не видел. У AMD Opteron'ы хоть и давно, но столь многопроцессорных плат тоже не встречал. Линух ещё бы как-то смог с нескольких компов один диспетчер показывать, но вот может ли Винда?..

                                Вот первоисточник:
                                http://www.3dnews.ru/569655

                                Больше нет информации. Возможно это какие-то экспериментальные образцы или вообще какая-то виртуальная игра.
                                  Цитата ^D^ima @
                                  Возможно это какие-то экспериментальные образцы или вообще какая-то виртуальная игра.
                                  Не-не! Мне далёкие знакомые говорили, что они такую дуру хотят купить, т.е. она реально продаётся!! :yummy:
                                    Может это компьютер с NUMA архитектурой? Windows вроде умеет с таким работать.
                                      Цитата ^D^ima @
                                      И тем более не забывай что это сопроцессор, он не может выполнять роль обычного процессора, он создан для работы с математикой, для расчетов. Для его использования нужен отдельный софт, который может с ним работать, разработанный на Intel Parallel studio XE


                                      Кстати, уже есть:
                                      Цитата
                                      Точнее, теперь уже полноценных x86-совместимых процессоров, поскольку 14-нм модели Xeon Phi (Knights Landing) могут также выпускаться со своим процессорным разъёмом и работать как центральный процессор.
                                      Подробнее: https://www.overclockers.ru/hardnews/77146/...oj-ot-2438.html


                                      https://www.overclockers.ru/hardnews/77146/...oj-ot-2438.html

                                      user posted image

                                      Вот только результаты не заоблачные:
                                      user posted image
                                        Вообще шлак какой-то с результатами. Да уж, да уж...:'(
                                          Цитата Славян @
                                          Вообще шлак какой-то с результатами. Да уж, да уж...
                                          Скорее всего программа, мерящая быстродействие просто не знает, что делать с таким количеством ядер. Подозреваю, она просто не может использовать больше 32-х. Потому и результаты чуть лучше чем при 24 ядрах.
                                            Ну пишут то на сайте:
                                            Main Processor Performance (CPU)

                                            The test scenario uses all of your system's processing power to render a photorealistic 3D scene (from the viral "No Keyframes" animation by AixSponza). This scene makes use of various algorithms to stress all available processor cores.

                                            In fact, Cinebench can measure systems with up to 256 processor threads. This test scene contains approximately 2,000 objects which in turn contain more than 300,000 polygons in total, and uses sharp and blurred reflections, area lights, shadows, procedural shaders, antialiasing, and much more. The result is displayed in points (pts). The higher the number, the faster your processor.
                                              local apic не позволяет адресовать более 256 ядер.
                                                Как они сделали 4 виртуальных ядра на 1 реальном? Я понимаю HT, 1 реальное + 1 виртуальное, но 1 реальное + 3 виртуальных...
                                                Да и частота 1.3 маловато.
                                                  Цитата ^D^ima @
                                                  Как они сделали 4 виртуальных ядра на 1 реальном? Я понимаю HT, 1 реальное + 1 виртуальное
                                                  HyperThreading это не 1 реальное + 1 виртуальное. Это одно ядро и два чередующиеся потока команд на нём. Соответственно, удвоенный регистровый пул. Поскольку данные в двух потоках исполнения никак не связаны друг с другом, обработчики лучше запараллеливаются. Ничто не мешает ещё увеличить регистровый пул и обработать не два потока команд, а четыре. Тогда данные вообще почти не будут конфликтовать друг с другом. ОбщаЯ производительность вырастет, хотя каждый поток будет обрабатываться медленнее.
                                                  В потоке команд часто случается, что команда требует данных с предыдущей команды. В таком случае её обработку приходится тормозить, пока нужные данные не будут получены. Из-за этого в конвейер обработки приходится запускать "пустышки". У AMD немного другой другой принцип работы конвейера, из-за чего ядро само по себе работает медленнее, зато блоки обработку оказываются загружены равномернее, несмотря на зависимости в данных. В результате эксперименты с HT не дали значимого повышения производительности.
                                                    Цитата ^D^ima @
                                                    Как они сделали 4 виртуальных ядра на 1 реальном?

                                                    Ядра Xeon Phi (Knights Corner и Knights Landing) поддерживают до 4-х HT-потоков на ядро (см. Агнер Фог microarchitecture.pdf).
                                                    Вообще говоря, фишка с 4 потоками довольно сомнительная, т.к. общая пропускная способность каждого ядра всего 2 инструкции за такт (по сравнению с 4 у Intel Core).
                                                    Цитата Agner Fog
                                                    It is no advantage to run multiple threads in each core for CPU-intensive tasks where the performance is limited by instruction fetch, decoding, or execution resources. The only situations where it is advantageous to run multiple threads in each core are when the performance is limited by memory access, branch mispredictions, or long dependency chains.


                                                    Цитата ^D^ima @
                                                    Да и частота 1.3 маловато

                                                    В Xeon Phi серии 7200 макс.частота 1.5 (1.7 с Turbo Boost). Делать больше не реально по причине большого TDP (215-260 Вт)
                                                    Сообщение отредактировано: leo -
                                                      Цитата leo @
                                                      Делать больше не реально по причине большого TDP (215-260 Вт)

                                                      это да, что есть, то есть.

                                                      На Risk ядрах думаю будет гараздо меньше.
                                                        Цитата Славян @
                                                        Вообще шлак какой-то с результатами. Да уж, да уж...
                                                        Цитата Славян @
                                                        Ну пишут то на сайте:
                                                        ...

                                                        Учти, что основной фишкой Xeon Phi 72XXX (Knights Landing) является расширение AVX-512 и некоторые аппаратно ускоренные математические функции (в частности вычисление квадратного корня из float всего за 7 тактов), о которых Cinebench R15, вышедшая году эдак в 2013, скорее всего ничего не знает. Более того, в сети есть мнения\утверждения, что в R15 даже 256-битные расширения AVX\AVX2 не используются.
                                                          Дурь это, имхо. При таком количестве ядер ощутимо вырастают затраты (в % от суммарной производительности) на TLB Shootdown и прочие необходимые синхронизации.
                                                            shm
                                                            Вы просто ничего в этом не понимаете и неумеети их готовить.
                                                            Xeon Phi- это плата расширения как видео карта
                                                            user posted image

                                                            Никакого отношения к local APIC она не имеет. Так как это не центральный процессор(ЦП).
                                                            Хотя может он и как ЦП работать?

                                                            user posted image

                                                            Цитата
                                                            Дурь это, имхо. При таком количестве ядер ощутимо вырастают затраты (в % от суммарной производительности) на TLB Shootdown и прочие необходимые синхронизации.

                                                            Такие процессоры применяются в с серверах сервером сегменте рынка. Где задачи хорошо паралелятся по данным. У них не возникает TLB и прочее. Каждый пользователь обрабатывается отдельным процессором со своими данными. Либо дублированными данными.
                                                            А если задача плохо паралелится по данным, то организуют конвейерную работу. Тут уже идёт деление не по данным, а по коду. Каждый процессор выполняет свою функцию и передают данные по цепочке. При таком подходе синхронизатор участвует только между 2 вычислителями.

                                                            ^D^ima
                                                            Цитата ^D^ima @
                                                            Делать больше не реально по причине большого TDP (215-260 Вт)

                                                            Говорят в 70-80 тых годах с микросхем отводили TDP 1.5 кВт. Правда в жидком азоте. Так и сейчас можно?

                                                            Правда и к современным Xeon Phi тоже применяют жидкостное охлаждение:
                                                            http://www.jscc.ru/informat/MVS-10PUserGuide.pdf


                                                            Меньшее потребление у систолических процессоров (К ним относятся нейро-процессоры и DSP).
                                                            Никак я это слово не запомню - "систалические".
                                                            Сообщение отредактировано: Pavia -
                                                              Цитата Pavia @
                                                              Xeon Phi- это плата расширения как видео карта

                                                              Цитата ^D^ima @
                                                              Точнее, теперь уже полноценных x86-совместимых процессоров


                                                              Добавлено
                                                              Как бэ x86 она и в Африке x86, эта архитектура не проектировалась для такого количества вычислителей. В тех же gpu совершенно иная модель и не относящаяся к классу симметричной многопрограммности.
                                                                Цитата shm @
                                                                Как бэ x86 она и в Африке x86, эта архитектура не проектировалась для такого количества вычислителей.

                                                                Как это она не проектировалась?
                                                                http://www.intel.com/pressroom/kits/upcrc/...ackgrounder.pdf
                                                                https://www.top500.org/lists/1994/06/

                                                                Цитата shm @
                                                                В тех же gpu совершенно иная модель и не относящаяся к классу симметричной многопрограммности.

                                                                А кто вам сказал что Xeon Phi является симметричной системой?

                                                                Добавлено
                                                                https://software.intel.com/sites/default/fi...re_Overview.pdf
                                                                https://software.intel.com/en-us/articles/t...or-optimization
                                                                Чёрным по белому написано 2 домена NUMA.

                                                                Да и в чём принципиальное отличие от современных видео карт?
                                                                https://3dnews.ru/641845

                                                                Блок SMX у NVidia точно такой же как и блок VPU у Intel разве что количество ALU в 4 раза больше.

                                                                Контролёров памяти у Intel 4 у NVidia 6. Те и те соединены через общий кэш L2.

                                                                Добавлено
                                                                Даже вот так вот:
                                                                https://code.msdn.microsoft.com/windowsdesk...ecture-45c11e6d
                                                                Там показана архитектура GPU архитектуры Fermi модуль SM он больше похож на интеловский VPU.
                                                                Сообщение отредактировано: Pavia -
                                                                  Как бы суперкомпьютеры - это другое. Там совершенна иная модель взаимодействия между процессорами. Так что пруф не в тему.
                                                                  Цитата Pavia @

                                                                  А кто вам сказал что Xeon Phi является симметричной системой?

                                                                  Ну венда завелась вон на скрине выше, а других вариантов она и не знает. Не ну может там есть разные варианты многопроцессорности.
                                                                    Интел хотела сделать дискретный GPU, но у нее ничего не вышло, в итоге родился хеон фи.
                                                                      ^D^ima, лень читать. Я правильно понял, что это по сути обычный проц x86 с кучей ядер на котором можно запустить венду?

                                                                      Добавлено
                                                                      Или он как и раньше работает только как вспомогательный проц через PCIe?
                                                                      Сообщение отредактировано: shm -
                                                                        shm
                                                                        на нем(на последнем) можно запустить венду.
                                                                          Цитата shm @
                                                                          Как бы суперкомпьютеры - это другое. Там совершенна иная модель взаимодействия между процессорами. Так что пруф не в тему.

                                                                          И чем же она другая?
                                                                          Цитата shm @
                                                                          Ну венда завелась вон на скрине выше, а других вариантов она и не знает.

                                                                          Как бы винда давным давно поддерживает NUMA:
                                                                          https://msdn.microsoft.com/ru-ru/library/wi...4(v=vs.85).aspx

                                                                          Добавлено
                                                                          ^D^ima
                                                                          Для gpu ей x87 нехватило и по потреблению питания проигрывает.

                                                                          На самом деле тут комедия другая. В последний год-три в супер компьютерах стали популярны архитектуры без сопроцессоров. А построенные на обычных 12 ядерных xeon но с огромадным их числом. И вот intel видя что теряет прибыль решила запустить xeon phi как обычный cpu.
                                                                          Сообщение отредактировано: Pavia -
                                                                            Цитата Pavia @
                                                                            И чем же она другая?

                                                                            В способе взаимодействия вычислителей.
                                                                            Цитата Pavia @
                                                                            Как бы винда давным давно поддерживает NUMA:

                                                                            Фигня все это. Попытка корчить NUMA в x86 не очень успешна по причине необходимости обратной совместимости. Я читал на эту тема статьи и оказалось, что x86 ОС, которые о NUMA не знают, не особо-то и проигрывают по быстродействию.
                                                                              Цитата http://www.ixbt.com/news/2017/04/23/intel-...-phi-7240p.html
                                                                              Линейку сопроцессоров Intel Xeon Phi x200 пополнили модели Xeon Phi 7220A, Xeon Phi 7220P и Xeon Phi 7240P
                                                                              Компания Intel добавила в линейку сопроцессоров Xeon Phi x200 три модели: Xeon Phi 7220A, 7220P и 7240P. Напомним, основой Xeon Phi x200 служит 14-нанометровая микросхема с числом ядер до 72 и объёмом кэш-памяти второго уровня до 36 МБ. Она совместима на уровне кодов с x86-совместимыми серверными процессорами Intel и поддерживает набор команд Advanced Vector Extensions 512. Первые модели x200 были выпущены в прошлом году. Они представляют собой процессоры как самостоятельные изделия. Новые модели выполнены в виде карт расширения с интерфейсом PCIe.
                                                                              user posted image
                                                                              Новые модели имеют по 68 ядер и могут исполнять до 272 потоков. Объём кэш-памяти L2 равен 34 МБ. Значение TDP составляет 300 Вт. Сопроцессоры 7220A и 7220P работают на частоте 1,2 ГГц. У первой модели активное охлаждение, у второй — пассивное. Модель 7240P тоже имеет пассивное охлаждение, но работает на частоте 1,3 ГГц.

                                                                              Модели 7220A и 7220P стоят по $2214, а 7240P — $3324.
                                                                              Эх... вкусно, но дорого. :'(
                                                                                Цитата Славян @
                                                                                Эх... вкусно, но дорого

                                                                                надо ещё понимать для чего ты это хочешь взять. Если под высоконагруженный сервер, который собой может заменить 5 таких-же без Xeon Phi, то цена приемлема.
                                                                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                                                                0 пользователей:


                                                                                Рейтинг@Mail.ru
                                                                                [ Script execution time: 0,0880 ]   [ 16 queries used ]   [ Generated: 28.03.24, 22:50 GMT ]