Очень много ядер на обычном компьютере -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.144.212.145]

Правила раздела Hardware:

1. Если вы не уверены в правильности ответа, напишите об этом, или не отвечайте вообще, не давайте дезинформацию!
2. Не забывайте указывать полное наименование, модель, изготовителя и краткие характеристики оборудования.
3. Аргументируйте свое мнение - приводите развернутое высказывание или источник информации.
4. Прежде чем задать вопрос посмотрите, нет ли ответа на него на перечисленных ниже ресурсах:
FAQ
Полезные ссылки
www.ixbt.com
www.overclockers.ru
www.fcenter.ru
www.3dnews.ru
www.thg.ru
www.nvworld.ru
www.radeon2.ru

Здесь вы можете выразить мнение о модераторе этого раздела, ^D^ima.

Модераторы: DimA3

Новое голосование

Очень много ядер на обычном компьютере , о Xeon Phi

Славян	Сообщ. #16 , 01.03.16, 19:41
Master Профиль · PM Рейтинг (т): 135	Цитата ^D^ima @ 01.03.16, 19:35 Возможно это какие-то экспериментальные образцы или вообще какая-то виртуальная игра. Не-не! Мне далёкие знакомые говорили, что они такую дуру хотят купить, т.е. она реально продаётся!!

Kray74	Сообщ. #17 , 02.03.16, 02:24
Profi Профиль · PM Рейтинг (т): 74	Может это компьютер с NUMA архитектурой? Windows вроде умеет с таким работать.

^D^ima

Сообщ. #18 , 11.01.17, 09:19

Moderator

Профиль · PM

Поощрения: 3 Dgm

Рейтинг (т): 303

Цитата ^D^ima @ 26.02.16, 06:33

И тем более не забывай что это сопроцессор, он не может выполнять роль обычного процессора, он создан для работы с математикой, для расчетов. Для его использования нужен отдельный софт, который может с ним работать, разработанный на Intel Parallel studio XE

Кстати, уже есть:

Цитата

Точнее, теперь уже полноценных x86-совместимых процессоров, поскольку 14-нм модели Xeon Phi (Knights Landing) могут также выпускаться со своим процессорным разъёмом и работать как центральный процессор.
Подробнее: https://www.overclockers.ru/hardnews/77146/...oj-ot-2438.html

https://www.overclockers.ru/hardnews/77146/...oj-ot-2438.html

user posted image

Вот только результаты не заоблачные:
user posted image

Славян	Сообщ. #19 , 11.01.17, 14:38
Master Профиль · PM Рейтинг (т): 135	Вообще шлак какой-то с результатами. Да уж, да уж...

amk

Сообщ. #20 , 11.01.17, 16:09

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (т): 268

Цитата Славян @ 11.01.17, 14:38

Вообще шлак какой-то с результатами. Да уж, да уж...

Скорее всего программа, мерящая быстродействие просто не знает, что делать с таким количеством ядер. Подозреваю, она просто не может использовать больше 32-х. Потому и результаты чуть лучше чем при 24 ядрах.

Славян

Сообщ. #21 , 11.01.17, 17:12

Master

Профиль · PM

Рейтинг (т): 135

Ну пишут то на сайте:
Main Processor Performance (CPU)

The test scenario uses all of your system's processing power to render a photorealistic 3D scene (from the viral "No Keyframes" animation by AixSponza). This scene makes use of various algorithms to stress all available processor cores.

In fact, Cinebench can measure systems with up to 256 processor threads. This test scene contains approximately 2,000 objects which in turn contain more than 300,000 polygons in total, and uses sharp and blurred reflections, area lights, shadows, procedural shaders, antialiasing, and much more. The result is displayed in points (pts). The higher the number, the faster your processor.

shm	Сообщ. #22 , 11.01.17, 20:37
Master Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 123	local apic не позволяет адресовать более 256 ядер.

^D^ima	Сообщ. #23 , 12.01.17, 06:23
Moderator Профиль · PM Поощрения: 3 Dgm Рейтинг (т): 303	Как они сделали 4 виртуальных ядра на 1 реальном? Я понимаю HT, 1 реальное + 1 виртуальное, но 1 реальное + 3 виртуальных... Да и частота 1.3 маловато.

amk

Сообщ. #24 , 12.01.17, 16:39

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (т): 268

Цитата ^D^ima @ 12.01.17, 06:23

Как они сделали 4 виртуальных ядра на 1 реальном? Я понимаю HT, 1 реальное + 1 виртуальное

HyperThreading это не 1 реальное + 1 виртуальное. Это одно ядро и два чередующиеся потока команд на нём. Соответственно, удвоенный регистровый пул. Поскольку данные в двух потоках исполнения никак не связаны друг с другом, обработчики лучше запараллеливаются. Ничто не мешает ещё увеличить регистровый пул и обработать не два потока команд, а четыре. Тогда данные вообще почти не будут конфликтовать друг с другом. ОбщаЯ производительность вырастет, хотя каждый поток будет обрабатываться медленнее.
В потоке команд часто случается, что команда требует данных с предыдущей команды. В таком случае её обработку приходится тормозить, пока нужные данные не будут получены. Из-за этого в конвейер обработки приходится запускать "пустышки". У AMD немного другой другой принцип работы конвейера, из-за чего ядро само по себе работает медленнее, зато блоки обработку оказываются загружены равномернее, несмотря на зависимости в данных. В результате эксперименты с HT не дали значимого повышения производительности.

leo

Сообщ. #25 , 13.01.17, 07:42

Guru

Профиль · PM

Поощрения: 17 Dgm

Рейтинг (т): 940

Цитата ^D^ima @ 12.01.17, 06:23

Как они сделали 4 виртуальных ядра на 1 реальном?

Ядра Xeon Phi (Knights Corner и Knights Landing) поддерживают до 4-х HT-потоков на ядро (см. Агнер Фог microarchitecture.pdf).
Вообще говоря, фишка с 4 потоками довольно сомнительная, т.к. общая пропускная способность каждого ядра всего 2 инструкции за такт (по сравнению с 4 у Intel Core).

Цитата Agner Fog

It is no advantage to run multiple threads in each core for CPU-intensive tasks where the performance is limited by instruction fetch, decoding, or execution resources. The only situations where it is advantageous to run multiple threads in each core are when the performance is limited by memory access, branch mispredictions, or long dependency chains.

Цитата ^D^ima @ 12.01.17, 06:23

Да и частота 1.3 маловато

В Xeon Phi серии 7200 макс.частота 1.5 (1.7 с Turbo Boost). Делать больше не реально по причине большого TDP (215-260 Вт)

Сообщение отредактировано: leo - 13.01.17, 07:44

^D^ima	Сообщ. #26 , 13.01.17, 08:18
Moderator Профиль · PM Поощрения: 3 Dgm Рейтинг (т): 303	Цитата leo @ 13.01.17, 07:42 Делать больше не реально по причине большого TDP (215-260 Вт) это да, что есть, то есть. На Risk ядрах думаю будет гараздо меньше.

leo

Сообщ. #27 , 13.01.17, 19:32

Guru

Профиль · PM

Поощрения: 17 Dgm

Рейтинг (т): 940

Цитата Славян @ 11.01.17, 14:38

Вообще шлак какой-то с результатами. Да уж, да уж...

Цитата Славян @ 11.01.17, 17:12

Ну пишут то на сайте:
...

Учти, что основной фишкой Xeon Phi 72XXX (Knights Landing) является расширение AVX-512 и некоторые аппаратно ускоренные математические функции (в частности вычисление квадратного корня из float всего за 7 тактов), о которых Cinebench R15, вышедшая году эдак в 2013, скорее всего ничего не знает. Более того, в сети есть мнения\утверждения, что в R15 даже 256-битные расширения AVX\AVX2 не используются.

shm	Сообщ. #28 , 21.01.17, 15:52
Master Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 123	Дурь это, имхо. При таком количестве ядер ощутимо вырастают затраты (в % от суммарной производительности) на TLB Shootdown и прочие необходимые синхронизации.

Pavia

Сообщ. #29 , 24.01.17, 08:01

Master

Профиль · PM

Поощрения: 2 Dgm

Рейтинг (т): 257

shm
Вы просто ничего в этом не понимаете и неумеети их готовить.
Xeon Phi- это плата расширения как видео карта
user posted image

Никакого отношения к local APIC она не имеет. Так как это не центральный процессор(ЦП).
Хотя может он и как ЦП работать?

user posted image

Цитата

Дурь это, имхо. При таком количестве ядер ощутимо вырастают затраты (в % от суммарной производительности) на TLB Shootdown и прочие необходимые синхронизации.

Такие процессоры применяются в с серверах сервером сегменте рынка. Где задачи хорошо паралелятся по данным. У них не возникает TLB и прочее. Каждый пользователь обрабатывается отдельным процессором со своими данными. Либо дублированными данными.
А если задача плохо паралелится по данным, то организуют конвейерную работу. Тут уже идёт деление не по данным, а по коду. Каждый процессор выполняет свою функцию и передают данные по цепочке. При таком подходе синхронизатор участвует только между 2 вычислителями.

^D^ima

Цитата ^D^ima @ 13.01.17, 08:18

Делать больше не реально по причине большого TDP (215-260 Вт)

Говорят в 70-80 тых годах с микросхем отводили TDP 1.5 кВт. Правда в жидком азоте. Так и сейчас можно?

Правда и к современным Xeon Phi тоже применяют жидкостное охлаждение:
http://www.jscc.ru/informat/MVS-10PUserGuide.pdf

Меньшее потребление у систолических процессоров (К ним относятся нейро-процессоры и DSP).
Никак я это слово не запомню - "систалические".

Сообщение отредактировано: Pavia - 24.01.17, 08:13

shm

Сообщ. #30 , 24.01.17, 16:59

Master

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 123

Цитата Pavia @ 24.01.17, 08:01

Xeon Phi- это плата расширения как видео карта

Цитата ^D^ima @ 11.01.17, 09:19

Точнее, теперь уже полноценных x86-совместимых процессоров

Добавлено 24.01.17, 17:04
Как бэ x86 она и в Африке x86, эта архитектура не проектировалась для такого количества вычислителей. В тех же gpu совершенно иная модель и не относящаяся к классу симметричной многопрограммности.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (3) 1 [2] 3 все

[ Script execution time: 0,0378 ] [ 16 queries used ] [ Generated: 23.04.24, 21:08 GMT ]