C++ AMP - не комплируется пример из книги -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.144.12.205]

Правила раздела C/C++: Системное программирование и WinAPI

Обратите внимание:
1. Прежде чем начать новую тему или отправить сообщение, убедитесь, что вы не нарушаете правил форума!
2. Обязательно воспользуйтесь поиском. Возможно, Ваш вопрос уже обсуждали. Полезные ссылки приведены ниже.
3. Темы с просьбой выполнить какую-либо работу за автора в этом разделе не обсуждаются.
4. Используйте теги [ code=cpp ] ...текст программы... [ /code ] для выделения текста программы подсветкой.
5. Помните, здесь телепатов нет. Старайтесь формулировать свой вопрос максимально грамотно и чётко: Как правильно задавать вопросы
6. Запрещено отвечать в темы месячной и более давности без веских на то причин.

Полезные ссылки:
user posted image

FAQ Сайта (C++) user posted image

FAQ Форума

Наши Исходники user posted image

Поиск по Разделу user posted image

MSDN Library Online (Windows Driver Kit) user posted image

Google

Ваше мнение о модераторах: user posted image

B.V.

Модераторы: B.V.

Новое голосование

C++ AMP - не комплируется пример из книги

Олег М

Сообщ. #16 , 24.03.17, 17:26

Profi

Профиль · PM

Рейтинг (т): 72

Тут уже мне сложно сказать, я с этой штукой тоже работать не умею.
На самом деле, эта задача легко решается с помощью обычных потоков. Примерно так

#include <thread>

#include <chrono>

#include <iostream>

static const size_t _sz = 1024 * 1024;

static double a[_sz];

static double b[_sz];

static double c[_sz] = {0};

void CalcSum(size_t n, const double *a, const double *b, double *res)

{

//printf("%s, %lu\n", __FUNCTION__, n);

for (size_t i = 0; i < 1000; ++i)

{

for (size_t i = 0; i < n; ++i)

res[i] = sqrt(pow(a[i], 2) + pow(b[i], 2));

}

void TestCalc()

{

for (size_t i = 0; i < _sz; ++i)

{

a[i] = i;

b[i] = i;

}

auto tm = std::chrono::steady_clock::now();

CalcSum(_sz, a, b, c);

auto tm2 = std::chrono::steady_clock::now();

std::cout << "Time sync: " << std::chrono::duration_cast<std::chrono::milliseconds>(tm2 - tm).count() << std::endl;

static const auto _procs = std::thread::hardware_concurrency();

std::cout << "Processors: " << _procs << std::endl;

static const size_t _block = _sz / _procs;

std::list<std::thread> threads;

tm = std::chrono::steady_clock::now();

size_t offset = 0;

for (size_t i = 0; i < _procs; ++i, offset += _block)

threads.emplace_back(&CalcSum, _block, a + offset, b + offset, c + offset);

if (offset < _sz)

CalcSum(_sz - offset, a + offset, b + offset, c + offset);

for (auto &thread: threads)

thread.join();

tm2 = std::chrono::steady_clock::now();

std::cout << "Time async: " << std::chrono::duration_cast<std::chrono::milliseconds>(tm2 - tm).count() << std::endl;

}

tuchin	Сообщ. #17 , 24.03.17, 18:47
Member Профиль · PM Рейтинг (т): 1	Спасибо за код с потоками, он поможет при изучении потоков. А с этим примером даже не знаю, где можно проконсультироваться. Специализированных форумов я не нашел в интернете

Павел 77

Сообщ. #18 , 28.04.21, 13:30

Newbie

Профиль · PM

Рейтинг (т): нет

Добрый день!
Дело в типе double. Прежде чем использовать этот тип, надо проверять, поддерживает ли его Ваша видеокарта. Это делается с использованием свойства supports_limited_double_precision у объекта accelerator – что-нить типа:
accelerator defaultAccelerator;
if (defaultAccelerator.supports_limited_double_precision)
{
…
}
Если не поддерживает, используйте float.

tuchin	Сообщ. #19 , 29.04.21, 09:43
Member Профиль · PM Рейтинг (т): 1	Спасибо, Павел 77. Попробую.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (2) 1 [2] все

[ Script execution time: 0,0269 ] [ 16 queries used ] [ Generated: 20.04.24, 02:42 GMT ]