dmitryfizteh / shmem-cuda-filtration Goto Github PK
View Code? Open in Web Editor NEWAutomatically exported from code.google.com/p/shmem-cuda-filtration
Automatically exported from code.google.com/p/shmem-cuda-filtration
Реализовать сохранение/восстановление
состояния для задачи на 1 GPU.
Original issue reported on code.google.com by dmitryfizteh
on 5 Feb 2011 at 6:39
Написание тезисов для PARENG2011
Original issue reported on code.google.com by dmitryfizteh
on 26 Sep 2010 at 11:12
До 15 октября подготовить тезисы, согласно
http://mipt.ru/nauka/53conf/poryadok/avtoram-arpgekb72uv.pdf
Original issue reported on code.google.com by dmitryfizteh
on 10 Oct 2010 at 10:48
Во вложении на первом шаге файлы для CPU и GPU.
А также файл параметров.
Original issue reported on code.google.com by dmitryfizteh
on 15 Oct 2011 at 8:11
Attachments:
Посчитать задачу с договоренными
условиями на мелкой сетке направленными
разностями.
Original issue reported on code.google.com by dmitryfizteh
on 5 Feb 2011 at 6:40
Вместо
for(int i=0; i<Nx; i++)
fprintf(fp5,"%.2e %.3e\n", (locPtr[i+Nx*Ny/2]).x, (locPtr[i+Nx*Ny/2]).S2);
было
for(int i=0; i<Nx; i++)
fprintf(fp5,"%.2e %.3e\n", (locPtr[i+Nx*Ny/2]).y, (locPtr[i+Nx*Ny/2]).S2);
Что выдавало некорректный вывод графика.
Для основной версии проекта исправлено
ревизиями 7-8.
Original issue reported on code.google.com by dmitryfizteh
on 26 Sep 2010 at 10:51
Расчет ведется с ДВОЙНОЙ ТОЧНОСТЬЮ на
гибридном кластере. Параметры
зафиксированы в:
#define TEST 0
#define tau 0.01 // могут быть изменены с
сохранением правильных р-тов
#define l 2.e-7 // могут быть изменены с
сохранением правильных р-тов
#define c_w 1407 // могут быть изменены с
сохранением правильных р-тов
#define c_n 6 // могут быть изменены с
сохранением правильных р-тов
#define timeX 1
#define h1 0.02045
#define h2 0.01969
#define dt 0.005f
#define K0 6.64e-11
#define K1 7.15e-12
#define mu1 0.001
#define mu2 0.0009
#define ro01 1000
#define ro02 1460
#define lambda0 2.7
#define lambda1 2.0
#define S_wr0 0.09
#define S_wr1 0.12
#define S2_gr 0.4
#define m0 0.4
#define m1 0.39
#define P_d0 755
#define P_d1 2060
#define P_atm 100000
#define g_const 9.8
#define beta1 1.0e-4
#define beta2 1.0e-8
#define epsilon 0.005
#define source 3
#define print_plot 10000
#define print_screen 1000
#define Nx 1280
#define Ny 1280
Original issue reported on code.google.com by dmitryfizteh
on 25 Sep 2010 at 9:04
Сейчас для определения из какого файла
считывать параметры используется параметр
DEFINES_FILE (а именно, #define DEFINES_FILE
C://Users//dmitry//Documents//Visual Studio
2010//Projects//NAPL_Filtration//defines.ini"). Это неудобно, так
как приходится изменять файл defines.h для
каждого проекта и архитектуры. Надо бы
придумать что-то, чтоб не использовать этот
параметр.
Original issue reported on code.google.com by dmitryfizteh
on 9 Oct 2011 at 3:13
Основные изменения:
* ускорение в 73 раза на сетке 2048х2048
* максимальная поддерживаемая расчетная
сетка 2048х2048
+ архитектура, основанная на массивах
* ускорения за счет использования
локальной памяти вместо глобальной
+ sh-скрипт запуска
* решение, проверенное на соответствие с
результатами одномерной задачи
+ полная поддержка двойной точности
? использование нескольких узлов кластера
(и увеличение сетки в 7 раз)
? использование нескольких модулей
видеокарты (и увеличение ускорения)
? эффективный расчет граничных условий
+ внесение в документацию пунктов по
сравнению результатов 2-слойного метода на
крупной сетке, 3-слойного метода на крупной
и мелкой сетках.
+ внесение в документацию диаграммы
ускорения в зависимости от числа узлов
сетки
Original issue reported on code.google.com by dmitryfizteh
on 27 Oct 2010 at 11:15
Создать прозрачную структуру для работы с
Issues, перенести задания из bugzilla.
Original issue reported on code.google.com by dmitryfizteh
on 24 Sep 2010 at 2:37
Были: Н.Г. и М.А.
Представил полученные расчеты версии 10.09.0:
640х640
GPU - 3.85c
CPU - 63.68c
ускорение - 16.5
6400x640
GPU - 37.77c
CPU - задача оборвана упр.программой
1280х640
GPU - 7.66c/(8.68c в случае с двойной точностью, но
этот результат не предоставлял, его еще не
было)
CPU - 128.86c
ускорение - 16.8
64х64
GPU - 6.51c
CPU - 42.82
ускорение - 6.6
Заявлена успешность расчетов с двойной
точностью.
Договорились работать над увеличением
ускорения, расчетах на нескольких узлах и
использовании 2-х карт на узле.
Принято решение об отправке тезисов на
PARENG2011.
Original issue reported on code.google.com by dmitryfizteh
on 25 Sep 2010 at 9:15
Сравнить быстродействие программы с
дополнительными параметрами в структуре
"точка" с пересчетом этих параметров на
каждом шаге.
Original issue reported on code.google.com by dmitryfizteh
on 18 Oct 2010 at 8:24
До 15 октября подготовить тезисы, согласно
http://mipt.ru/nauka/53conf/poryadok/avtoram-arpgekb72uv.pdf
Original issue reported on code.google.com by dmitryfizteh
on 10 Oct 2010 at 10:48
Предполагаемые изменения по сравнению с
10.10:
+ использование нескольких узлов кластера
(и увеличение сетки в 7 раз)
+ использование нескольких модулей
видеокарты (и увеличение ускорения)
? эффективный расчет граничных условий
+ внесение в документацию пунктов по
сравнению результатов 2-слойного метода на
крупной сетке, 3-слойного метода на крупной
и мелкой сетках.
+ внесение в документацию диаграммы
ускорения в зависимости от числа узлов
сетки
+ создание документации и архива
медиа-документов
Original issue reported on code.google.com by dmitryfizteh
on 5 Nov 2010 at 8:41
Создать и реализовать алгоритм
эффективного использования всех "голов"
видеокарты.
Original issue reported on code.google.com by dmitryfizteh
on 27 Oct 2010 at 10:21
Расчет выполнен на компе, полностью
нормальный вариант. До 10 000с.
Параметры:
#define tau 0.01
#define l 2.e-7
#define c_w 1407
#define c_n 6
#define timeX 10000
#define h1 0.02045
#define h2 0.01969
#define dt 0.005f
#define K0 6.64e-11
#define K1 7.15e-12
#define mu1 0.001
#define mu2 0.0009
#define ro01 1000
#define ro02 1460
#define lambda0 2.7
#define lambda1 2.0
#define S_wr0 0.09
#define S_wr1 0.12
#define S2_gr 0.4
#define m0 0.4
#define m1 0.39
#define P_d0 755
#define P_d1 2060
#define P_atm 100000
#define g_const 9.8
#define beta1 1.0e-4
#define beta2 1.0e-8
#define epsilon 0.005
#define source 3
#define print_plot 10000
#define print_screen 1000
#define Nx 64
#define Ny 64
#define BlockNX 16
#define BlockNY 16
Original issue reported on code.google.com by dmitryfizteh
on 26 Sep 2010 at 4:24
Attachments:
Подготовить:
1) ускорение на нескольких узлах
2) ускорение на одном узле
3) результаты расчета, сравнение
результатов
Можно показать график, сколько какая
функция выполняется.
Original issue reported on code.google.com by dmitryfizteh
on 26 Sep 2010 at 4:32
Attachments:
Вместо структуры "точка" ввести отдельные
массивы параметров в отдельной ветке
/branches/arrays.
Original issue reported on code.google.com by dmitryfizteh
on 25 Sep 2010 at 6:38
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.