[C++] OpenMP težave @ Slo-Tech

Forum » Programiranje »
[C++] OpenMP težave

[C++] OpenMP težave

Arto :: 10. nov 2010, 23:46

EDIT:
Napaka popravljena, ampak še vedno potrebuje zadeva več časa pri paralelni metodi kot pri sekvenčni.

// OpenMP.cpp : Defines the entry point for the console application.
//

#include "stdlib.h"
#include "stdio.h"
#include "Windows.h"
#include "time.h"
#include "omp.h"
#define N 50000000
#define N_THREADS 2



int max_num(int a_size, int a[]){
	int i;
	int max = 0;

	for(i=0; i<a_size; i++){
		if(a[i] > max) max = a[i];
	}

	return max;
}

int max_num_p(int a_size, int a[]){
	int i, tn, max[N_THREADS];
	//omp_set_num_threads(N_THREADS);

	#pragma omp parallel for shared(a,max) private(tn)
	for(i=0; i<a_size; i++){
		//if(i==1)printf("Num: %d\n", omp_get_num_threads());
		tn = omp_get_thread_num();
		//printf("Thread %d - i=%d\n", tn, i);
		if(max[tn]<a[i]){
			max[tn]=a[i];
		}
	}

	/*for(i=0; i<N_THREADS; i++){
		printf("%d\n", max[i]);
	}*/
	return max_num(N_THREADS, max);
}

void fill_random(int a_size, int a[]){
	int i;
	srand( time(NULL) );
	for(i=0; i<a_size; i++){
		a[i]=rand();
	}
}

int main(int argc, char * argv[])
{
	int start,stop, time;
	
	int * a;
	a = (int *)malloc(N * sizeof(int));
	int max;

	fill_random(N, a);
	printf("Start:\n");
	start = clock();
		max = max_num(N, a);
	stop = clock();
	time = stop-start;

	printf("%d t:%d\n", max, time);

	start = clock();
		max = max_num_p(N, a);
	stop = clock();
	time = stop-start;

	printf("%d t:%d\n", max, time);
	
	free(a);
	system("pause");
	return 0;
}

spremenil: Arto (11. nov 2010 ob 01:45)

Rokm :: 11. nov 2010, 10:46

Namesto

#pragma omp parallel for shared(a,max) private(tn)

uporabi

#pragma omp parallel for private(tn)

Največja potrata pri tvojem programu je da OpenMP zaradi uporabe shared naredi lock na dostop do celotnih tabel a in max. Tako v bistvu spremeniš svoj program v zaporeden saj različne niti čakajo ena na drugo da dobijo dostop do tabele. To pa ni potrebno saj dve različni niti nikoli ne pišeta v isto lokacijo v tabeli a ali v tabeli max. Niti so tako neodvisne saj ne posegajo med seboj v vhodne ali pa v izhodne podatke.

Zgodovina sprememb…

spremenil: Rokm (11. nov 2010 ob 10:54)

Arto :: 11. nov 2010, 20:23

Hvala za odgovor!
Ugotovil sem, da je bila glavna napaka, da metoda omp_get_thread_num porabi precej časa. Kolega mi je svetoval, naj popravim takole:

int max_num_p(int a_size, int a[]){
	int i, tn, max[N_THREADS];
	omp_set_num_threads(N_THREADS);

	#pragma omp parallel private(tn)
	{
		tn = omp_get_thread_num();
		#pragma omp for
		for(i=0; i<a_size; i++){
			if(max[tn]<a[i]) max[tn]=a[i];
		}
	}

	return max_num(N_THREADS, max);
}

Zadeva je zdaj hitrejša (pohitritev je okrog 1.3x), Je pa hecno, da praktično nima veze, če dam pri for zanki shared(a,max) ali ne.

Rokm :: 11. nov 2010, 21:47

Čudno! Meni z odstranitvijo shared(max, a) deluje hitreje. Je pa res da poganjam to na linux mašini compajlano z mpicc, tako da mogoče se pri teki uporabijo kakšne optimizacije.
Očitno more biti nekaj takega saj če poskusim gcc -O3 tudi pri meni ni razlike med verzijo s shared ali brez.

Arto :: 12. nov 2010, 02:27

Jaz kompajlam v Visual Studio 2010. Verjetno je res kakšen hec pri optimizaciji pri samem kompilanju.

Gemm :: 12. nov 2010, 13:05

Ko poganjam tale kos kode (s popravkom ki get_thread_num premakne ven iz zanke), opazim da mi v nobenem trenutku ne zabije več kot enega jedra - sumim da dela na neki točki lock na tabelo a, kot je Rokm namignil. Testirano na linuksih z GCC in LLVM.. to bi tudi mene zanimalo kaj se to dogaja, ker precej pogosto uporabljam OpenMP in bi se rad izognil tovrstnim presenečenjem.

Rokm :: 12. nov 2010, 13:34

Čudno! Meni pri uporabi -O3 opcije za prevajanje teče vzporedna koda približno trikrat hitreje kot zaporedna (na računalniku z osmimi jedri). Se tudi opazi poraba procesarja, ki skoči na 800% procentov, če povečaš N.

Mogoče povečane porabe ne opaziš ker se sprememba zgodi prehitro?
Če poženeš program s time se ob uporabi večih niti zna zgoditi, da je user time večji kot real time.

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	[Java - DN] Naključna števila Zixan Oddelek: Šola	12	1821 (1350)	nyler 18. feb 2016 16:45:35
»	Java passing uro1001 Oddelek: Programiranje	20	4774 (4427)	mihibo5 12. jan 2015 19:45:41
»	c napaka .c:4:1: error: expected identifier or '(' before '{' token FX6300B Oddelek: Programiranje	14	2388 (1961)	MrStein 13. avg 2014 15:36:29
»	[C++] velikost matrike rapvirus Oddelek: Programiranje	19	2000 (1812)	Jean-Paul 4. maj 2006 20:58:30
»	srand in program v Cju??? nuclear Oddelek: Programiranje	13	1841 (1711)	nuclear 8. jun 2003 14:50:07

Več podobnih tem

Zadnje novice

Zadnji članki

Išči:

Forum » Programiranje »
[C++] OpenMP težave

[C++] OpenMP težave

[C++] OpenMP težave

Arto :: 10. nov 2010, 23:46

Rokm :: 11. nov 2010, 10:46

Arto :: 11. nov 2010, 20:23

Rokm :: 11. nov 2010, 21:47

Arto :: 12. nov 2010, 02:27

Gemm :: 12. nov 2010, 13:05

Rokm :: 12. nov 2010, 13:34

Vredno ogleda ...

[Java - DN] Naključna števila

Java passing

c napaka .c:4:1: error: expected identifier or '(' before '{' token

[C++] velikost matrike

srand in program v Cju???

Forum » Programiranje » [C++] OpenMP težave

[C++] OpenMP težave

[C++] OpenMP težave

Arto :: 10. nov 2010, 23:46

Rokm :: 11. nov 2010, 10:46

Arto :: 11. nov 2010, 20:23

Rokm :: 11. nov 2010, 21:47

Arto :: 12. nov 2010, 02:27

Gemm :: 12. nov 2010, 13:05

Rokm :: 12. nov 2010, 13:34

Vredno ogleda ...

Forum » Programiranje »
[C++] OpenMP težave